AI时代,无论你主不主动,都与你有关,欢迎来到AI变革
FORCE LINK AI创新巡展·上海站,火山引擎狠狠亮了一把家底:不仅带来了全新的视频生成模型Seedance 1.0 lite和视觉深度思考模型豆包1.5,还顺手把音乐模型也升级了。这波操作,目标很明确,打通企业从“干活”到“智能干活”的全过程,不只是提供模型,更是要把智能体工具玩出花样,把AI彻底装进业务流程里。
新出的Seedance 1.0 lite,主打一个轻盈快准,既能看文字变视频,也能把静图整活变动态,支持5秒、10秒两个时长,画质嘛,有480P和720P两档,刚好卡在“能看清又不卡”的黄金位置。
别看这模型体积不大,Seedance 1.0 lite堪称“轻骑兵”里的狠角色:画质直接冲到影视级别,生成速度更是跑得飞快,效果、效率、价格,三者之间居然做到了一个不落,完美踩在性价比的点上。
这模型最大的本事之一,就是听得懂“人话”还干得漂亮。你要她生成个金发卷发小姑娘,穿旗袍、带微笑、举杯敬酒,Seedance统统能懂。
不止人物细节把控得好,就连多个角色之间如何互动、怎么切镜头、情绪语气轻重这些细枝末节,它也拿捏得准准的。
豆包1.5这次可算是出尽了风头,在60场公开考核里拿了38个第一。别看它只用了20B的激活参数,轻装上阵,但多模态理解、视觉推理、界面操作这些难点,它全都能游刃有余地搞定。
这模型在“看片”方面特别拿手,不光能智能调节帧率,还能从时间线上精确找到你说的那一幕,配合向量搜索,就是一个AI剪辑助理。
至于那位“豆包音乐家”,这回也迎来了新技能解锁——不仅能唱英文歌了,还能看着视频编配BGM,氛围拿捏得死死的。一段画面配点节奏感十足的音乐,瞬间就能提升整个作品的档次,不管是广告、短剧还是Vlog,都能来点“氛围拉满”的背景声。
来看一看官方给出的视频和prompt:
prompt:荒凉的戈壁环境,镜头跟随一位驾驶哈雷摩托的男性,特写镜头,骑手的额头绑着土黄色的头巾,身着蓝色和银色条状装饰的皮质骑手服,露出狂野的笑容后,镜头突然向上摇,有一只秃鹫在上空盘旋。
prompt:旋转镜头,三只长得一模一样的猿猴围成一个圈,一个用手捂住眼睛,一个用手捂住耳朵,一个用手捂住嘴巴
prompt:手持镜头,画面微微抖动体现手持感,跟随在一只在玫瑰花园中散步的猫身侧
国漫视频:
来源官方影调细腻的超清画质
来源官方
S eedance 1.0 lite模型在视频生成质量方面实现了重大突破,达到了影视级别的视觉效果。作为豆包视频生成模型系列的小参数量版本,它在取得出色视频生成质量的同时,显著提升了生成速度,是兼顾效果与效率的性价比之选。
火山引擎方面也给了个定心丸:豆包以后还会继续练“内功”,一边降低使用成本,一边再压低响应延迟,目标就是让AI不再是“高冷天价货”,而是能跑进每个企业、用在每个场景的“数字劳模”。
使用地址:doubao-seedance-1.0-lite:https://www.volcengine.com/docs/82379/1553576

