打开网易新闻 查看更多图片

7月26日,智谱AI CEO张鹏,在智谱Open Day上宣布,AI生成视频模型清影(Ying)正式上线智谱清言,通过模型生成6秒短视频,仅需30秒时间,上线即日起所有C端用户,都能通过清影体验AI文生视频、图生视频。

打开网易新闻 查看更多图片

图源 | 智谱

智谱AI被媒体称为“大模型四小龙”之一,其动作往往也代表着行业的重要风向。事实上,不仅是智谱AI,国内一众头部企业都在下场研发AI视频大模型,文生视频的热度也居高不下,这个赛道的内卷程度肉眼可见。

但让人疑问的是,文生视频大模型真的实用吗?通过大模型工具真能帮助用户提高生产力吗?

“清影”支持文生视频、图生视频

据了解,用户通过视频模型清影,在输入文字后,可以选择想要生成的风格,包括卡通3D、黑白、油画、电影感等不同风格,此外,还可以搭配模型自带的音乐,为文生视频提供了极大便利。

除了支持文生视频,清影还具备图生视频功能,包括表情包梗图、广告制作、剧情创作、短视频创作等。

目前,清影可支持PC、APP、小程序等终端,人人可用且不限次数。其中,在小程序上,也将同步上线基于清影的“照片动起来”小程序,在用户上传照片后,可将照片灵动起来。

据张鹏介绍,清影底座的视频生成模型是CogVideoX,能融合文本、时间、空间三个维度,参考了Sora的算法设计,也是一个DiT架构,通过优化,CogVideoX相比前代(CogVideo)推理速度提升了6倍。

AI生成视频作为当下最具热度的竞争点,吸引了众多人工智能的参与,智谱AI作为人工智能赛道的明星企业,自然无法缺席,发布清影也恰是补短板的动作。

AI生成视频赛道加速内卷

无独有偶,此前7月19日,字节跳动团队在新加坡举办关于世界模型探索的AI技术菁英论坛活动,首次大范围公布文生图、类sora新视频等全新人工智能模型技术进展。据媒体报道,抖音、剪映等内部多个团队,也在研发AI视频模型应用,预计也将在近期公布。

值得注意的是,除了智谱AI、字节跳动以外,自OpenAI推出的AI生成式视频大模型Sora以来,国内众多头部企业都在进军AI生成视频模型领域。

比如此前不久,在世界人工智能大会上,快手“可灵”大模型爆火,网页版一经上线用户数量迅速超过了70万。

可以清晰看到,这个赛道正在加速内卷,在国外,有Runway的Gen系列、微软的Nuwa、Meta的Emu、谷歌的Phenaki/VideoPoet、CogVideo等,而在国内,快手、剪映、火山引擎等众多知名企业均已推出AI视频模型或工具。

AI生成视频,是不是“鸡肋”?

值得疑问的是,业内的确已推出了很多AI生成视频模型或工具,但关键是有实用性吗?能否真正地帮助用户提高生产力?恐怕没那么简单。

目前,国内的文生视频模型与国外还有一段距离,但是,即使以国外更先进的大模型Sora为例,其由文本生成的短视频也会出现众多错误,也会偶尔混淆物体的方向,场景缺乏连贯性,甚至会出现逻辑错误,或者与真实情形不符的情况。

也就是说,尽管AI大模型能生成几十秒的短视频,但并不能真正理解用户的本质需求,在生成视频后,依然需要用户辅助修改,这更像是一个“鸡肋”似的功能。

不过有意思的是,尽管AI视频模型的实用性不强,但国内一众企业依然乐此不疲地下场竞争,甚至越来越内卷。

尤其是对于人工智能企业而言,研发AI生成视频能到何种程度,有没有实用性,甚至能不能实现盈利虽然都是未知数,但AI生成视频的市场却不得不进入,这是影响未来竞争力的不可或缺的环节。

从这个角度看,对于AI生成视频赛道上的玩家们来说,要走的路还有很远,要烧的钱还有很多。当然,我们也期望国内玩家能推出真正的具有实用性的AI视频工具,助力打工人提高生产力。