Sora的首次预告是在2月16日,当时OpenAI提供了数十个演示视频,展示了一个令人惊叹的未来:任何人都可以通过在计算机程序中输入简单的文本提示来制作高质量的短片。

然而,在随后的300天内,Sora始终停留在预告阶段,未能面世。而在这期间,包括Meta、谷歌和亚马逊在内的几家大型科技公司都展示了自己的视频生成模型,国内的可灵和海螺也在海外大放异彩,成为外网一度讨论最热烈的视频生成模型。

这次OpenAI的正式版Sora终于上线了,也引发了与其他同类应用的激烈对比。

Sora,4美元生成5秒1080P视频

采用最新发布的Sora Turbo,用户可以通过文字、图像或其他视频素材,生成长达20秒的视频。目前,该工具已在美国和其他部分市场面向ChatGPT Plus和Pro用户开放。

打开网易新闻 查看更多图片

该应用支持生成最高1080p分辨率的视频,最长可达20秒,用户可以通过文本或图像输入生成内容。Sora的界面设计也经过优化,用户可以轻松修改、扩展和循环生成的视频。

打开网易新闻 查看更多图片

用户完全模拟了一个玫瑰从花蕾绽放到盛开的延时视频

然而,尽管Sora在生成视频的质量上表现出色,但也存在一些明显的不足。例如,用户在使用过程中发现,Sora在理解复杂提示方面仍显不足,如人物性别错误或画面细节缺失。也有用户反馈称,Sora对物理规律的理解并不够好,仍会出现人的手部不自然、文字乱码、动物跑着跑着就飞起来等情况。

打开网易新闻 查看更多图片

知名科技博主MKBHD也放出了一段模拟真实新闻的视频。除了字幕有一点乱码以外,其他和真实新闻场景看上去没有什么区别。

针对之前一直被提及的安全问题,OpenAI表示,使用Sora生成的视频将带有可见的水印和C2PA元数据,以表明它们是使用AI制作的。

此外,Sora的生成速度在高峰期也受到影响,导致用户体验不佳

打开网易新闻 查看更多图片

公司CEO山姆·奥尔特曼(Sam Altman)表示:“我们严重低估了Sora的需求,要让每个人都能访问还需要一段时间。”

AI视频生成工具哪家强

在Sora发布后,市场上其他视频生成工具如海螺AI、Runway、Veo 2等也开始受到关注。

打开网易新闻 查看更多图片

Sora 发布当天就迫不及待拉了个横评,外网把 Sora 和 HailuoAI(海螺 AI 海外版) 对比了一波。

知名工具包括:
国内:即梦AI、智谱清影、可灵AI、海螺、Vidu等
国外:Runway、Pika、Stable Video、Luma Dream Machine等

以下排名不分先后

Sora

打开网易新闻 查看更多图片

提供在付费ChatGPT账户中,支持生成最高1080p分辨率、最长20秒的视频,具有替换、删除或新增元素、重新剪辑、扩展及合并视频等功能。

海螺AI

打开网易新闻 查看更多图片

国内“AI六小龙”之一MiniMax公司研发,国内可使用。提供免费试用,新用户注册即获1000积分,每30积分可生成一个6秒720p分辨率视频,支持并行生成3个视频。

据说,海螺的AI视频已经在海外火上天了。

打开网易新闻 查看更多图片

比如经典的meme“男友回头看美女”...这个是不是大家都看过?

打开网易新闻 查看更多图片

很多老外反复提到海螺的“real emotion”,觉得AI视频里人物的情感非常真实。

Runway

打开网易新闻 查看更多图片

最高会员等级可支持不限量出视频,对高频用户、企业用户友好,在生成高保真度视频方面表现出色。提供广泛的创意控制,允许调整和细化输出,特别是在细节的处理上也很出色。

可灵:

打开网易新闻 查看更多图片

快手AI团队自研的视频生成大模型。以3D时空联合注意力机制和视频长度与质量为特色,动作看起来会更加流畅一些。

另外,支持首尾帧,支持长达3分钟的视频生成,技术维度上表现优秀,支持生成长达2分钟、分辨率高达1080p的视频。比较可惜的是,免费额度每天只能生成6次5秒钟视频。

Vidu

打开网易新闻 查看更多图片

北京生数科技与清华大学联合开发的视频生成大模型。免费版每月提供80积分,会员最低19.99美金/月起,能根据文本或图像提示生成高质量视频内容,最长16秒1080P视频。二次元表现目前最佳。

打开网易新闻 查看更多图片

Vidu的“主体参照”功能非常实用,只需上传一张图片,Vidu就能保持主体在整个视频中的一致性。

顺便说一下,相比火遍小红书的 AI 视频神器Pika,Vidu更早地实现了「多图参考」的功能。更拿捏用户的是,有免费体验。

但是在功能上,Vidu 有一点不如 Pika——最多只能上传三张图片。

Veo 2

打开网易新闻 查看更多图片

美国谷歌旗下的“深层思维”公司推出。需要申请试用,支持生成最高4K分辨率、最长8秒的视频。对物理学的理解及遵循详细指令的能力,能够高度精确地捕捉运动。

打开网易新闻 查看更多图片

稳定到起飞~

做到这种和主画面保持强一致性的摇镜头,其实非常难,虽然仪表盘上的字不完美,但是也基本确保了镜头移动时画面中的物体位置和运动协调一致。

即梦:

字节(剪映)旗下产品。每天送80个积分点,会员最低79元/月起,支持首尾帧,支持运镜控制。

打开网易新闻 查看更多图片

在视频 S2.0 Pro 模型下,官方提到有非常好的首帧一致性,可以保持与用户输入图的一致性、色彩等细节还原。

Pixverse:

打开网易新闻 查看更多图片

来自国内AI视频公司爱诗科技。目前免费,用户每天可以获得50积分,初始可以获得200分积分。可支持连续镜头,最多支持5段视频,保持一致性支持魔术笔刷。

打开网易新闻 查看更多图片

打开网易新闻 查看更多图片

结论

总的来看,Sora的发布为AI视频生成领域带来了新的活力,但与竞争对手相比,在稳定性和对复杂提示的理解上仍需加强。未来,如何提升用户体验和生成质量,将是其面临的重要挑战。

打开网易新闻 查看更多图片