文 | 虞景霖
编辑 | 邓咏仪
横空出世的Sora,以其令人印象深刻的视频效果给世界带来震撼,但也暴露出了一些局限性。
一个突出的问题是,Sora可以一次性生成长达60s的视频,缺点是无法保证多次生成片段间的连贯性。
以OpenAI官网展示出的Shy Kids的作品《air head》为例,首先,特定场景中包含了一些不必要的元素,如气球上意外出现的人脸图案。
其次,在不同片段之间,同一物体的属性(如气球的颜色和类型)出现了不一致的变化,影响了视频的连贯性和叙事流畅度。而模型还可能产生一些冗余信息,如在气球系绳部位额外生成绳索。
来源:换境Studio
这些问题表明,Sora在生成内容可控性上存在不足,影响了视频的叙事逻辑和连贯性。
「换境Studio」正是希望解决这些问题。创始人认为,Sora等视频生成工具拓展了创作边界,展示了生产大量优质内容生成的可能性,进而带动下游产业工具的转型。换句话说,类Sora模型重塑了视频内容生态行业,生产链条将被重新定义为原始素材的智能化生产和精细化后期处理两大核心阶段。由类Sora等生成工具完成素材生产,换境Studio完成精细化后期处理。
来源:换境Studio
谈及「换境Studio」的成立背景,创始人这样告诉36氪:“目前,市面上大部分视频编辑产品操作门槛较高,尽管官方提供了教程,但相对简单,创作者想要熟练使用仍需自行摸索。”
2023年年初,团队开始构思推出一款简单易用的视频特效制作软件,并在半年后完成技术产品化路线规划,同年10月获得由云天使基金投资的的300万元种子轮融资。
以人物置换为例,换境Studio首先对用户上传的素材进行解析,提取其中的人物运动、相机轨迹以及3D场景重建,从而实现类似图层的视频元素分离。
这种控制不同于一般的视频生成技术,而是在3D空间上对视频中元素进行参数级控制,以保证视频片段的内容和逻辑连贯性。
来源:换境Studio
在调色方面,「换境Studio」实现了自动环境光匹配,通过换境Studio的编辑器,用户可以轻松选择视频中的任何角色,借助AI技术实现人物的自动识别、跟踪、去除以及背景填充,免去了大量重复性的手工操作,提高视频二次创作的效率,让人们可以更加专注于创意性的工作。
视频创作者是换境Studio主要面向的群体。团队表示,换境Studio的典型目标用户,将是YouTube、抖音和B站等平台上那些拥有一定创作能力和经验的C端用户,以及小型B端客户。