要论2024年上半年的焦点,除了苹果Vision Pro的发布外,你可能很难找到第二个比Sora更加吸引普通人眼球的科技热点了。

在过去的两年时间里,我们共同见证了大模型和AIGC的高速发展,亲眼看着大语言模型从语意不通到轻松解决逻辑思维难题,见证AI绘画从手都画不好的程度发展到足以以假乱真模仿大部分艺术家的水平,即便是早已熟悉的TTS语音合成技术,也在这股浪潮之下一举来到了「拟人」水平。

但是AIGC视频和文字、绘画和语言截然不同,它可以说是上述三个能力的有机结合,也是最能给普通人带来直观视听感受的媒体介质。Sora的到来,不仅预示着一场新的技术风暴,更预示着文生视频时代正悄然来临。

打开网易新闻 查看更多图片

(图源:魔珐有言)

今年3月,3D虚拟人头部厂商魔珐科技面向公众推出了魔珐「有言」AIGC视频平台。不同于Sora等2D视频生成路线,魔珐「有言」依托魔珐3D内容的全栈AIGC技术,让3D虚拟人直接进入3D空间,结合用户脚本完成3D视频的实时渲染生成,轻轻松松即可产出一部酷炫的3D视频。

等一下,这是不是说,只要学会咋用这个工具,我也能自己做视频了?

进入数字世界,从未如此简单

放在往年,我们或许很难想象,为了做带货直播,京东居然连刘强东都能请出来。

但就在4月15日,京东官方宣布创始人、董事局主席刘强东将化身为「AI数字人」采销东哥在京东App直播。次日晚间,以刘强东为原型的AI数字人在京东家电家居、京东超市采销直播间先后亮相,成功吸引了超2000w人观看,整体订单量破十万,宣传效果异常出色。

(图源:京东)

事实上,采销东哥的存在并不是什么个例,东哥数字人在热度高的同时,也遭到一些用户吐槽,人物表现的体验感并没有那么好。今天,由技术制造的「数字人」已然不是稀有事物。

如今,有不少企业家的「分身」广泛活跃在各家企业的直播间、直播切片账号里,他们似乎已经成为自家品牌真正的第一网红。相较于真实的企业家,数字人成本低、复制快、24小时待机,还能延续品牌流量,确实是一单省时省力的好生意。

但是想要拥有属于自己的数字人,却不是一件容易的事情。目前市面上的数字人服务可谓鱼龙混杂,价格相对便宜的2D数字人,最终呈现出来的成果远远不及预期,一个专业级别的定制3D虚拟人,其投入可能高达数十万元,这无疑增加了创作的经济压力,让中小型企业高管望而却步。

打开网易新闻 查看更多图片

(图源:常见2D数字人定价)

如果,我是说如果,魔珐「有言」能解决这个问题呢?

事实上,魔珐「有言」平台提供了数千种丰富多样的3D人物,不再需要花费高额成本打造3D虚拟人,而是以丰富的模板库来给用户选择。

(图源:雷科技)

我们就以虚构的雷米科技CEO 应时作为例子,在魔珐「有言」上,用户不仅能够通过细致的筛选项来挑选心仪的人物模型,只要输入视频文案,魔珐「有言」就帮你生成一段像模像样的数字人自我介绍视频。

(图源:雷科技)

最终成片大概是这样:

打开网易新闻 查看更多图片

(视频由魔珐「有言」生成)

怎么样,感觉还不错吧。

在这段视频里,你所看到的每一个场景、灯光、镜头,甚至是3D虚拟人的每一个动作表情全部都是由AIGC完成的,你甚至还可以根据需求调整动作、手势,甚至调整场景中的灯光和背景,实现视频内容的全面自定义。

(图源:雷科技)

按照魔珐科技官方的说法,AIGC技术未来还能够为视频行业提供更多定制化的创新产品,魔珐「有言」计划在年中的更新中,将实现虚拟人的AIGC, 用户只需要上传照片,就能直接生成3D虚拟人。

在我看来,魔珐「有言」最大的优势,便在于3D内容的可控性。它不仅可以实现“3D虚拟人动作、表情、以及视频镜头、灯光的AIGC化”,更是可以让用户根据自己的需求去自由修改内容,再基于实时引擎输出视频。

作为对比,「HeyGen」这类2D数字人,只能在预先录制的视频上,对角色的唇形进行局部修改,不但无法满足用户的自定义需求,这种固定的姿势的AI视频,只能带来平面的视觉感受。由于视频来源全部都录制的影像,动作重复度高,由于其有限的AIGC能力,无法生成新的动画。严重缺乏深度的立体感和动态的互动体验。

(视频由「HeyGen」生成)

灵活性和自由度,使得魔珐「有言」平台成为3D虚拟人内容创作的理想选择。

来,开一场发布会吧!

要说这几天最热门的新闻,那还得是华为Pura新品牌的亮相。

为了给新品做预热,华为选择通过5天召开5场“接力式发布会”的全新玩法来吸引消费者眼球,这种前所未有的营销玩法确实成功赚足了市场的眼球,也让华为P系列的改名变得更加引人注目。

(图源:雷科技)

对于消费市场取向的企业而言,发布会往往是新品面向市场进行推介的最为重要的一个关口,这一环节的出彩与否,在某种程度上而言直接决定着产品今后在市场中的销量表现,因此发布会对厂商的重要性不言而喻。

然而,发布会开销大,从经济成本看,每天开发布会,每款产品开发布会,没有企业有这个财力物力;而且发布会的筹备、彩排、制作、剪辑也需要很多人手,即便是大企业很难持续提高这样的人力支持。

问题来了,我们能不能用魔珐「有言」打造一场线上产品发布会呢?

那么我们继续以雷米科技为主角,这次的主题就是制作周边产品「Just Way充电宝」的发布会。

直接从新建作品开始,我们不需要拍摄任何素材,因为在魔珐「有言」这里有很多不同种类的3D场景,既然是数码科技的发布会,那我们首先选一个「冷调科技风发布会舞台」。

打开网易新闻 查看更多图片

(图源:雷科技)

然后,把我们上面选出来的创始人兼CEO的形象放到这个3D舞台里。

(图源:雷科技)

除了系统里自带的内容,我们也可以添加图片或者视频素材,这些素材会出现在AI生成的视频中,起到信息展示的作用,比如这里我们就把刚刚制作好的发布会PPT放上去。

(图源:雷科技)

接下来,输入一些文案和配置相应风格的音色,所有内容都配置完成后,点击一键生成,等个十分钟左右,就能实时预览整个视频了。

(图源:雷科技)

如果还想对镜头进行微调,在一键生成视频后,我们还可以对视频做一些优化,简简单单就能实现发布会的镜头切换。

(图源:雷科技)

在调整完镜头,可以点击视频下方的播放按钮预览一下,预览没问题后,我们点击右上角的渲染视频。

即便只是初步渲染,但魔珐「有言」给出的作品已经足够出色,3D虚拟人不但会根据文案做出各种动作反应,同时AI生成的镜头也能抓住重点,全面展现产品的卖点和定价,效果出乎意料的准确。

(图源:雷科技)

接下来,我们还能对初步渲染完成后的视频做一些包装,加入各种音乐,音效,字幕模板,文字模板,贴纸,片头,片尾,在魔珐「有言」里就能实现一站式的视频生成、视频剪辑体验。

最终成片是这样的,怎么样,还不错吧。

(视频由魔珐「有言」生成)

作为对比,本人利用目前很流行的Sora类2D文生视频应用,对「发布会」关键词进行了三次视频生成,最终生成视频的时长我们姑且不论,但是三个视频中的内容可谓是截然不同,我在关键词中加入的信息更是没有被表达出来。

(视频由「Pixverse」生成)

事实上,这也是这类2D文生视频应用的最大问题。仅依据寥寥数个提示词输出的视频,自然只能框选在一个大概的范围里,视频内容是随机不可控的即便你能不断完成提示词去控制画面内容,但当用户想去生成内容信息密度高、又要求精准表达的视频时,这类应用是基本不可能做到。

相反,只要输入文字和图片等素材,即可一键生成3D内容无需真人出镜,无需筹划场地,可以自由修改,内容精准可控,后期一站剪辑,魔珐「有言」的出现确实有种颠覆传统流程的味道。

不仅如此,作为科技类公司,采用3D虚拟人制作发布会,也能塑造一个紧跟科技发展趋势和时下话题热点的公司形象,可以体现公司作为科技类公司的领先地位,并吸引对技术创新有感兴趣的潜在客户群体。

不懂视频剪辑,也能做到日更?

如今这个时代,谁都能做自媒体,但绝非每家自媒体都能做好视频。

现在无疑是一个短视频的时代,根据《中国网络视听发展研究报告(2023)》 显示,短视频成吸引网民“触网”的首要应用,近四分之一新网民因短视频触网,短视频正在改变互联网用户的浏览和消费习惯,成为现代人“杀时间”的第一大利器,甚至有人直言:“短视频是这个时代的文本内容”,其流量价值不言而喻。

问题是,即便对于我们这种较大型的数码自媒体来说,想要实现短视频日更依然不是一件容易的事情。要知道,写文章的编辑普遍不愿出镜,愿意出镜的主播那又不好找,文本转视频的脚本需要时间,还得搭建演播厅、布置场景和灯光,还有摄像摄影及后期剪辑制作等一系列复杂的工作流程。

(图源:Veer.com)

这不愿出镜的小编里,就包括了小雷本人,对视频一窍不通和对出镜感到尴尬,这两点让我和短视频这种内容介质几乎无缘。

所以这一回,我决定用自己的文章来亲测一下,看看要用魔珐「有言」打造一个牛掰的AI短视频,到底需要什么样的姿势。

事实上,数码资讯短视频的制作流程,要比发布会这种大型项目简单不少。

选个横屏小舞台模板,挑一个漂亮的体育系小姐姐3D虚拟人,再导入资讯所需的素材。

(图源:雷科技)

接下来只要输入短视频脚本,静候一小会,一个数码资讯短视频就做好了。

(视频由魔珐「有言」生成)

从最终的效果来看,3D虚拟人的动作和神情自然,镜头自然变化也很适合资讯号做内容展示,整体观感不仅超越了目前常见的2D数字人短视频,甚至可以超越一部分常规主播出镜的短视频内容,而且制作起来还要省心不少。

要知道,目前市面上大部分的专业视频制作工具都集中在视频剪辑以及后期包装的部分,对专业能力要求比较高。AE、PR这类应用需要极高的专业素质和时间打磨,即便是相当易上手的UGC创作工具,也仅仅是在后期包装上得到AI赋能,依然没有解决拍摄环节存在的问题。

(图源:剪映)

而魔珐「有言」不但为我提供了一个不用出镜的机会,其3D场景的丰富性,快速生成、即时修改的特性,可以作为追逐热点新闻内容的短视频生成利器;海量的高质量后期素材库,更是让不会AE、PR、MAYA的我,也能自食其力做出专业品质的3D短视频内容。

如今,AIGC浪潮早已涌向国内短视频平台,甚至在轻量级内容生产上已经表现出一定「掌控力」。

据公开信息显示,某知名电视台的短视频业务的标题、封面、配音、配乐等内容目前已经均由AI自动化生产,而财联社更是通过魔珐有言,直接打造了一档全新的高品质视频栏目——《ETF大头条》,高效且高素质创作出专业水准的新闻播报视频。

在我看来,对自媒体来说,目前魔珐「有言」的核心价值不仅仅在于效率上的提升,它还有效解决了不想出镜怎么做短视频以及不会视频编辑怎么做短视频的问题,几乎是将短视频的产出门槛降至最低。

让枯燥的文字内容,变成生动的视频讲解,或许人人都能做博主的时代真的要到来了。

是时候让数字人帮你带货了

为了应对带货直播的冲击,如今传统电商平台也在积极求变。

根据最新发布的《中国网络视听发展研究报告(2024)》显示,71.2%的受访用户因为看短视频和直播进行网上购物,如今优秀的视频创作者俨然已经成为推动电商生态繁荣的重要力量,而内容消费无疑正成为各大平台、商家争夺的关键赛道。

对于大型店家来说,遇到这种情况其实很简单,只要花钱跟进就行了。

但是对于中小店家来说,到底怎么跟?应该找谁跟?预期投多少?即便确定要做,外面找来的头部主播收费不是一般的高昂,自己培养起来的跟店主播又有做大跑路的风险,每一个问题都值得他们好好考虑。

事实上,魔珐「有言」不仅能够用于企业信息展示,它们还致力于将视频生成技术与电商结合,为淘宝天猫商家提供更智能的视频创作工具,让视频生成技术在更真实的商业场景中加速落地。

正好,魔珐「有言」最近新上线了AI脚本功能,我们赶紧来尝试一下。

首先,选择场景模式,选择产品类目「3C数码家电/3C数码配件」,然后输入我们的产品名称、品牌名称和产品卖点,最后简单控制一下脚本长度,免得短视频里塞不下。

(图源:雷科技)

你还别说,魔珐「有言」端出来的文本确实挺有意思的,基于大量产品素材的电商垂类文生文大模型,对产品卖点进行抽取、分类整理与标签化处理,整合出了这样一份有模有样的带货脚本。

(图源:雷科技)

当然,为了使脚本更加人性化,适当的微调是不可或缺的。

(图源:雷科技)

脚本完成了,接着我们按照惯例选择舞台、选择角色。

(图源:雷科技)

只需要简单几步操作,将种草文案和介绍图片导入一下,魔珐「有言」就可以通过AI让数字人配合着介绍起来,抑扬顿挫的数字人主播语音十分上头,实际的场景还原和人物表情、动作,都颇为接近专业3D动画师水准。

(视频由魔珐「有言」生成)

目前中小店家常用的TTS搭配AI图片的做法,配音不够自然,而且很多只有简单的男女音色选项,这些开放平台在MOS(Mean Opinion Score)语音可懂度测试中普遍只能得到3.5-4分的分数。

作为对比,魔珐「有言」TTS能力的MOS评分高达4.5分,这意味着其在语音清晰度、语音自然度、语音流畅度和语音情感表达上均领先于业界。而且魔珐「有言」在不同场景有不同的音色选择,电商场景选电商音色/ 培训场景选自然讲解音色/开发布会选主播音色等,这也是视频代入感更出色的原因之一。

以上这些视频生成功能,目前已在魔珐「有言」平台广泛应用,每个商家都可以在「行业推荐」-「快消」里面查看官方提供的素材模板,然后一键将自家的商品介绍转化为商品视频。

(图源:雷科技)

是该告别枯燥的图文介绍,增添视频内容以保持用户粘性,让产品说明自己讲话了。

可靠性,才是AIGC视频落地的决定性因素

总结一下,在我看来,魔珐「有言」生成的视频在内容稳定性、动作平滑度、最终时长、内容和素材展示等方面都更具备使用价值。尽管目前还有一些功能上的缺失,但是在生产力工具的前提下,对比那些生成质量要求不高、以非现实拍摄为主的2D AI视频内容,其实用性高出了不止一个台阶。

目前看来,很多国内厂商都在试图成为中国的Sora。

(图源:Sora)

它们遵循的技术线路很清晰,根据提示词进行2D影像生成,仅输入图片也能得到相关影像,生成的影像效果脑洞大开且无法预测,本质上更像是给普通人的一种新玩具。

但是在我看来,对于工具类的产品,产品力的一个核心体现在于:能否成为生产力工具。

就目前市面上这些2D视频工具,最大的特征就是「炫酷」。因为除了你输入的关键词外,没有人能保证应用最终会生成怎样的效果,而且除了Sora还能够生成60秒以上的视频,很多产品甚至还停留在「动态图片」的状态,与视频可谓相差甚远。

在我看来,这些内容仍处于技术探索期,可控性、逼真度、连贯性都值得商榷,实际作用不多,更适合UGC、PUGC的视频创作模式,未来成熟后可能会比较适合广告/宣传片等创意行业。

(图源:魔珐有言)

作为对比,魔珐「有言」的特点在上面的测试中我基本有做展示。在稳定的3D引擎基础上,魔珐「有言」基本不会在视频成片中出现类似于2D视频工具的问题,如实反映用户脚本的语音合成、丰富的后期剪辑与渲染功能,更是可以在最大程度上保证生成视频的可用性,避免后期重复劳作。

从中小企业高管、企业内部培训、电商内容赋能,乃至于我这种对视频一窍不通的自媒体编辑,都能够从中受益。

在我看来,所谓魔珐「有言」,其含义便是言之有物。

它不仅仅是一款AIGC视频工具,更是一个革命性的创作平台,它通过技术创新重新定义了视频制作的流程和质量,有效降低了视频内容制作的高门槛,为内容创作者和广告制作人提供了强大的工具,帮助他们在竞争愈发激烈的市场中脱颖而出。

直接生成3D视频的特性,更是使其可以无缝接入到VR/AR的世界中,有机会成为填补元宇宙内容不足的杀手级应用。

随着技术的持续进步和用户基础的扩展,智能化的生产方式正在重塑企业和媒体的生产流程,而魔珐「有言」的持续发展,无疑将继续引领虚拟人视频创作领域的发展潮流,带领着我们加速走上通往元宇宙的道路。