更多精彩内容,请关注 《2022网易未来大会》专题报道

记者:普子胥

打开网易新闻 查看更多视频
胡志鹏:AIGC是通往元宇宙的方便法门吗?

12月19日-23日,2022网易未来大会盛大举行。2022网易未来大会全新升级为“未来周”,囊括三天的思想之夜和两天的峰会,包括思想之夜、创新力论坛、元宇宙论坛、内容力论坛、智美之夜F·F盛典。

12月22日下午元宇宙论坛上,网易高级副总裁、网易雷火事业群总裁胡志鹏发表了《AIGC是通往元宇宙的方便法门吗?》主题演讲。就AIGC的定义、发展、现阶段取得的成果,以及未来对元宇宙产业能够提供的支持,分享了自己看法。

“(AIGC)人工智能自动生成内容,和传统的PGC、UGC,专业用户生成内容不同,它是借助人工智能,并且强调自动化的自动属性。”胡志鹏指出,随着AIGC发展,该技术对人们于艺术创造、游戏人物刻画等方面,带来更多启发,于商业领域,也将为相关从事元宇宙的公司节省更多成本。

胡志鹏认为,虽然现在人们对于AIGC有着不同看法,甚至有所质疑。但面对新技术的发展,人们理应保持更多耐心与想象:“爱因斯坦曾经说过,若无某种大胆放肆的猜想,一般是不可能有知识的进展。我想面临AIGC给我们带来的令人叹为观止的创造力和非常多不可知性,我们应该多一点宽容和一些想象的空间。”

以下为胡志鹏演讲实录:

各位来宾下午好,我是网易2022未来大会元宇宙分论坛主题的演讲人,来自网易的胡志鹏。我演讲的题目是《AIGC是通往元宇宙的方便法门吗?》

刚刚有幸听了王院士激情澎湃的演讲,他也多次提到了AIGC,包括他提到了AIGC是Web3.0一个重要的核心技术,是未来元宇宙一个重要支撑的手段,所以,我感觉真的是今年大家很多观点是不谋而合的。

首先有必要说一下AIGC到底是什么。AIGC中文翻译就是:人工智能自动生成内容,和传统的PGC、UGC,专业用户生成内容不同,它是借助人工智能,并且强调自动化的自动属性。今年刚刚揭晓的Science年度十大科学突破里,它和韦伯望远镜一起获评十大科学突破。

这张图是《太空歌剧院》,是一个叫做Jason的艺术家,在今年8月美国科罗拉多州的一个艺术博览会上数字竞赛环节提交的作品,最终获得了竞赛的第一名。

大家意想不到的是,这个作品他用了一个“文生图”软件生成的,只是经过了少量的后期加工。这个消息放出来引起巨大争议,给大家带来冲击非常大。虽然这些年来AI技术飞速发展,大家都在猜测AI总有一天会替代掉人类非常多工作,很多人都会因此而失业或者转行,但大家认为在人类最具创意性的行业,包括艺术家的行业是最难被AI替代的。

然而随着这个奖项的揭晓,这个观点又重新被大家认识,重新开始了讨论。我自己关注AIGC比较久了,一个是出于个人兴趣,一个是工作需要,因为我是网易游戏AI的负责人。在《太空歌剧院》发表之前,5月份我做了一个实验,输入的关键词是齐白石风格的白猫与玫瑰,当时给了我这样一组图。要在图上找到一只猫和玫瑰还需要一点想象力的,就像经常去风景区,导游指着光秃秃岩壁说上面有8匹骏马,你去找。仅仅过了7个月,我再次用同样的关键词做了尝试,这次给的效果非常好了,我们可以看到非常完整成型的猫和玫瑰稀稀的画面,当然还有提升的空间,相信人类艺术家大部分会比它做得好,但这仅仅才七个月,七个月时间它的进步是非常快的。

为了这次大会,我用了另外一款图生文软件,给自己的头像做了定制化,提示的信息是在赛博朋克风格中的元宇宙技术男。我自己加了关键词:夜色、霓红灯,生成了左边这张图,看上去还可以。右边是生成的一段描述,描述一下这是怎样的场景,它给了很多词,怎样的街道,怎样的广告牌,怎样的空气,我就贴到图生文软件里,右边这张图感觉帅气很多。

简单看一看,通过这一个例子可以看出AIGC在今年飞速的发展,真的是有点像奇点到来的感觉。

今天的主题是Metaverse,元宇宙今年有点坎坷,起起伏伏。去年扎克伯格宣布整个公司全力投入在元宇宙,并且把公司名字改成Meta时,当时大家非常振奋的,觉得可能看到下一个时代的来临。但今年到目前为止,Meta这家公司股票已经跌去了2/3,扎克伯格这样一个行为也普遍受到大家的质疑,大家开始觉得元宇宙有点降温了。

另一方面,包括浙江省也通过了非常多扶持元宇宙的政策,其实非常多公司也开始真的摆脱概念炒作,脚踏实地做一些元宇宙真正的应用。

这个元宇宙是稻城亚丁,我今年在四川省甘孜州旅游推介会上推介了这样一款元宇宙应用,也是希望有更多人足不出户在疫情肆虐今天,在家里就能通过元宇宙云旅游方式去踏足这片美景。

为什么在这里把这个东西拿出来呢?如果有一天AIGC技术真的非常成熟了,我们用AIGC技术来重新制作这样一个元宇宙的一角,那会是怎样的流程?这是稻城亚丁非常著名的一个经典冲古寺,可以通过很多成熟的软件,包括开源的自动生成,可以直接省去很多工作量,降低了非常多成本。最后通过AI设计建筑、环境,可以给原画师提供非常多参考的可能性,帮助他们完善原画的过程。整个过程,我们也请公司专业的美术同事进行了测评,预计可以把这个效率提高到非常高,省下来50%的人力。

音乐这一块也是工作量非常大,需要艺术家高质量生成的作品。目前也有非常多AIGC生成音乐的软件,包括网易的天音,我们可以给它一些输入的信息,包括会说冲古寺,曲风希望它庄重,用自然区域的音乐变奏融合藏传佛教音乐元素。通过这些输入就可以启发音乐自动生成软件创造很多音乐小样,它们可能不会最终一步到位,成为我们的背景音乐,但一定会启发我们音乐创作者完善他的作品,尝试更多可能,最终呈现出大家都满意的作品。

网易天音目前也在实际运用中开始落地了。比如我们在百事可乐营销活动里,就用网易天音智能编曲选择风格,编辑合选,最后渲染出一首曲子,5分钟基本上就可以做出来。未来随着更多训练数据的加入,更多人工的调整和评测,这一块潜力还是非常大的。

当有了这样的场景和音乐、音效之后,我们就希望这个场景里有人,因为人才是整个世界的主宰,只有人才能让整个世界有呼吸感,充满活力,所以我们要加入人物。同样AIGC可以辅助我们制作这些人物,可以辅助产生原画的正视图,可以直接生成原画的三视图,可以交给自身的建模师进行建模贴图。之后我们需要给这些人物设计各种时装,利用AGC辅助生成,可以指定什么民族服装,什么季节穿的,它就可以给我们非常多的参考,指导原画师迅速生成原画的时装。告诉大家一个小秘密,我们美术师开始大规模利用AIGC做各种辅助工作,包括服装的生成,包括图标的生成等,可以直降40%。

我们可以和NPC谈一场恋爱,需要NPC具有人类思考的能力,要有自由交流的能力,语言的能力,动作的表现,面部表情等,所有这些东西如果在以往,需要大量的人工设定创造,现在通过AI技术可以做很多内容生成。当和她交流时传统技术无法实现的,只有通过AIGC产生对话内容才能去实现。

稻城亚丁元宇宙创作一共花费260余万,如果采用AIGC辅助可以把成本降低30%-40%。将来文字建模技术,如Dream Fusion、Magic3D、Get3D等成熟,成本会将一步降低。

技术真的是日新月异,想象不到的变化。未来用自然语言在游戏里创造元宇宙,可以让墙壁变成不同的风格,可以在墙壁上加入艺术家的一些涂鸦。看起来确实很魔幻,也这个就像阿西莫夫所说的:任何先进技术初看起来都和魔法无异。我相信AIGC随着技术的不断成熟,带来的想象空间也是无限的。

元宇宙理想是构建平行的虚拟世界,包括4个主要的要素:虚拟场景、虚拟角色、数字内容和虚拟交互。在这4个方面,AIGC都可以提供助力。比如虚拟场景和角色,AIGC可以改变传统的制作流程,提升效率、降低成本。数字内容方面显著降低数字创作的门槛,让更多人有机会参与到数字创作里,从而产生极大丰富的内容供给。在虚拟交互方面,AIGC能改变交互方式,构建更沉浸智能的元宇宙体验。

有了这样一系列结论,我们就自然而然会问到这个问题:AIGC作为生产力工具,可以成为通往元宇宙的方便法门吗?

关于这个问题不同人有不同的回答,并不是众口一词。对乐观主义者而言,这是一个比较好的例子。正如Tiktok发明了一种新的视频形式,并驱动了很多人加入创作一样,长期看来能够让更多人、更容易做出元宇宙工具,会把市场开放给新的创作者,并带来新的想法和玩法。

这个观点我还是比较认同的,回头来看,目前来说最具元宇宙特性的应用,包括林登实验室的《第二人生》也好,现在Roblox也好,《我的世界》也好,之所以有大量用户沉浸在其中,最关键的一点是把内容创作的能力赋于给里面不同的玩家。不同的玩家可以创建自己的世界,创造自己的应用,这是非常大的AIGC可以做到的点。

当然也有怀疑论者,最担心的是AI会抢走人类的饭碗,侵蚀人类的创造力。同时很多人对版权保护提出了质疑,如果这一块问题没有得到很好解决,可能未来关于AIGC一直会陷入版权诉讼纠纷里,导致任何想要以此作为下赌注的都会满盘皆输。当然也有一些资深的游戏设计师提出,AIGC目前能生成的就是一些大家不太关心的内容,因为大家不太关心,所以不太在乎它的质量,只要有就可以了,这样的观点也是引发我们思考的。

我也问了一下AI自己的回答:你认为AIGC是通向元宇宙的方便法门吗?一开始ChatGPT是拒绝的,我们也都知道,它不懂什么是AIGC,也不懂什么是元宇宙,我就耐心解释,我说AIGC是人工智能生成内容,元宇宙是Metaverse。接下来它就开始回答,这两者之间它看来没有什么联系,AIGC是一种技术,元宇宙是一种概念,元宇宙和AIGC之间的关系好像也不是那么强,ChatGPT还是比较谦虚的,对自己的超能力不太认可,或者它自己具备超能力,只是不想让我知道。

今年高德纳人工智能技术成熟度曲线,AIGC在生成AI这一块,正处于爬坡期,快要到顶峰。也就是说目前大家对它的预期是非常强的,但很有可能它会经历低谷,大家会觉得对它的预期太过强悍。我们面对它既不能过分乐观,也不能过分的强势。唯一能做的是保持足够的技术储备,每一天都去研究它,去接受新的突破点。

好比我们不知道洪水哪一天来临,就先把船造好。如果你现在不知道哪一天得了新冠的话,先把布洛芬备好差不多。到2022年底,我们可以看到整个环境现在是利好AIGC等新技术的,包括环境方面、政策方面、技术方面,我们都在向好的方向发展,我们也是希望利用这样的复合的环境推进国内的产业迈向中高端。

坦白说,我们国内还是处于落后的追赶地步,有些东西是被“卡脖子”的,所以我们需要构建自己的超大规模模型生态,网易平台还承担了省级尖兵项目“超大规模预训练模型云平台”的建设重任,其理想就是建立这样的云平台,并且开放出API接口,赋能下游更多的产业。

在AIGC这一块领域,我们也有相关的布局,我们有虚拟人,有网易瑶台虚拟会议的活动平台,有AIGC创作平台,还有ACE引擎,提升AI虚拟交互能力的引擎。这里我重点说一下ACE,ACE引擎从一开始我们做这个东西就是很注重从人类反馈中进行学习的,所以这个平台既是能够自动去做一些事情,同时也是不断收集玩家的标注反馈,去强化认知。这个平台会很快开放给大家,希望大家去尝试。

爱因斯坦曾经说过,若无某种大胆放肆的猜想,一般是不可能有知识的进展。我想面临AIGC给我们带来的令人叹为观止的创造力和非常多不可知性,我们可能更多给它多一点宽容和一些想象的空间。这样的话,我相信最终我们会引导它走向为人类服务,让人类生活变得更好,让元宇宙的明天变得更好的道路。

谢谢大家!