如果说1995年的《玩具总动员》揭开了人类电影与计算机结合的序章,那么这20多年来,电影工业与计算技术越发紧密的结合,就是其发展的主旋律。
2020年,这股浪潮达到高峰,两位皮克斯公司的高管,捧回了计算机界最高奖“图灵奖”,也强化了美国作为计算机视效领域创新策源地的地位。
而中国的相关产业,就像野草,虽然每个个体的体量还不够大,但如同春风过后的草原,生机勃勃,蕴含着无比强大的生命力。
更让我们振奋的是,而今,这茫茫的野草丛后,多了一双凝视着市场的双眸。依稀看去,草叶背后,那是一只雄狮的身影。
——导语
01
图灵奖和奥斯卡奖
曾经有位中国的3D动画从业者告诉我,中国的计算机视效以及连带的电影、元宇宙、3D游戏等领域,永远无法超过美国。
他的论据是,美国的相关领域已经进入终局模式,呈现出极高的成熟度和集中度——在当今世界,在动画和视效领域,没有任何一家公司的研究实力能够超过迪斯尼。而迪斯尼总共有5个主要的研究中心:皮克斯、工业光魔、迪士尼苏黎世研究中心、迪士尼动画和卡耐基梅隆大学实验室,这五大研究中心的成果都是共享的,而且它们之间还有赛马机制,这个庞大的体系是很难短期被超越的。
如果说这五大中心就是压着我们的五指山,那并不为过。
仅仅就说其中之一的皮克斯,这家当年乔布斯仅用1000万美元收购的公司,所制作的动画长片已经赢得了包括16个奥斯卡奖、10座金球奖、11次格莱美奖在内的众多奖项。
而到了2020年的3月18日,国际计算机协会(ACM)宣布了一个惊人的消息——将素有“计算机界诺贝尔奖”之称的图灵奖荣誉授予两位科学家,他们分别是纽约理工学院计算机图形学实验室的主管艾德·卡特姆和斯坦福大学的教授帕特里克·汉拉罕,也分别是皮克斯公司的联合创始人和高管。
科技和电影的联姻,并不是科学怪人的一时兴起。相反,它变成了如今电影工业的极为重要的一部分——如今,在全球市场价值数千亿美元的电影工业中,3D动画影片已成为最受人们欢迎的类型之一。
而美国在这个领域占据绝对的霸主地位。
但是,今年推出的《雄狮少年2》,让我看到巨头的技术文化统治力的铁幕,似乎也出现了一条松动的裂痕。
这条裂痕,就是《雄狮少年2》这样具有世界水平的作品所打开的——从技术层面、从效果层面,我们也有了世界级的作品。
更重要的,这种世界级作品的背后,不是巧合、也不是幸运,而是中国实打实的硬实力的提升——那就是中国在数字化、智能时代所取得的,在云计算、人工智能等技术上的进步。
以及,在中国庞大的市场、用户规模之上不断打磨和提升的相关领域的成熟度和竞争力。
的确,中国的相关行业,从整体上还与“五座大山”难以正面对撼,存在行业起步晚、发展分散、人才匮乏的现状。在企业规模方面,中小企业众多,但“大家伙”很少;从行业发展来说,也尚未形成统一的行业标准,整体上还处于行业发展的较早期。
而《雄狮少年2》的诞生,似乎将改变以上的这个结论,这部高水平作品的出现,是中国在电影工业上特别是3D领域的最新成果之一,更重要的是,其背后整个技术供应链的完善性和赋能的便利性,为高水平国漫制造“打了样”,同时也提供了广阔的想象空间。
它不仅给中国的电影工业带来了新的曙光,甚至,它还照见了中国文化泛舟海外、走向全球的前路。
雄狮,这一次真的醒了。
02
论技术,我们有发言权了
《雄狮少年2》,讲的是一个舞狮少年不断的转益多师、勤奋学习传统武术,又和现代搏击相结合,经过不屈不挠的努力,最终战胜强大的终极对手,屹立在擂台中央的故事。
怎么看,这个故事都像是国漫崛起的一个隐喻。
今天的国漫,还是那个少年,热血但还稚嫩;但他的心里住着一只雄狮,正是因为有了这颗大心脏的勃勃脉动,少年终于成了英雄。
回到现实中来,如果你问我,中国的计算机视效产业能否赶超,我觉得至少可以回答一句话——如果计算机视效领域的核心竞争力是软件和算力,那么我们的基础条件已经有了很好的支撑作用。
我们先谈基础设施,也就是算力层面的突破。
以《玩具总动员》为例,其IT投入在当时看是惊人的。光是影片的渲染,就动用了117台电脑全天24小时不停歇地工作。而根据当时的技术复杂程度来看,一分钟的内容有24帧,而每帧的渲染需要大概45分钟到30小时不等的时间,平均下来一帧是1800分钟,也就是6小时。
其整个工作系统,则由87台双CPU和30台4CPU的Sparc工作站组成,还有一台Sparc1000服务器(最多支持8个CPU)。
换言之,该片一共使用了302个处理器不停不歇的工作。如果按制作周期2年来计算,其渲染用了520万个核小时。
然而,《雄狮少年2》的渲染达到了4亿核小时,是前者的76倍有余。
这里需要略解释一下,所谓的“核小时”就是core hours,它等于你使用的处理器核数乘以实际工作的时间数。比如,你使用100台8路CPU的服务器工作100小时,那你的核小时就是8万。
华为云在乌兰察布的数据服务中心,为赞奇科技的“渲云”提供了数百万核海量规模的渲染专属资源池,并调动全国3个数据中心作为算力支撑,协调超30000台机器并发,并发核数超50万核,制作方得以用“万核渲一图”的实力,让影片在最短时间集中完成最高质量的成片。
当然,由于2部影片的制作间隔几乎达到30年,所以单以“核小时”和机群数量来比较,意义不大。
所以我们应该从整体评估的,是计算机视效行业背后的产业规模体量的竞争力。
《中国互联网发展报告2024》显示,30年来,中国信息领域核心技术即产业体系快速发展,建成了规模巨大、技术先进、性能优越的信息基础设施。特别是算力基础设施的建设步伐加快,算力总规模仅次于美国,位居世界第二。
所以说,如果算力是这个赛道成功的唯二要素,那中国,就是全球唯一可以与美国在算力规模上掰手腕的国家,可谓舍我其谁。
在庞大的算力和日益精进的技术的加持下,《雄狮少年2》的拟真还原度达到了惊人的水平,和历史名作相比,有了质的飞跃。例如,比如在一些美国动漫大片的场景里,早期只有6-7个光源;而今天的国漫会加载200-300种不同的光源,从而形成无以伦比的拟真度。
由于渲染的质量要求高了上百倍,我们可以发现,在少数特别效果的帧数渲染中,单帧的实际耗时之比30年前相差似乎不太大,但如果就全片而言,《雄狮少年2》的单帧渲染时间和成本都具有巨大的优越性。
例如,渲染是华为云的一个典型场景。华为云为其提供了多种规格计算实例,全系1:1物理绑核,满足单集群上万台机器并发渲染。一部90分钟的3D电影原本需要六个月的渲染任务,如今只需两周就能完成,效率提升12倍!
这至少说明,国漫赶超的科技支撑力,我们已经具备。
更方便的是其应用形态——如果在今天,任何一家企业希望完成如此规模的渲染,不用购买一台服务器,而只需要购买核小时数,这使得其投入的刚性成本大幅度下降,而在弹性、灵活性上优势突出。
也就是说,如今任何一部国漫作品,只要有一颗雄心,都可以得到世界一流的算力加持,通过类似于华为云这种先进的云底座,同时可以调动上百万颗CPU核参与任务。
如果说我们过去打的是规模战、体量战,那如今我们也可以基于自主实力开打科技战,这就是中国的进步。
同样,在和算力同样至关重要的存储性能方面,华为云这样的企业,也拥有了全栈自研的底层技术。
作为中国最早底层自研企业级存储技术的企业之一,华为云在存储技术方面有丰富的产品线。以较常用的EVS云硬盘(Elastic Volume Service, EVS)这种形式中,华为的存储技术可以为云服务器提供高可靠、高性能、规格丰富并且可弹性扩展的块存储服务,可满足不同场景的业务需求。
而随着华为云的EVS存储服务推出自研的Lazyloading技术,已经能够实现“秒级”发放虚拟机。以 100G 系统盘的虚拟机为例,EVS 能在 3 分钟内发放 1000 台虚拟机。
IO性能(数据吞吐能力)是存储的另一个硬标准,而渲染任务对IO能力的需求尤其突出。
为此,华为云针对渲染业务的IO读写模型进行了针对性优化,不但能够同时支持CIFS/NFS两种主流业务协议,单个SFSTurbo集群更能够达到最大40GB读写带宽和150 万+ IOPS的读写性能,这对于分布式存储来说是一个很高的标准。特别对于密集读/密集写的渲染过程,这些指标让数据加载、处理以及中途建立检查点的过程都非常流畅,减少了大量的时间等待。
但我想说的,不是存储技术本身,而是产业发展倒逼了中国相关技术方面的发展。
决定一个国家的存储水平的,首先是对存储能力的需求。
目前,中国已经是全球唯二的每年数据创造、采集和复制总数超过全球总量25%的国家,并将在2030年成为全球第一。从宏观角度上说,它体现了中国数字化发展的巨大进步;而从微观层面来说,传统的存储成本、存储技术、IO能力等都在遭遇沉重的压力和挑战,而华为云在存力方面的进步,为行业的发展提供了重要的启示——那就是一定要有自研的底层技术和代码级优化的能力。
更为关键的还有“运力”问题,在多中心的协同中,有一个关键指标叫“运力”,它的本质是追求高速率、低延迟的数据传输。
但是在事实的实践中,华为云面临的挑战并不是自建数据中心内部的数据流转,因为这是华为的本行和拿手好戏。真正的挑战,是跨区域、跨层级连接的挑战——事实上,在3D渲染这种超大数据规模的场景中,传统的“卡车拉硬盘”现象还未完全消失。但在另一方面,华为云已经在提供专线、云连接、公网EIP等各种云上云下/云内跨区域网络访问方案,允许客户实现就近专线接入,跨区域高速互联,轻松实现异地协同。
《雄狮少年2》虽然是一个小小的切入口,却能看到许多如今中国数字化进程的内在的真实现状。例如,就当下来说,很多地方的算力中心的占用率并不高。究其根本原因,某种程度上是由于存算比、算运比不合理,也就是投资过多的集中在算力上,对存力和运力的重视性和冗余度投资不足,使得实践中整个体系并不能按照最佳配比运作。
而华为云底座作为服务于千行万业的基础设施,在这次实践中,最能体现其先进性的并不是某个单点技术,而是整个体系的平衡性,实现了实实在在的“六边形战士”化。而我国数字经济的主要方向,就是以数据资源为关键要素,建立运力、算力、存力三者协同发展的数字基础设施。
03
雄狮醒了 不再睡去
我喜欢《雄狮少年2》,更具体的喜欢其中的文化自信。如阿娟在格斗中融入舞狮基本功,展现了传统技艺与现代技艺的渗透互补。同时,通过阿娟、小雨等人物的奋斗历程,体现了岭南文化中自强不息、拼搏不止的精神传承,以及中国人对责任与人生意义的独特理解,最明显的特征是,阿娟最后的翻身依靠集体智慧,成功也惠及集体。
从上世纪90年代中后期到本世纪初,《狮子王》等外国动画电影涌入中国。反观我国动画行业,至少在技术层面上差距太大,进而陷入低迷。
我们缺的不是文明的厚度,也不是文化的魅力;换言之,我们缺的恰不是“在之上”的“道”,而是“在之下”的“器”。
相反,随着国内原创动画的扶持政策陆续出台,国家动画产业研究基地、产业实践基地的建立,我们在静水流深中,等待着一个奋起的机会。
我们所等待的,就是既有技术领导力、也有强大技术赋能体系的产业“狮子王”的苏醒。
在这个过程中,2005年,《魔比斯环》打开了国漫3D化的大门,近几年的《哪吒之魔童降世》《西游记大圣归来》等国漫IP象征着多元化表达的探索。
但是,《雄狮少年2》所呈现的技术水准,与背后强大的华为云技术底座,可以看作是雄狮梦醒的呼啸,也可以看作是国漫挥师全球市场的号角。
在技术的加持下,影片实现了中华美学精神与现代电影叙事、电影技术和电影工业的无缝对接。如在叙事关键节点出现的野草、野花、雄狮、狮头等镜头,具有象征意义和美学价值,增添了“言有尽而意无穷”的美学意蕴。
从更高的维度来看,首先给我们信心的,是华为作为引领者带来的体系性能力的提升,这个不再赘言。
其次,更值得关注的,是赞奇科技这样的高水平细分赛道引领者的出现。
这是一家创立于2012年的公司,自主研发、完全基于公有云运营的云渲染SaaS平台“渲云”,面向影视动漫、建筑设计、工业设计、游戏等诸多领域,提供便捷高效的云端渲染服务。
事实上,与细分赛道的领军者合作,就是华为云进入千行万业的主流模式。
在与伙伴共建竞争力这件事上,华为云从来不遗余力。
例如,在赞奇科技与华为的合作中,前者甚至基于华为云核心的FusionAccess底层架构,研发了软硬件一体化的高性能云桌面平台“呆猫”,使用户可以使用低配置的本地计算终端,借助云端的超强算力,运行多种大型3D工具软件,能满足高重度3D设计场景的需求。
你以为《雄狮少年2》是唯一的硕果吗?
并不是,双方已经为《长津湖》、《长津湖之水门桥》、《流浪地球2》、《封神1》、《昆仑神宫》等多个影视巨作提供了灵活高效的渲染协同服务。
若以爆火的游戏产品《黑神话:悟空》为例,赞奇科技携手华为云,在短短一天内迅速推出了《黑神话:悟空》的云桌面版本,为玩家提供了在云端畅玩3A级游戏的全新体验。
可以说,借助海量算力和极致稳定的性能优势,华为云现已为赞奇及其他影视制作头部合作伙伴提供超过50万核的云渲染算力,得到了行业的普遍认可。
从这一个个大作的名字中,难道你还看不出中国科技发展与电影工作已然深度结合?还看不到睡狮已然梦醒?
更重要的是,华为云在生态的建立上,有极强的分寸感——通常情况下,华为云并不是直接为制片方服务,而是通过具体细分赛道顶级企业来联合赋能,后者通常在行业里有较高的知名度。
为什么不直接站到前台,而要做草丛后的雄狮?
在我看来,在目前的云计算、AI等领域的toB业务方面,提供基础底座的企业应该“有所为,也有所不为”,垂直整合并不是最好的出路。特别是非标的PaaS、Maas等服务,创建能够包容各有所长的合作伙伴的生态尤为重要,这些伙伴可以把华为云的基础能力和丰富的行业know-how结合起来,更好的服务于终端用户。
不抢夺伙伴的光辉,但却始终默默的支持。
“在实践中我们面临大量的创新可能,例如对于某些特定帧的优化,单帧可以达到160小时左右,如果是这样的节奏,我们完全无法保证影片的如期上映。在华为的支持下,我们采用了新的技术,把一帧放到64台机器上去并行渲染,相当于效率提升了64倍,而这需要一些非常底层的技术能力”,赞奇科技的负责人说:“从另一个角度来说,能做出这样的技术是因为有华为云庞大的资源池在保障,我们后来甚至做到了一张图片由128台机器来并行渲染。如果这些机器都需要我们买的话,实际上是比较难实现的。这也意味着,我们选择绑定华为这样的伙伴,极大的放大了我们的创新想象空间。”
事实上,《雄狮少年2》已经引起了行业的广泛关注,华为云的相关负责人表示:“全球影视产业制作已经进入数字化时代,与之具有技术相关性的还有元宇宙、3A游戏、数字人、建筑设计等领域,这些行业上云是必然选择。为了增强文化竞争力,华为云选择与更多的伙伴合作,这样可以更快的进入更多的领域,有利于助力数字创作产业,激发更多带来灵感和提升效率的技术变革,从而赋能整个行业向前迈进”。
但在我看来,国漫也好、国风游戏也罢,仅仅在国内市场上杀进杀出,并不是终极选择。
中国国漫的终极使命,是向全世界展示中国的优秀文化,以及基于这种独特的文化所产生的极富魅力和生命力的内容产品。
而要走通这条路,在20年甚至10年前,要克服的技术难关都太多太多。但是,今天在华为云强大的云端算力、AI能力加持下,这些已经不再是问题。
盘古大模型具有强大的多模态能力,在语音生成、视频生成以及AI翻译有各种技术创新,可以重塑内容生产和应用的新模式。例如,在语音声场方面,只需要几句话、几秒钟的声音,即可学习到演讲者个性化的音色、语调、表达韵律;在内容出海方面,通过大模型提供的视频翻译能力,可以保留原始角色的音色、情感、语气,实现韩语、法语、德语 西语、泰语、阿语等15种语言的译制,并保持音唇同步……这样的例子还有很多。
随着一个个以往出海的难关被技术的浪潮冲刷,随着越来越多的中国商品、互联网产品,甚至是智能汽车、人工智能技术这样的“非卖品”给全球市场带来强劲的新供给,我们又有什么理由不去相信——我们的国漫、游戏、电影乃至泛内容产业,会以一种全新的姿态,走出中国、走向海外。
近段时间以来,AI技术在影视作品中的应用正迅速推进并实现落地。据公开资料,全球首部完全由AI生成的长篇电影《Our T2 Remake》已于3月完成首映。
而行业的看法是,AI对影视工业的影响至少有三个方面。
第一个影响是提升效率,如前所言,AI可以大幅度降低3D渲染中的出错率,可以将渲染的效率提升30%-50%。
第二个影响是降低成本,通过深度学习和大数据分析,AI能够自动生成高质量的视觉效果、音效和场景设计,大大缩短了制作周期,降低了成本,也能帮助年轻的电影人更好地实现由创意向作品的转化。
第三个也是最重要的是,技术从来是影视进步的核心动力,在未来一段时间,AI可能帮助我们达到前所未有的视觉效果的跃升,帮助电影工业进入一个新的发展阶段。
我不由产生了一种想法——如果依靠单个企业的单体式创新,今天的我们也很难赶超拥有超高集中度、五大中心的美国计算机视觉产业。但是,通过云计算这种前所未有的赋能方式,以及AI能力的加持,我们可以把越来越多的生产企业联合起来,通过集体的力量实现突破,这或许是我们赶超的一次历史性机遇;同时,这也是我们的千行万业整体破局的新机会点,也是新质生产力的重要体现。
雄狮已醒。它不会再睡去,而是整装待发。