最近OpenAI公司公布人工智能视频生成模型Sora,在全世界引起轰动,Sora能够根据用户输入的文本指令直接生成逼真的视频,视频的流畅性和逻辑性能够达到以假乱真的程度。

打开网易新闻 查看更多图片

Sora的问世表明AI技术进步到一个新的阶段,不仅在视频制作,例如电影、广告产业中直接应用,更重要的是,一旦AI可以生成流畅又富有逻辑的视频,就能够对视频进行更加准确的识别。可以想象,自动驾驶汽车可以通过摄像头拍摄的高清视频,借助于AI直接判断路面的情况,像人驾驶一样,与现有的技术路径完全不同;手术机器人可以借助于AI系统直接判断病灶位置和手术范围,而不需要依靠医生的经验和技术。这些在现有的技术框架下实现起来都非常困难,需要大量的数据标注、复杂的算法和训练,效果也不一定很好。

在OpenAI发布Sora的近乎同时,谷歌和脸书的母公司Meta也纷纷发布类似的产品。互联网巨头在该领域的竞争达到白热化,主要是看到相关技术的前景,这不仅是在视频制作领域的进步,更多的是向通用大模型的方向迈进。也许,在不远的将来,所有的电子设备都可能安装上通用大模型,手机、汽车、医疗器械等,AI大模型更像是操作系统windows、Linux、安卓一样,成为设备必备的底层系统。这个蛋糕大到目前产业界无法想象的程度,所以各大巨头激烈竞争也就可以理解了。

很多人感慨中国与国外的AI技术差距可能逐渐扩大,下一个类似于操作系统级别的产品,可能还是会由OpenAI、谷歌、Meta等公司发布。这里面的原因很复杂,最近自媒体出现很多这样的声音,他们认为中国在该领域的差距扩大,是因为美国的AI技术不再开源了,所以国内的企业没法继续抄袭了。

这种观点显然是错误的,这是对软件开源技术的一种误解。

首先,AI的领域的开源并没有减少,相反,AI相关的开源模型反而更多。即使是大模型,也有谷歌和Meta的开源,基本的transformer架构更是开源的,任何人都可以在此基础上进行开发。但是开源并不是说所有的技术秘密都会公开,每家公司都会有自己的数据处理方式、模型训练方法以及算法的微调。在开源技术上的政策,国外并没有明显改变,说AI领域的差距扩大是因为美国不再开源了,这个说法是没有道理的。

其次,软件开源并不是一种慈善,更多的是一种商业策略。开源软件不完全等同于免费软件,很多企业进行软件开源,并不是单纯为行业做贡献,而是一种比较高明的商业策略。比如著名的开发语言Java和数据库系统Mysql都是开源的,但是他们的价值连城,收购价达数十亿美元。开源软件的企业通过开源项目可以迅速吸引流量,节约开发成本,将竞争对手边缘化,同时在开源项目的基础上可以推出商业版和增值服务。安卓系统是谷歌开源的操作系统,但是谷歌通过安卓每年获取大量的商业利益,安卓是谷歌应用的主要入口。

企业使用开源系统不是抄袭和占便宜,相反,使用开源系统本身也是在贡献,一方面是为开源软件贡献流量,购买增值服务,同时自己在开源软件基础上的开发也需要贡献。从某种程度上,使用开源软件是相当于把自己当成开源软件所有人的潜在客户,而且是会贡献技术的用户,所以使用开源软件不能成为抄袭。

第三,中外AI差距有扩大倾向,原因是多方面的,但与是否开源无关。可以想到的原因主要有人才储备、数据资源、硬件资源、行业生态、资源投入以及政策环境。中国虽然也有很多AI领域的人才,但是相比较而言,在生成式人工智能方面,美国的企业和大学很早就较多涉足这个领域,笔者在2019年制作一个分析报告显示,实际上在2018年之前,谷歌、微软、苹果这些企业都申请了不少生成式AI的专利,相比较而言,中国的生成式AI的专利申请主要是2023年之后。在生成式AI领域,算力尤为重要,GPU的限制也带来一定影响,很多的模型训练都需要4090以上的资源,特别是英伟达的芯片,已经有良好的生态,短时间即使硬件上能够替代,也很难建立起类似的软件生态。同时,模型训练的数据也尤为重要,中文的数据无论是数量还是质量都与英文的差距较大,这本身也带来很大影响。此外,政策环境的规定也有一定影响,大语言模型需要对生成式内容的准确性有一定宽容度。这些都是值得思考的问题。

总之,AI领域的差距有扩大倾向,原因有很多,但与是否开源是无关的。

感兴趣的朋友可以加笔者微信patentlight

首例基因技术药物专利授权案牵动亿万产业