中外的AI技术差距扩大是因为人家现在不再开源了吗？

最近OpenAI公司公布人工智能视频生成模型Sora，在全世界引起轰动，Sora能够根据用户输入的文本指令直接生成逼真的视频，视频的流畅性和逻辑性能够达到以假乱真的程度。

Sora的问世表明AI技术进步到一个新的阶段，不仅在视频制作，例如电影、广告产业中直接应用，更重要的是，一旦AI可以生成流畅又富有逻辑的视频，就能够对视频进行更加准确的识别。可以想象，自动驾驶汽车可以通过摄像头拍摄的高清视频，借助于AI直接判断路面的情况，像人驾驶一样，与现有的技术路径完全不同；手术机器人可以借助于AI系统直接判断病灶位置和手术范围，而不需要依靠医生的经验和技术。这些在现有的技术框架下实现起来都非常困难，需要大量的数据标注、复杂的算法和训练，效果也不一定很好。

在OpenAI发布Sora的近乎同时，谷歌和脸书的母公司Meta也纷纷发布类似的产品。互联网巨头在该领域的竞争达到白热化，主要是看到相关技术的前景，这不仅是在视频制作领域的进步，更多的是向通用大模型的方向迈进。也许，在不远的将来，所有的电子设备都可能安装上通用大模型，手机、汽车、医疗器械等，AI大模型更像是操作系统windows、Linux、安卓一样，成为设备必备的底层系统。这个蛋糕大到目前产业界无法想象的程度，所以各大巨头激烈竞争也就可以理解了。

很多人感慨中国与国外的AI技术差距可能逐渐扩大，下一个类似于操作系统级别的产品，可能还是会由OpenAI、谷歌、Meta等公司发布。这里面的原因很复杂，最近自媒体出现很多这样的声音，他们认为中国在该领域的差距扩大，是因为美国的AI技术不再开源了，所以国内的企业没法继续抄袭了。

这种观点显然是错误的，这是对软件开源技术的一种误解。

首先，AI的领域的开源并没有减少，相反，AI相关的开源模型反而更多。即使是大模型，也有谷歌和Meta的开源，基本的transformer架构更是开源的，任何人都可以在此基础上进行开发。但是开源并不是说所有的技术秘密都会公开，每家公司都会有自己的数据处理方式、模型训练方法以及算法的微调。在开源技术上的政策，国外并没有明显改变，说AI领域的差距扩大是因为美国不再开源了，这个说法是没有道理的。

其次，软件开源并不是一种慈善，更多的是一种商业策略。开源软件不完全等同于免费软件，很多企业进行软件开源，并不是单纯为行业做贡献，而是一种比较高明的商业策略。比如著名的开发语言Java和数据库系统Mysql都是开源的，但是他们的价值连城，收购价达数十亿美元。开源软件的企业通过开源项目可以迅速吸引流量，节约开发成本，将竞争对手边缘化，同时在开源项目的基础上可以推出商业版和增值服务。安卓系统是谷歌开源的操作系统，但是谷歌通过安卓每年获取大量的商业利益，安卓是谷歌应用的主要入口。

企业使用开源系统不是抄袭和占便宜，相反，使用开源系统本身也是在贡献，一方面是为开源软件贡献流量，购买增值服务，同时自己在开源软件基础上的开发也需要贡献。从某种程度上，使用开源软件是相当于把自己当成开源软件所有人的潜在客户，而且是会贡献技术的用户，所以使用开源软件不能成为抄袭。

第三，中外AI差距有扩大倾向，原因是多方面的，但与是否开源无关。可以想到的原因主要有人才储备、数据资源、硬件资源、行业生态、资源投入以及政策环境。中国虽然也有很多AI领域的人才，但是相比较而言，在生成式人工智能方面，美国的企业和大学很早就较多涉足这个领域，笔者在2019年制作一个分析报告显示，实际上在2018年之前，谷歌、微软、苹果这些企业都申请了不少生成式AI的专利，相比较而言，中国的生成式AI的专利申请主要是2023年之后。在生成式AI领域，算力尤为重要，GPU的限制也带来一定影响，很多的模型训练都需要4090以上的资源，特别是英伟达的芯片，已经有良好的生态，短时间即使硬件上能够替代，也很难建立起类似的软件生态。同时，模型训练的数据也尤为重要，中文的数据无论是数量还是质量都与英文的差距较大，这本身也带来很大影响。此外，政策环境的规定也有一定影响，大语言模型需要对生成式内容的准确性有一定宽容度。这些都是值得思考的问题。

总之，AI领域的差距有扩大倾向，原因有很多，但与是否开源是无关的。

感兴趣的朋友可以加笔者微信patentlight

首例基因技术药物专利授权案牵动亿万产业

中外的AI技术差距扩大是因为人家现在不再开源了吗？

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

提升ChatGPT编程能力！OpenAI与全球最大技术问答社区合作

NVIDIA Omniverse Cloud API支持数字孪生开发，可解决复杂AI问题

传OpenAI入局AI搜索！疑似ChatGPT搜索网址流出，或明日上线

没有什么能拦住生成式AI落地了

安谋科技杨磊：抢占端侧大模型部署制高点，NPU将为端侧提供关键动力丨GenAICon 2024

“离谱的AI扩图”火了！张张那叫一个出其不意

一块钱100万token，超强MoE模型开源，性能直逼GPT-4-Turbo

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

剑桥团队开源：首个预训练通用多模态后期交互知识检索器

论文 Figure 不堪入目，句子啰嗦读不通……这几个在线科研工具可以免费用了

这台新机一发布，全世界垃圾佬都得疯

RISC-V浪潮下，开源社区正与这个新架构不断融合

巨头雄霸天下，微软、谷歌、Meta、亚马逊能一直无敌吗？

骑手与路人发生冲突，突然从后备箱抽出砍刀，发疯似的一阵乱砍！

"鸿茅药酒事件"当事人:卖了将近3千套书直播为报平安

大模型时代，DevOps如何“跟上节奏”？

俄方警告：F-16被视为核武器载机将成俄合法打击目标

苹果M4芯片问世，直接让iPad Pro秒杀了所有AI PC！

中外的AI技术差距扩大是因为人家现在不再开源了吗？

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

提升ChatGPT编程能力！OpenAI与全球最大技术问答社区合作

NVIDIA Omniverse Cloud API支持数字孪生开发，可解决复杂AI问题

传OpenAI入局AI搜索！疑似ChatGPT搜索网址流出，或明日上线

没有什么能拦住生成式AI落地了

安谋科技杨磊：抢占端侧大模型部署制高点，NPU将为端侧提供关键动力丨GenAICon 2024

“离谱的AI扩图”火了！张张那叫一个出其不意

一块钱100万token，超强MoE模型开源，性能直逼GPT-4-Turbo

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

剑桥团队开源：首个预训练通用多模态后期交互知识检索器

论文 Figure 不堪入目，句子啰嗦读不通……这几个在线科研工具可以免费用了

这台新机一发布，全世界垃圾佬都得疯

RISC-V浪潮下，开源社区正与这个新架构不断融合

巨头雄霸天下，微软、谷歌、Meta、亚马逊能一直无敌吗？

骑手与路人发生冲突，突然从后备箱抽出砍刀，发疯似的一阵乱砍！

"鸿茅药酒事件"当事人:卖了将近3千套书 直播为报平安

大模型时代，DevOps如何“跟上节奏”？

俄方警告：F-16被视为核武器载机 将成俄合法打击目标

苹果M4芯片问世，直接让iPad Pro秒杀了所有AI PC！

"鸿茅药酒事件"当事人:卖了将近3千套书直播为报平安

俄方警告：F-16被视为核武器载机将成俄合法打击目标