打开网易新闻 查看更多图片

世界格局的宏观预测

一、国际格局将发生巨大改变

AI 的兴起,可能会导致世界进一步割裂,分为能使用 GPT 的国家和不能使用的国家,这种割裂将极大地改变国际竞争的态势。

对于不支持 GPT 的国家,即便人数占优势,实际的生产力可能也无法对应增长。以程序员为例,假设使用 GPT 的国家,能让其300万程序员效率翻倍。相对而言,未使用 GPT 的国家,尽管程序员数量达到700万,其战力可能只等同于使用 GPT 的300万程序员。

当然,这只是一个简化的比喻,因为程序员的主要工作并非仅仅编写代码,而且 GPT-4 对不同领域的程序员提供的帮助程度也不同。然而,这个例子能够提供一个角度,让我们大致理解 AI 技术在提升工作效率方面的潜力。

而且,与互联网时代不同的是,AI 有潜力渗透到各个行业,对整个经济格局产生深远影响,大多数行业未来都可能需要依赖 AI 技术。

因此,如果一个国家未能充分利用 AI 技术,导致其一些关键行业的生产力降低到原来的一半甚至更低,那么这将无疑对该国的全球竞争地位构成严重威胁。

AI 被视为新一轮工业革命的引擎,这已经成为业界共识。无论是个体还是国家,最早采用 AI 的一方将会获得巨大的先发优势,就像英国在工业革命时期那样。

二、我国在 AI 领域不会被“卡脖子”

我之前担心过,我国 AI 发展可能会被卡脖子。现在看来,这种想法可以推翻了,主要原因有以下几点:

1、国内公司的投入大

国内 AI 热潮正持续升温。无论是百度、腾讯、阿里还是科大讯飞等头部科技公司,都在重金投入 AI 大模型的研发和部署。

2、开源力量的推动

越来越多的开源产品在不断丰富着 AI 领域的生态,开源本身也在推动着技术进步。

3、GPU 进货问题不大

英伟达为了绕过美国政府对中国公司的销售限制,专门推出为中国“特供”的 A800 芯片,作为 A100 芯片的替换版本(两者都是专门用于训练大模型的 AI 芯片),这无疑是给中国的 AI 企业打了一针强心剂。

英伟达A800芯片参数

在大模型训练和推理两个环节,我们也都已经拥有了自己的 GPU,尽管性能只有英伟达的10%-20%,应用范围也相对狭窄。但是,我们已经有了起步,这就是关键,半导体行业的竞争并非只在于谁做得更好。我们现在虽然只有对手几分之一的速度,但他们却无法真正封锁我们,我们也只不过速度慢了一些。如果他们拒绝向我们出售,反而会丧失潜在的利润。

综合上面的原因,我认为在一年内,我们自己也能训练出 ChatGPT 类似的产品,达到 GPT-3.5 的水平。

在这个过程中,各大厂商重复创造轮子是在所难免的,但对于创业团队,如果没有特别的优势或积累,从零开始研发是不必要的,因为很可能最后的结果,还不如已有的开源项目效果好。

尽管我们可能不会被卡脖子,但当我们达到 GPT-3.5 的水平时,别人可能已经开始研发 GPT-5,先发优势依然明显。

未来 AI 行业预测

一、OpenAI 未必是最终赢家

当前,普遍观点认为 OpenAI 与其背后的微软是赢家。然而,我认为 OpenAI 的胜利尚未确定。主要原因有以下几点:

1、OpenAI 欠缺大公司的技术和用户优势

尽管 OpenAI 在技术方面展现出了显著的领先地位,但这并不表明,其优势就如表面上看起来的那样巨大。

首要的挑战是来自于其他大公司的威胁。比如 Google,作为全球领先的科技公司,其研发能力和技术积累是可以开发出 ChatGPT 同等级的产品。然而,作为一个商业组织,Google 需要考虑更为全面的商业利益和市场布局。

目前,Google 的核心盈利模式依然是搜索引擎广告业务,这是一块经过多年积累,已经相当稳定和盈利的市场。如果急于推出大模型产品,可能会对现有的稳定收入产生冲击,甚至威胁到 Google 的主营业务。

在这种情况下,Google 更有可能采取谨慎的策略,坚守现有的盈利模式,同时在适当的时机,有策略地推出与相关产品,而不是着急“跟风”大模型,自己革自己的命。

其次,用户群体是一大关键。移动互联网时代的用户,大部分都在 Google、Apple 这样的传统厂商手中。相较之下,像 ChatGPT 和 Midjourney 这类新兴的 AI 应用产品,虽然表现出强大的潜力和创新性,但目前还只有一部分人在使用,其用户群体相对较小,产品和商业模式也相对单一。

所以,我觉得将 AI 融入拥有大量用户的传统产品中,可能会开辟出更大的市场。

2、手机语音助手是最好的应用场景

如果 Apple 或 Google 能在其操作系统中内置一个自己的 GPT,再融入语音助手,OpenAI 可能难以抗衡。国内的手机制造商也可以在这方面尝试创新,这可能会成为一个巨大的增长点。

因为,当前的技术足以实现,关于监管问题也会有应对方案,最重要的交互问题也可以解决:比如,可以设计让 AI 在执行操作前请求用户确认,像现在流行的 AutoGPT 在操作前会问用户“Yes or No”。手机厂商也可以采取类似的保守策略。

打开网易新闻 查看更多图片
每一步命令执行之前,AutoGPT会询问用户是否继续

二、未来的 AI 将是一超多强的局面

未来将是多家强大的 AI 公司竞争的局面,而非 OpenAI 一家独大。这些公司可能会分为开源和闭源两个阵营。我对开源产品充满信心,原因有以下几点:

1、开源项目可以满足非常强的定制化需求

以 Stable Diffusion 和 Midjourney 为例,虽然 Stable Diffusion 的效果可能比 Midjourney 差一些,但 Stable Diffusion 能做到 Midjourney 无法实现的事情——开源产品可以让用户自定义训练和优化。

比如,一个厂商在做国风的品牌,他可以自己训练或下载现成的国风 checkpoint,借助 Stable Diffusion 设计出众多符合自身品牌定位的产品,提高自己的生产力。这对于一些特定的行业和特殊的需求,开源项目无疑提供了巨大的帮助。它不仅提供了极高的定制化能力,还允许用户根据特定的专业和用途进行训练,打破了 Midjourney 等闭源项目在交互和功能上的限制。

所以,我觉得开源产品只要能达到闭源产品70%的水平,应用场景就会非常广泛。

在 Twitter 上,有位开发者用清华大学的开源模型 ChatGLM,创建了一个本地部署的 ChatPDF,虽然 ChatGLM 在文字生成能力上相较 GPT-3.5 有所不足,但它足以满足基本需求。用户只需将 PDF 论文输入模型,便可通过 AI 进行深入的学习和分析。这种创新的方式开启了 AI 改变传统教育方式的新可能性,展现了在教育领域中 AI 的巨大潜力。

ChatGLM+ChatPDF的项目,GitHub上星标已超过6.3k

2、闭源产品的“越狱”需求很大

用户对于“越狱”闭源产品的需求也异常旺盛,即通过各种手段突破闭源公司对 AI 的限制。

| NSFW的需求

互联网的发展受到许多因素的推动,其中一个不可忽视的因素是"NSFW"(Not Safe For Work)的内容需求。这是一个专门用来标注可能不适合在工作场所浏览的内容的缩写。

我介绍过一种被称为"语音房"的产品。这些产品提供了一种"软性"的 NSFW 内容,它们有很高的盈利能力,因为这种需求在现实生活中非常普遍,并且是合法的。然而,AI 文本生成模型如 ChatGPT 并不能生成 NSFW 内容。

然后让我们想象一下,如果有了开源的文字生成产品,人们会如何使用它?

同样,尽管 Stable Diffusion 已经更新到了2.x 的版本,但仍有很多人坚持使用1.5的版本,主要原因是1.5的版本能生成一些"小姐姐"的图片,而更新的版本不能。

检测到关键词,Midjourney禁止了请求

| 隐私的需求

在一些敏感行业中,人们可能不愿意将数据交给 ChatGPT 等闭源公司,因为这会涉及到一定的风险,例如数据的滥用或泄露。因此,在本地部署的开源产品成为一种更安全的选择。尽管这些开源产品在功能上略显不足,但它们至少能够满足基本的安全要求,使数据得到保护。

3、强大的开源力量

Stable Diffusion 从2022年8月开源到现在,其相关微调方法的生态已经枝繁叶茂了。

开源者们贡献了海量的 LoRA(Low-Rank Adaptation of Large Language Models,一种用于大型语言模型的优化方法,通过减少参数数量和计算复杂度,提高模型的训练效率和适应性)、checkpoint(在计算机科学和深度学习中指的是程序执行的标记点或保存点,用于记录程序状态和数据,以实现中断恢复、稳定训练和模型选择等功能。),以及 extension(为现有软件添加额外功能或特性的模块或插件,比如 ChatGPT 的 Summarize)。

打开网易新闻 查看更多图片
Summarize插件,可以一键总结网页内容

包括文本生成方面,从 Meta 公司开发的大型语言模型技术 LLaMa(Large Language Model Meta AI )到其衍生品 Alpaca(斯坦福在 LLaMa-7B 的基础上监督微调出来的模型),都是因为开源的力量。

我相信在短短一年内,依靠开源力量,一些产品就能达到 GPT-3.5 的水平。包括现在,我们看到一些模型,在某个特定领域使用起来比 ChatGPT 更高效。所以,AI 技术并不会被“卡脖子”,我们应该感谢开源精神,这种无国界的精神真正推动了全球的进步。


GitHub上中文LLaMA模型和指令精调的Alpaca大模型,星标超9k

根据以上对 AI 行业的讨论,我们可以得出三个关键预测,同时也是三个重要的推论:

第一,技术和数据不会被单一的公司垄断

未来很可能形成开源阵营与闭源阵营对立的局面,实现一个超级强者与多个有力竞争者并存的格局。在这样的环境下,各个领域的优质开源产品都将有很大的发展空间。

第二,应用端会成为最有利润的环节

未来,大模型将像云服务一样普及,但并不会成为行业中利润最丰厚的部分。

技术爱好者可能会欣赏到现在这个时代的纯粹性,例如 ChatGPT、Midjourney 等纯技术驱动的成功案例,因为它们并不需要花费大量精力在产品开发上,也不需要过多考虑商业模式和策略优化。

然而,我认为随着 AI 技术的日益成熟,价值最终还是会回归到应用端和产品化的能力,发现需求和留住用户的能力会变得越来越重要。

第三,创业公司需要保持灵活性

创业公司可以采用"大模型中立"的策略,随时接入和切换不同的大模型。随着大厂的参与和各种开源产品的发展,大模型的市场也将出现多元化的竞争局面。在这种环境下,使用 API 的价格不会过高,创业公司也能够保持相当的灵活性。

创业 & 投资的建议

一、开源项目产品化是“低垂的果实”

无论是创业还是投资,我认为一个明确的方向就是将开源项目产品化。开源项目通常在产品化方面的能力较弱,很难实际落地,而创业公司可以填补这个空白。

比如 Stable Diffusion,2022年8月到现在开源这么久了,仍然不是一个普通人可以玩的一个产品。

再比如 AutoGPT,我用它去完成一些复杂的任务,但在数小时的尝试之后,我遇到了各种报错和死循环,最终什么都没输出出来。当然,最近也有人给 AutoGPT 做 UI 层的产品,虽然很好看,但都没有解决 AutoGPT 的根本问题:工作不稳定。

现在很多人为了蹭热度,急于推出一个产品,短期内可能吸引了一些眼球,但从长期看,这些产品的使用效果可能并不好。但是,如果能够把 AutoGPT 思路提炼出来,并真正投入时间和精力去开发一个可靠且好用的产品,那么这将会有非常大的前景。

二、平衡开发速度与产品力

将一个原本只有极客们玩得转的东西,转变为适合大众使用的产品,需要强大的产品化能力。在这个过程中,如果你做得太快,产品可能做得不够好;如果做得太慢,你可能错过了热度。因此,平衡好速度与产品力之间的关系非常重要。

大公司往往在这方面会显得比较迟缓和保守,这为创业公司提供了许多机会。

总之,这些开源的产品就是“低垂的果实”。而且,Twitter 和 Github 上很火爆的极客产品,在技术和市场验证上都完成了从0到1的突破,只是最后的产品环节没做好。如果创业者能够将产品化的最后一公里走好,可能会取得非常大的成功。

视频已经于4月19日发布,此篇文章并未对内容进行过多的增删。值得注意的是,仅仅在过去的两个月左右的时间里,我们已经可以看到一些预测正在逐步成为现实。

我曾经在社群中提到过某头部金融机构发布的报告,他们尝试预测未来一年的十大重要事件,结果却有八个出现了误判。这说明预测未来是一件极其复杂的事情,需要考虑的变量太多,而且未来的发展往往超出我们的想象。

此外,我在文章中提出的一些观点与主流意见存在一定的差异。这些预测是否会被事实打脸,或者是否会成为现实,可能需要一个更长的时间去检验。

欢迎关注公众号「李自然说」,及时获取最新动态和文章内容!