机器之心报道
编辑:Sia
五年内 AGI 还能否如期而至?
谷歌、Anthropic、微软和 OpenAI 都是 AI 领域的顶尖玩家,但现在看来,这些公司在开发更先进的 AI 大模型时都遇到了不小的困难。
OpenAI 曾接近一个重要的里程碑。9 月,他们完成了一个全新 AI 大模型的首轮训练,希望能远超 ChatGPT 现有技术水平,朝着打造超越人类的 AI 这个目标更近一步。
不过,彭博社援引两位知情人士消息,这个内部代号「Orion」的模型并没达到预期效果。比如,到了夏末的时候,Orion 在处理没见过的编程问题时表现还不够理想。
总的来说,和 OpenAI 现有的模型比起来,Orion 的进步幅度远不如从 GPT-3.5 升级到 GPT-4 时那么大。要知道 GPT-3.5 可是 ChatGPT 最早用的那个系统。
一位消息人士告诉彭博社,这一挫折意味着 OpenAI 不太可能在明年年初之前向其用户推出 Orion。
与此同时,据三位知情人士透露,谷歌的下一个 Gemini 迭代本应是一次重大升级,但其表现也低于内部预期。同样,期待已久的 Anthropic Claude 3.5 Opus 的发布也被推迟。
生成式 AI 在训练中高度依赖于互联网数据。虽然它们在快速生成响应方面表现出色,但似乎已触及瓶颈,无法找到新的高质量内容源来开发更高级的 AI 系统。
两位消息人士告诉彭博社,Orion 的编码性能不佳是由于缺乏足够的编码数据进行训练。
出版商和作者则担心 AI 系统在未经同意或补偿的情况下抓取他们的内容进行训练。微软和 OpenAI 也正在应对多起版权侵权诉讼。
OpenAI CEO Sam Altman 承认,在没有版权内容的情况下开发类似 ChatGPT 的工具几乎是不可能的。他也指出,版权法并未明确禁止使用受版权保护的内容来训练 AI 模型。
OpenAI 最近在一场版权侵权诉讼中胜诉。纽约联邦法官说得很明白:
让我们搞清楚这里真正的问题是什么。原告( Raw Story 和 AlterNet )真正想要追究的,并不是说 OpenAI 删除了版权管理信息,而是 OpenAI 没给钱就用了他们的文章来训练 ChatGPT。
高质量数据的缺乏并不是限制高级 AI 模型发展的唯一问题。构建和维护新模型的高成本也是一个重要障碍。
据报道,在过去的几个月里,OpenAI 预计亏损 50 亿美元。然而,他们通过另一轮融资成功续命——从微软、英伟达和其他主要投资者那里筹集了 66 亿美元。
虽然这轮融资让市值飙升到了 1570 亿美元,但市场分析师预测,这家公司还没渡过难关。由于和微软的数十亿美元合作关系等因素,在 2029 年开始盈利之前,OpenAI 可能还要面临 440 亿美元的亏损。
通过最新一轮融资获得的延长生命值后,OpenAI 也面临两难:要么在未来两年内转型成为营利性公司,要么就得把投资者的钱退回去。这种情况可能会引来外部势力的干预和恶意收购,其中就包括微软可能在未来 3 年内收购 OpenAI 的可能性。
值得一提的是,这已经是 OpenAI 第八次向投资者伸手要钱来支持其 AI 项目的开发了。
OpenAI 这一动作已经遭遇了重大阻力,包括马斯克提起诉讼,指控公司背离了创立初衷,还涉嫌参与敲诈勒索活动。专家预测,这一转变还会遭到员工、监管机构和政府部门的强烈反对。
至于 OpenAI 何时会发布 Orion 模型,目前还没有确切时间表。据彭博社消息,模型已经进入训练后期阶段,这表明离正式对外发布已经不远了。
不过,尽管 OpenAI 投入了大量精力,这个 AI 模型的表现还是不如预期。因此,公司决定把发布时间推迟到明年初。
此外,OpenAI 似乎打算改变传统的模型命名方式。因此,这个新模型可能不会用我们熟悉的命名方式。
Sam Altman 曾表示,GPT-4 的继任者会「更智能」,运作方式更像一个「虚拟大脑」。他还确认公司今年晚些时候会发布一些重要产品,但强调「不会叫 GPT-5 」。
总的说来,这些公司都在追逐通用人工智能( AGI )这个目标,但按照 Sam Altman 的估计,这可不是件容易事。他说,要建造 36 座半导体工厂和额外的数据中心,需要投入 7 万亿美元,还得花很多年时间。
这番话一出,很多人觉得简直是天方夜谭,也让 Altman 被贴上了「键盘侠」的标签。有意思的是,尽管说需要这么多投入,Altman 却又声称用现有的硬件就能实现 AGI 。
https://www.bloomberg.com/news/articles/2024-11-13/openai-google-and-anthropic-are-struggling-to-build-more-advanced-ai