一个名为 GPT-2 聊天机器人的据称 1.5B 参数模型已经发布，所有人都惊呆了！！

上方蓝字关注我们

今天，一个新晋的人工智能系统“gpt2-chatbot”在互联网上横空出世，引发了对其起源和功能的热烈猜测——一些研究者认为它可能是现有人工智能模型的重大进步。

这个模型在比较AI语言系统的网站上（LMSYS聊天机器人竞技场））悄无声息地出现，尽管如此，它的出色表现却引起了广泛关注。AI领域的专家们对它的表现感到惊讶，因为它不仅与目前最先进的GPT-4系统不相上下，甚至可能超越了后者。

斯坦福大学的学生、AI研究员Andrew Gao表示：“虽然很难确定是谁创造了它，但我同意它至少达到了GPT-4的水平。”他在X.com（Twitter的前身）上发表了一系列帖子，指出这个模型首次尝试就解决了国际数学奥林匹克竞赛的一个问题，这是一个面向高中生的极具声望的竞赛。Gao说：“IMO非常难，只有美国最优秀的四名数学学生才能参加。”

宾夕法尼亚大学沃顿商学院的AI研究教授Ethan Mollick表示，在他的实验中，这个模型在复杂推理任务上的表现超过了GPT-4，比如用代码绘制独角兽的图画。他说：“也许比GPT-4更好，虽然难以判断，但它在标志性的‘用代码画独角兽’任务上确实表现得更好。”

关于神秘模型起源的猜测甚嚣尘上

这个模型的出色表现激发了人们对其创造者以及为何它通过一个测试网站而不是通过宣传发布出来的广泛猜测。

许多研究者认为“gpt2-chatbot”很可能出自OpenAI，这是ChatGPT、DALL-E以及其他在过去一年推动AI发展的系统的知名实验室。该模型自称是基于GPT-4架构、由OpenAI训练的大型语言模型“ChatGPT”。但由于AI系统可以被编程以误导性的方式描述自己，这一声明难以轻易验证。

一些专家指出，这个神秘的“gpt2-chatbot”实际上是 OpenAI 在 2019 年推出的 gpt-2，使用现代助手数据集进行了微调。在这种情况下，这意味着他们最初的预训练仍然令人惊叹，并且比其他人的 4 年后更好。

就连OpenAI的CEO Sam Altman的回复也显得十分暧昧：

其他人注意到，尽管“gpt2-chatbot”在能力上接近GPT-4，但它并没有达到许多人对OpenAI传闻中的下一个大型模型GPT-5的预期。AI研究员Joe Fox在X.com上的一个帖子中说：“我查看了几乎所有模型发布的商业创意提示，响应看起来更倾向于代理行动，”这表明“gpt2-chatbot”在某些实际测试上并没有比GPT-4迈出巨大的飞跃。

“gpt2-chatbot”可能来自一个不太知名的公司或研究小组，他们希望展示自己的AI实力并引起关注。一些人提到了GPT-4chan的例子，这是一个由AI研究员Yannic Kilcher在2022年6月发布的有争议的AI模型，也使用了流行的GPT命名约定，但与OpenAI无关（最终因“生成有害内容”而被从Hugging Face平台移除）。

意外的技能暗示了进一步的潜力

专家们继续深入研究“gpt2-chatbot”以了解其能力的极限，他们发现的一些行为暗示了进一步的潜在进步。

everartai的创始人Pietro Schirano说“它似乎不仅表现出令人难以置信的推理能力，而且还以更令人印象深刻的语气正确地提出了臭名昭著的具有挑战性的人工智能问题。”

研究人员惊讶地发现，与以前的聊天机器人如ChatGPT相比，该模型似乎更愿意打破规则并忽略限制。威斯康星大学AI教授Dimitris Papailiopoulos表示，该模型能够解决GPT-4历来未能解决的逻辑谜题。“我发现了一个任务，gpt2-chatbot比其他所有模型都表现得更好，尽管这个任务实际上并没有什么用处，”他幽默地指出。

该模型还展现出了编写复杂代码的才能。CodeGen的创始工程师Chase McCoy表示，gpt2-chatbot在所有用于测试新模型的编码提示上的表现都超过了GPT-4和Claude Opus。“这款模型确实给人留下了深刻印象，”他评价道。

一些用户甚至注意到，该模型能够通过对话来回迭代，以改进其回答，显示出它对自己的局限性和思考过程有着清晰的认识。Gao指出：“它在规划所需行动方面似乎比GPT-4做得更好。例如，它能提出可能需要查看的网站和可能的搜索查询。而GPT-4给出的答案则要模糊得多。”

技术的迅猛发展

无论“gpt2-chatbot”的真正起源和全部潜力如何，它的出现都凸显了人工智能领域的快速发展，以及跟上这些最新突破的挑战性。

仅在一年多前，GPT-4在AI的“常识推理”方面实现了重大飞跃。紧随其后，Anthropic公司的ChatGPT竞争对手Claude 3也在聊天机器人的开放式对话能力上取得了突破。科技巨头如谷歌、Meta和苹果都已宣布在AI领域进行重大投资。

同时，开源AI模型的发布和对现有模型进行特定任务微调的做法，使得即使是小团队和个人也能在几乎没有预警的情况下，轻松地在线创建和发布强大的AI系统。一个名为‘gpt2-chatbot’的神秘新AI模型以其卓越的能力令研究人员震惊，引发了对其起源和作为下一代AI突破潜力的热烈讨论。

这一结果导致了新系统的不断涌现，这些系统不断扩展了我们对计算机能力的认识，并偶尔，如“gpt2-chatbot”案例一样，给AI界带来了惊喜。观察这些意外的新系统已经成为研究人员追踪AI最前沿技术的一种流行活动。

尽管“gpt2-chatbot”的真正重要性还有待观察，但其低调的出现和明显的能力提升，预示着随着AI技术的加速发展，这类事件可能成为常态。在一个快速发展的领域中，有时最大的进步可能会通过互联网上一个遥远角落的神秘身影，悄无声息地到来。

已有超过2000名

读者加入交流群

我们还在等你

点这里关注我，记得标星哦～

CLICK TO SEE YOU LOOK THE BEST

一个名为 GPT-2 聊天机器人的据称 1.5B 参数模型已经发布，所有人都惊呆了！！

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

何小鹏：智能驾驶的事故率是人工驾驶的十分之一以内

纯太阳能电车何时能实现，马斯克怎么看？

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

国产机器人也会空翻了！打破限制，世界首款！

走进深水区，和36氪一起画出AI行业的未来蓝图

这个机器人的手真的太灵活了！收纳、撸猫、修剪绿植样样都行，原速演示流畅程度堪比人类。这是星动纪

布鲁金斯学会高级研究员唐睿思：人工智能本质上是美国主导的算力霸权

大疆前高管带6人创业，做出了类目Top1的割草机器人

Google 搜索诞生 25 年来最大更新之一，用 AI 把搜索重做一遍。通过视频直接提问，看看

2024投什么？先来看看人形机器人吧｜钛媒体创投家

20%的杨幂+80%的泰勒长什么样？全新风格化AI来了，可兼容SD

AI时代，谁还没用AI智能硬件提升工作效率？

斯坦福团队被曝抄袭清华系大模型，已删库跑路

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

太丢人！斯坦福团队承认抄袭中国大模型！核心证据来自2300多年前

3分钟带你看遍IPF大会十年黑科技，迈向AI+新时代

论文 Figure 不堪入目，句子啰嗦读不通……这几个在线科研工具可以免费用了

一个名为 GPT-2 聊天机器人的据称 1.5B 参数模型已经发布，所有人都惊呆了！！

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

何小鹏：智能驾驶的事故率是人工驾驶的十分之一以内

纯太阳能电车何时能实现，马斯克怎么看？

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

国产机器人也会空翻了！打破限制，世界首款！

走进深水区，和36氪一起画出AI行业的未来蓝图

这个机器人的手真的太灵活了！ 收纳、撸猫、修剪绿植样样都行，原速演示流畅程度堪比人类。 这是星动纪

布鲁金斯学会高级研究员唐睿思：人工智能本质上是美国主导的算力霸权

大疆前高管带6人创业，做出了类目Top1的割草机器人

Google 搜索诞生 25 年来最大更新之一，用 AI 把搜索重做一遍。 通过视频直接提问，看看

2024投什么？先来看看人形机器人吧｜钛媒体创投家

20%的杨幂+80%的泰勒长什么样？全新风格化AI来了，可兼容SD

AI时代，谁还没用AI智能硬件提升工作效率？

斯坦福团队被曝抄袭清华系大模型，已删库跑路

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

太丢人！斯坦福团队承认抄袭中国大模型！核心证据来自2300多年前

3分钟带你看遍IPF大会十年黑科技，迈向AI+新时代

论文 Figure 不堪入目，句子啰嗦读不通……这几个在线科研工具可以免费用了

这个机器人的手真的太灵活了！收纳、撸猫、修剪绿植样样都行，原速演示流畅程度堪比人类。这是星动纪

Google 搜索诞生 25 年来最大更新之一，用 AI 把搜索重做一遍。通过视频直接提问，看看