4o-mini只有8B，o1也才300B！微软论文意外曝光GPT核心机密

微软又把OpenAI的机密泄露了？？在论文中明晃晃写着：

o1-preview约300B参数，GPT-4o约200B，GPT-4o-mini约8B……

英伟达2024年初发布B200时，就摊牌了GPT-4是1.8T MoE也就是1800B，这里微软的数字更精确，为1.76T。

除此之外，论文中给OpenAI的mini系列，Claude3.5 Sonnet也都附上了参数，总结如下：

o1-preview约300B；o1-mini约100B
GPT-4o约200B；GPT-4o-mini约8B
Claude 3.5 Sonnet 2024-10-22版本约175B
微软自己的Phi-3-7B，这个不用约了就是7B

虽然论文中后面也有免责声明：

确切数据尚未公开，这里大部分数字是估计的。

但还是有不少人觉得事情没这么简单。

比如为什么唯独没有放谷歌Gemini模型的参数估计？或许他们对放出来的数字还是有信心的。

也有人认为，大多数模型都是在英伟达GPU上运行的，所以可以通过token生成速度来估计。

只有谷歌模型是在TPU上运行的，所以不好估计。

而且微软也不是第一次干这事了。

23年10月，微软就在一篇论文里“意外”曝出GPT-3.5-Turbo模型的20B参数，在后续论文版本中又删除了这一信息。

就说你是故意的还是不小心的？

微软这篇论文说了什么

实际上，原论文介绍了一项与医学相关的benchmark——MEDEC。

12月26日就已经发布，不过是比较垂直领域的论文，可能非相关方向的人都不会看，年后才被列文虎克网友们发现。

研究起因是，据美国医疗机构调查显示，有1/5的患者在阅读临床笔记时报告发现了错误，而40%的患者认为这些错误可能影响他们的治疗。

而且另一方面，LLMs(大语言模型）被越来越多的用于医学文档任务（如生成诊疗方法）。

因此，MEDEC此番有两个任务。一是识别并发现临床笔记中的错误；二是还能予以改正。

为了进行研究，MEDEC数据集包含3848份临床文本，其中包括来自三个美国医院系统的488份临床笔记，这些笔记之前未被任何LLM见过。

它涵盖五种类型的错误（诊断、管理、治疗、药物治疗和致病因子），这些错误类型是通过分析医学委员会考试中最常见的问题类型选择的，并由8位医疗人员参与错误标注。

而参数泄露即发生在实验环节。

按照实验设计，研究者将选取近期主流的大模型和小模型来参与笔记识别和纠错。

而就在介绍最终选定的模型时，模型参数、发布时间一下子都被公开了。

对了，省去中间过程，这项研究得出的结论是：Claude 3.5 Sonnet在错误标志检测方面优于其他LLM方法，得分为70.16，第二名是o1-mini。

网友：按价格算合理

每一次，ChatGPT相关模型架构和参数泄露，都会引起轩然大波，这次也不例外。

23年10月，微软论文声称GPT-3.5-Turbo只有20B参数的时候，就有人感叹：难怪OpenAI对开源模型这么紧张。

24年3月，英伟达确认GPT-4是1.8T MoE，而2000张B200可以在90天内完成训练的时候，大家觉得MoE已经且仍将是大模型架构趋势。

这一次，基于微软估计的数据，网友们主要有几个关注点：

如果Claude 3.5 Sonnet真的比GPT-4o还小，那Anthropic团队就拥有技术优势。

以及不相信GPT-4o-mini只有8B这么小。

不过此前也有人根据推理成本来算，4o-mini的价格是3.5-turbo的40%，如果3.5-turbo的20B数字准确，那么4o-mini刚好是8B左右。

不过这里的8B也是指MoE模型的激活参数。

总之，OpenAI大概是不会公布确切数字了。

此前奥特曼征集2024年新年愿望，最后公布的清单中还有“开源”。2025年的最新版本里，开源已经被去掉了。

论文地址：
https://arxiv.org/pdf/2412.19260

4o-mini只有8B，o1也才300B！微软论文意外曝光GPT核心机密

微软大手笔！本财年拟豪掷800亿美元建AI数据中心其中一半投向美国

斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手

程序员的AI救赎时刻接入这个数据库业务提问自动解决

人形机器人组队进厂打工！5只Figure 02在宝马工厂

商汤科技董事长兼CEO 徐立打脸时刻就是AI的超级时刻

我用两年聊天记录，复刻出一个AI版的自己

AI如何改变社交娱乐新姿势？阿里云AI专家解读来了

AI如何解锁企业办公新模式？阿里云AI专家解读来了

人大打造角色扮演能力数据集，包含85个角色和14000段对话数据

合成数据的突破: 从降低迎合性偏差到认知自主性的重构

AGI-Eval团队：AI视频生成模型年度横评，国产模型仍然领先！

OpenAI最大秘密，竟被中国研究者破解？复旦等惊人揭秘o1路线图

多模态大语言模型空间智能新探索：单图或一句话，生成3D建模代码

北京“追新”破题：昔日独角兽都成“顶梁柱”，人形机器人变身“北京人”

大模型可视化工具爆火，GPT推理过程一目了然

微软意外泄露OpenAI核心机密：GPT-4o-mini只有80亿参数

苹果微软特斯拉，最大股东都是它！

Xbox总裁不墨守成规

“科技春晚”CES来袭！聚焦四大看点：英伟达或进军AI PC市场，AI眼镜将站“C位”

AMD“硬刚”英伟达！

4o-mini只有8B，o1也才300B！微软论文意外曝光GPT核心机密

微软大手笔！本财年拟豪掷800亿美元建AI数据中心 其中一半投向美国

斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手

程序员的AI救赎时刻 接入这个数据库 业务提问自动解决

人形机器人组队进厂打工！5只Figure 02在宝马工厂

商汤科技董事长兼CEO 徐立 打脸时刻 就是AI的超级时刻

我用两年聊天记录，复刻出一个AI版的自己

AI如何改变社交娱乐新姿势？阿里云AI专家解读来了

AI如何解锁企业办公新模式？阿里云AI专家解读来了

人大打造角色扮演能力数据集，包含85个角色和14000段对话数据

合成数据的突破: 从降低迎合性偏差到认知自主性的重构

AGI-Eval团队：AI视频生成模型年度横评，国产模型仍然领先！

OpenAI最大秘密，竟被中国研究者破解？复旦等惊人揭秘o1路线图

多模态大语言模型空间智能新探索：单图或一句话，生成3D建模代码

北京“追新”破题：昔日独角兽都成“顶梁柱”，人形机器人变身“北京人”

大模型可视化工具爆火，GPT推理过程一目了然

微软意外泄露OpenAI核心机密：GPT-4o-mini只有80亿参数

苹果 微软 特斯拉，最大股东都是它！

Xbox总裁不墨守成规

“科技春晚”CES来袭！聚焦四大看点：英伟达或进军AI PC市场，AI眼镜将站“C位”

AMD“硬刚”英伟达！

微软大手笔！本财年拟豪掷800亿美元建AI数据中心其中一半投向美国

程序员的AI救赎时刻接入这个数据库业务提问自动解决

商汤科技董事长兼CEO 徐立打脸时刻就是AI的超级时刻

苹果微软特斯拉，最大股东都是它！