o1推理将用于图像理解，OpenAI在伦敦捅了开发者窝

西风发自凹非寺
量子位 | 公众号 QbitAI

OpenAI在Cursor里用o1-mini现场捏应用，两分钟，直接控制无人机飞行。

引得台下观众传来阵阵惊呼：

如此操作，刚刚发生在OpenAI伦敦开发者日活动上。作为OpenAI的“科技春晚”，真是好不热闹，现场挤满了人从众。

OpenAI产品部负责人Olivier Godement还剧透了一波o1新功能——

包含功能调用、开发者消息、流媒体、结构化输出、图像理解5个方面。

奥特曼在之后的问答环节表示不想剧透，但透露“图像模型将很快迎来显著提升”。他提到，复制现有模型并不难，而让他为OpenAI感到自豪的是，他们始终在创造新的突破。

网友们听到这里更兴奋了：

不确定他指的是图像生成还是图像分析，还是两者都有。但想象一下用图像token进行推理。如果你面临一个视觉问题，或许可以逐步地把问题可视化。我目前还没有在其它模型中真正看到过类似的功能。

OpenAI要在图像方面发力其实也早有迹可循。

不久前，两位清华校友路橙、宋飏就在OpenAI发布最新图像生成研究。

他们简化了一致性模型，仅用两步采样，就能使生成质量与扩散模型相媲美，速度是扩散模型的50倍。

此外，对于OpenAI所说的图像模型，还有人猜测不会是前几天登顶文生图竞技场的爆火神秘小熊猫（red_panda）吧？

但这种说法很快就被否定了。

小熊猫背后团队Recraft AI已发推文认领，这是他们的新模型recraft-v3。

总之，o1这次算是吊足了大伙儿的胃口，网友喊话赶紧发4.5o和5-preview：

虽然很棒，但现在仍没有一款编码能打Sonnet的模型。

奥特曼还说了啥

在现场，奥特曼还被问到OpenAI的发展方向是更像o1这样的模型，还是会有更大规模的模型？

他表示想在各方面都变得更好，但推理模型的发展对OpenAI尤其重要。

我认为推理能力将解锁我们多年来期望实现的许多事情，比如在新科学领域做出贡献，或帮助编写非常复杂的代码，这些都会带来显著的推动。所以，大家应该期待o系列模型会快速改进，这对我们来说具有重要的战略意义。

在谈论到“什么是Agent”、“它们可以做什么”，奥特曼表示Agent是一个可以接受长期执行任务，并在执行过程中只需很少监督的东西。

奥特曼认为大家最常举的一个例子是可以让Agent帮忙预订餐厅，它可以用在线餐厅预订平台OpenTable或者是直接打电话到餐厅。

这确实能为人们减少一些工作，但更有趣的事是能创造一个世界，在那里可以做一些人类无法或不愿做的事。

比如与其让Agent打电话给餐厅预订座位，不如让Agent打给300家，找到最好吃或是最有特色的那一家，它可以并行处理大量任务。

Agent成为一个非常聪明的高级同事，你可以和它在项目上协作，也可以让它独立去做两天甚至两周的任务，做好后带着成果回来与你交流。

接下来，奥特曼还被问到最敬重的竞争对手是哪个，他提到的第一个就是Cursor AI，但随后又补充道：

我的意思是，我现在有点尊敬这个领域里的每个人。我认为整个领域正在涌现出非常了不起的工作，而且有许多才华横溢、非常努力的人。我不是想回避问题，而是想说我可以指出很多非常厉害的人在做非常出色的工作。

要知道，昨天微软刚刚宣布了GitHub Copilot接入Claude和Gemini。

奥特曼转头给了微软竞争对手Cursor AI一个点赞……

此外，奥特曼还被问到最令人兴奋的AI应用场景是什么，他再次Q到Agent：

大家关注的点各不相同，有很多不同的方式可以解决这个问题，但我希望能有一种AI能够理解你整个人生。它不一定需要拥有无限的上下文，但能够有一个AI Agent，某种程度上知道关于你的一切，能够访问你所有的数据之类的东西。

奥特曼还认为大模型的大多数缺点将在未来几代中逐步消失。

不要构建一个填补漏洞或绕过模型缺陷的工具，而是构建一个能利用未来优势的模型。

One More Thing

除了预告，OpenAI还有最新动作——

开源了一个评估语言模型回答简短、事实性问题能力的新基准，名为SimpleQA。

论文共同一作是去年在X上约战提示词决斗引得大伙儿纷纷围观的Jason Wei（思维链开山论文一作）和Karina Nguyen（提示词决斗那会儿还在Anthropic，现已是OpenAI工程师）。

有意思的是，o1-mini和o1-preview在此基准上都不及格，而且两者相差还很大：

参考链接：
[1]https://twitter.com/idonotwritecode/status/1851565982889713962
[2]https://twitter.com/stevenheidel/status/1851574257819562195
[3]https://x.com/kimmonismus/status/1851708364503552312
[4]https://twitter.com/OpenAI/status/1851680760539025639
[5]https://twitter.com/AymericRoucher/status/1851657127410151461
[6]https://www.youtube.com/watch?v=VTeRZqUHi4E
[7]https://x.com/caromcc_/status/1851570587287601237

o1推理将用于图像理解，OpenAI在伦敦捅了开发者窝

奥特曼还说了啥

One More Thing

微软万引理论大佬跳槽OpenAI！入职第一天：这里人才密度简直疯了

o1驾驶无人机后空翻，OpenAI开发者日惊掉下巴！2分钟爆改代码写App

刚刚！ChatGPT正式成为AI搜索，免费可用

肌肉骨骼居然和人类一样。外网爆火的克隆机器人，灵活性超高，胸腔里还复刻了人类的心脏瓣膜，宛如《西部世

搭载ChatGPT的《星际穿越》机器人爆火，马斯克：想要！ ChatGPT复刻版《星际穿越》机器人T

“全面拟人”机器人来了！直膝行走，狂踹不倒

不会写代码全交给AI，它能写出完整的APP吗？这是我们的测试结果

字节AI版小李子一开口：黄风岭，八百里

全世界跑得最快的人形机器人，还能跳科目三都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

网友一个定积分的WIFI密码，测出了AI数学之王。Grok超强数学思维碾压ChatGPT，引马斯克点

告别屈膝小碎步让机器人像人一样走路国产团队造出“钢铁侠”

全球最远1.4米！国产宇树创人形机器人跳远纪录，外网惊叹碾压特斯拉

波士顿动力电驱机器人进厂打工，全程自主无遥控，50万人在线围观

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

人形机器人狂奔！山地、草地、公路无障碍，原速演示全程高能

“全面拟人”机器人来了！直膝行走，狂踹不倒，互动聊天超自然 “全面拟人”的机器人Orca Ⅰ来了！不

机器人身穿衣服做家务被质疑！来自OpenAI押注的独角兽因过于逼真被怀疑是真人套壳——人形机器人初

大疆前高管带6人创业，做出了类目Top1的割草机器人

Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

什么影响大模型安全？NeurIPS'24新研究提出大模型越狱攻击新基准

o1推理将用于图像理解，OpenAI在伦敦捅了开发者窝

奥特曼还说了啥

One More Thing

微软万引理论大佬跳槽OpenAI！入职第一天：这里人才密度简直疯了

o1驾驶无人机后空翻，OpenAI开发者日惊掉下巴！2分钟爆改代码写App

刚刚！ChatGPT正式成为AI搜索，免费可用

肌肉骨骼居然和人类一样。外网爆火的克隆机器人，灵活性超高，胸腔里还复刻了人类的心脏瓣膜，宛如《西部世

搭载ChatGPT的《星际穿越》机器人爆火，马斯克：想要！ ChatGPT复刻版《星际穿越》机器人T

“全面拟人”机器人来了！直膝行走，狂踹不倒

不会写代码全交给AI，它能写出完整的APP吗？这是我们的测试结果

字节AI版小李子一开口：黄风岭，八百里

全世界跑得最快的人形机器人，还能跳科目三 都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

网友一个定积分的WIFI密码，测出了AI数学之王。Grok超强数学思维碾压ChatGPT，引马斯克点

告别屈膝小碎步 让机器人像人一样走路 国产团队造出“钢铁侠”

全球最远1.4米！国产宇树创人形机器人跳远纪录，外网惊叹碾压特斯拉

波士顿动力电驱机器人进厂打工，全程自主无遥控，50万人在线围观

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

人形机器人狂奔！山地、草地、公路无障碍，原速演示全程高能

“全面拟人”机器人来了！直膝行走，狂踹不倒，互动聊天超自然 “全面拟人”的机器人Orca Ⅰ来了！不

机器人身穿衣服做家务被质疑！来自OpenAI押注的独角兽 因过于逼真被怀疑是真人套壳——人形机器人初

大疆前高管带6人创业，做出了类目Top1的割草机器人

Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

什么影响大模型安全？NeurIPS'24新研究提出大模型越狱攻击新基准

全世界跑得最快的人形机器人，还能跳科目三都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

告别屈膝小碎步让机器人像人一样走路国产团队造出“钢铁侠”

机器人身穿衣服做家务被质疑！来自OpenAI押注的独角兽因过于逼真被怀疑是真人套壳——人形机器人初