打开网易新闻 查看更多图片

新智元报道

编辑:桃子 乔杨

【新智元导读】ChatGPT横空出世以来,首次迎来界面史诗级升级!全新canvas界面,开启了人类与AI协作研究、编码的新时代,更代表着终极AGI人机交互形态。

时隔两年,ChatGPT终迎来界面全新升级!

这一次,OpenAI官宣推出canvas。它不再是简单的对话框,而是能与ChatGPT「并肩作战」的全新界面。

不论是写作,还是编码,都可以开启全新的合作方式。

打开网易新闻 查看更多图片

canvas基于GPT-4o构建,目前仍在测试阶段,可在所有模型中手动选择。

打开网易新闻 查看更多图片

而且所有Plus用户不用等待,直接可用。未来,OpenAI还计划向所有免费用户全面推出。

打开网易新闻 查看更多图片

canvas不仅可以让你与ChatGPT一起做研究,还能写代码、邮件等等,最重要的是还能帮你一起脑洞。

有趣的是,canvas还可以添加emoji。奥特曼在线发起投票,看看有多少人喜欢这个功能。

打开网易新闻 查看更多图片

另外,canvas面板中,还多了一个快捷菜单,让协作更加轻易便捷了。

审查代码、修改bug、添加评论、log等等,一键完成。

打开网易新闻 查看更多图片

在Canvas界面助力下,GPT-4o编码性能飞跃18%!

打开网易新闻 查看更多图片

这是要纷纷取代了GitHub Copilot、Cursor编码神器了。网友们惊叹道,OpenAI绝杀了Cursor。

打开网易新闻 查看更多图片

还有人说,canvas的推出,是OpenAI对最大劲敌Anthorpic的Claude artifacts最大的回击。

在经历如此巨大人事变动同时,OpenAI近日多次发布更新,是向外界、投资者给出了我们依旧有实力的反馈。

话不多说,看看历经两年,ChatGPT究竟带了怎样划时代的巨变。

打开网易新闻 查看更多图片

肝代码研究,原来这么轻松

canvas项目负责人Karina Nguyen表示,我对终极AGI界面的愿景,是一张空白的画布。

随着时间的推移,它会根据人类偏好,自我改进。

打开网易新闻 查看更多图片

而且,它会创造与人类互动的新方式,重新定义人类与AI,以及整个互联网的联系。

canvas便是,这样一种终极AGI界面的完美「代言人」。

打开网易新闻 查看更多图片

那么,它究竟如何帮人类研究、写代码、创作呢?

接下来,让我们一睹为快。

做研究

当你需要完成一项艺术史研究报告,在canvas便可以完成研究。

首先,将你的需求告诉ChatGPT,它便开始搜索一切所有相关的报道——Rembrandt的自画像技巧。

随之,canvas在屏幕右侧开启了全新界面,一篇研究报告,正在速成。

打开网易新闻 查看更多图片

当你对其中生成的一句话,不太确定是否正确。只需要选中,然后即刻就能唤醒ChatGPT,随地取问。

打开网易新闻 查看更多图片

又或者,当你想要更改文中的小标题,不如让ChatGPT给点建议。

打开网易新闻 查看更多图片

最惊艳的是,右下角「铅笔」样子的图表,可以开启文献的阅读模式,可以一句一句地浏览。

打开网易新闻 查看更多图片

最后,你可以让ChatGPT为你添加参考文献、书目引用。

打开网易新闻 查看更多图片

写邮件

你还可以让ChatGPT搜索一家最好的餐厅,它会帮你汇总所有在SF城市米其林餐厅。

打开网易新闻 查看更多图片

然后让它在为你写一封邮件,发给最好的朋友。

打开网易新闻 查看更多图片

写代码

另外,你还可以在canvas界面中,完成代码的生成,还是可以编辑的那种。

以往ChatGPT只是给出结果,并不能一同编辑。

让ChatGPT用Rust写一API网络服务器,它便同以往一般,为你生成了代码。

打开网易新闻 查看更多图片

然后,要求对其中一段代码,添加登录注册路由。

并且,你还可以自己改写其中的内容。

打开网易新闻 查看更多图片

在界面右下角,还有一个工具栏,可以进行代码审查、转换语言、修改bug、添加log、还有添加评论功能。

打开网易新闻 查看更多图片

比如,针对刚刚生成代码进行审查,以及修复bug,ChatGPT瞬间就完成了。

打开网易新闻 查看更多图片

发明新食谱

更惊艳的是,在canvas模式下,还可以创造发明新的idea。

比如,你想做一个不一样的苹果派,可以让ChatGPT搜索总结出,最通用的苹果派的食谱。

打开网易新闻 查看更多图片

假设你没有其中一种材料——Nutmeg(肉豆蔻),然后你们可以一同创作全新的做法。

打开网易新闻 查看更多图片

与ChatGPT并肩作战

目前,ChatGPT已常被用于协助写作和编码方面的任务。

尽管聊天界面易于使用并且适用于许多任务,但对于需要编辑和修订的项目,仍然有些不便。

canvas的推出,正是要为这类工作提供新的界面,而且能让ChatGPT更好地理解用户提供的任务上下文。

当ChatGPT检测到可能有帮助的场景时,canvas会自动打开,也可以直接在提示词中包含「使用canvas」的字样来处理现有项目。

打开网易新闻 查看更多图片

对于写作任务,快捷编辑栏中包含5种选项,从下至上依次为:

打开网易新闻 查看更多图片

- 建议编辑:ChatGPT为指定内容提供内联建议和反馈

- 调整长度:将文字内容编辑得更短或更长

- 更改阅读级别:调整文字的阅读难度,从幼儿园到研究生院

- 最后润色:检查语法、清晰度和一致性

- 添加表情符号:为强调或有颜色标记的内容添加相关emoji符号

比如,可以高亮特定部分来引起ChatGPT的关注,并让模型在考虑整个项目的同时,提供内联反馈和建议。

打开网易新闻 查看更多图片

奥特曼还发起了在线投票,「添加emoji是不是OpenAI有史以来发布的最好功能?」

打开网易新闻 查看更多图片

对于编码任务,快捷键又和写作不同:

打开网易新闻 查看更多图片

快捷键从下至上依次为:

- 检查代码:ChatGPT提供内联建议以改进代码

- 添加日志(logs):插入print语句以帮助调试和理解代码

- 添加注释:为代码添加注释

- 修复bug:检测并重写有问题的代码以解决bug

- 移植到一种语言:将您的代码转换为JavaScript、TypeScript、Python、Java、C++或PHP

「点到哪里改哪里」,修改代码也将和修改文字一样直观简单。

打开网易新闻 查看更多图片

为什么要更新用户界面?

OpenAI在博客中表示,如果要让人工智能变得更有用、更易用,就需要重新思考我们如何与它互动。而canvas,就是一种全新的方法,未来还将经历快速迭代。

终极AGI界面canvas,GPT-4o也被优化了

为了让模型更适应canvas模式,团队也对GPT-4o进行了必要的修法,添加了一些核心行为:

- 触发canvas的打开,进行书写和编码

- 生成多样化的内容类型

- 进行有针对性的编辑

- 重写文档

- 提供内联形式的修改意见

值得一提的是,对GPT-4o进行的这些训练采用了OpenAI的合成数据生成技术,包含了从o1模型中提取的输出。

打开网易新闻 查看更多图片

此外,团队还使用了20多项自动内部评估来衡量进展情况。

首先,一个关键的挑战是定义何时触发canvas。模型既需要灵敏识别有检查、修改需求的任务,比如「写一篇关于咖啡豆历史的博客文章」,同时也要避免过度触发,比如「帮我做一份新的晚餐食谱」这种一般的任务就不太需要canvas。

打开网易新闻 查看更多图片

与带有提示指令的基线模型相比,调整后的GPT-4o的触发决策正确率分别达到了83%和94%

第二个挑战涉及在canvas被触发后调整模型的编辑行为,特别是决定何时进行有针对性的编辑而不是重写整个内容。

这就要训练模型,在用户明确选择文本时,更倾向于执行有针对性的编辑而非重写。随着模型不断完善,这种行为的能力也在不断发展。

打开网易新闻 查看更多图片

相比基线模型,带有canvas的GPT-4o在写作和编码任务上有18%的性能提升

最后,训练模型以生成高质量的代码注释同样需要细致的迭代过程。

这个评估任务与前两种情况不同。canvas是否触发以及是否进行了有针对性的编辑行为,很容易进行自动化评估,但以自动化方式衡量代码注释的质量,因此团队选择了人工评估。

相比基线模型,集成canvas后的GPT-4o在注释准确性方面有30%的提升,质量提高了16%。

这表明,与带有详细指令的零样本提示相比,合成数据的训练显著提高了模型的响应质量和行为。

打开网易新闻 查看更多图片

网友玩疯了

canvas一经发布,已在全网掀起热议。

Every初创公司创始人表示,很明显,OpenAI不仅仅是在构建聊天机器人,他们还试图为AI时代构建一种全新的操作系。

打开网易新闻 查看更多图片

一名开发者表示,canvas界面是游戏改变者。

他刚刚通过canvas和ThreeJS一起创建了一个tesseract/Hypercube可视化工具,并称自己喜欢统一的UX聊天、在线评论和观看GPT-4o在代码上发挥其魔力,所有这些都在一个地方完成完成,永不过时。

打开网易新闻 查看更多图片

打开网易新闻 查看更多图片

还有网友表示,canvas界面做的非常好,而且一切都是实时流畅的。

不过,它让我们意识到一个重要的问题,我们还不确定与AI协作写作的最佳方式是什么。

话虽如此,canvas让工作更加集成集成(cyborglike),而不是简单地轮流进行任务(centaurlike)。

打开网易新闻 查看更多图片

打开网易新闻 查看更多图片

还有人纷纷悼念Cursor。

打开网易新闻 查看更多图片

核心贡献团队

canvas背后核心团队也随之全部公布。

研究主管是Karina Nguyen,还有3位核心研究人员Kai Chen, Michael Wu, Tarun Gogineni,12位核心工程/产品/设计师。

值得一提的是,提供支持技术领导人当中,还有离职的CTO Mira Murati。

打开网易新闻 查看更多图片

Karina Nguyen

打开网易新闻 查看更多图片

在加入OpenAI之前,Karina Nguyen曾在Anthropic任职,专注研究模型对齐能力和诚实研究,以减少LLM的幻觉。

值得一提的是,她曾领到了Claude Instant 1.2训练,在API中制作了该模型。

此前,作为一名设计工程师,Nguyen与Primer.ai、Dropbox、Square和《纽约时报》的团队在研发原型、新闻工具和产品功能方面进行了合作。

Kai Chen

打开网易新闻 查看更多图片

Kai Chen在宾夕法尼亚大学获得了计算机科学本科学士学位。

她于2023年初加入OpenAI,此前Kai Chen还联合创办了两家公司,一个是AI助手领域的Dispatch、还有一家自动化劳动任务项目的Port Tecjnologies。

Michael Wu

打开网易新闻 查看更多图片

Michael Wu目前是OpenAI的应用研究员。

此前,他曾以应用研究科学家身份,在Facebook工作了三年,任职期间训练了自然语言理解和深度学习模型。

此外,他还在Primer AI担任机器学习工程师、Dropbox担任软件工程师,在Naver Corp担任机器学习实习生,在苹果公司担任机器学习实习生。

2015年,Michael Wu在麻省理工学院获得了计算机科学和数学学士学位。

参考资料:

https://openai.com/index/introducing-canvas/

https://x.com/karinanguyen_/status/1841889811931791642