昨晚,OpenAI的核心高管团队在Reddit上做了一轮AMA(ask me anything),内容涉及刚刚发布的ChatGPT search,o1,Sora,未来的GPT-5,Agent等进展,以及团队人才流失、前首席科学家ilya等诸多问题。
以下按照提问顺序编译:
网友:计划从现在开始继续发布 o 系列型号吗?改进“常规”型号,例如 gpt 3、4、4o、5。两者或两者的组合
Kevin Weil:两者都是!我预计在某个时候它们会融合在一起。
网友:不过说真的——伊利亚看到了什么?
萨姆·奥尔特曼:超越的未来。
ilya 是一个令人难以置信的梦想家,他比几乎任何人都更清楚地看到未来。他早期的想法、激情和远见对于我们所做的很多事情都至关重要,例如,他是最终成为 o1 的一些想法的主要初始探索者和拥护者之一。
这个领域非常幸运有他。
网友:
1、到目前为止,您在实践中见过的 ChatGPT 的最佳用例是什么?
2、您认为它和它的未来版本(未来几年)在哪些领域会特别有用?
萨姆·奥尔特曼:
1、有很多伟大的故事,但是人们找出使人衰弱的疾病的原因然后完全治愈的故事才是真正令人敬畏的。
2、也有很多,但成为一名真正优秀的软件工程师的能力仍然感觉被严重低估。更普遍地说,帮助科学家更快地发现新知识的能力将是如此伟大。
网友:ChatGPT 生日那天有什么特别的礼物吗?
Kevin Weil:GPU!
网友:您会使用 ChatGPT 来回答这些问题吗?
萨姆·奥尔特曼:有时候,是的。
你能说出来吗?
网友:要做一个提示词:用全部小写字母写 sama(萨姆·奥尔特曼不喜欢用大写字母)
网友:你们什么时候能给我们一个新的文本到图像模型?Dalle 3 有点过时了
萨姆·奥尔特曼:下一次更新值得等待!但我们还没有发布计划。
网友:chatgpt-5 或同等版本发布日期如何?其功能有哪些?
萨姆·奥尔特曼:今年晚些时候我们会发布一些非常精彩的作品!
不过,我们不会将其称为 GPT-5。
网友:长期目标(在完美的世界中)是关于成年用户是否可以根据需要切换“nsfw(无内容审查的)”内容(在合理范围内)?
萨姆·奥尔特曼:我们完全相信要像对待成年人一样对待成年用户。但要做到这一点需要做大量的工作,而且现在我们有更紧迫的任务。希望有一天能做到这一点!
网友:AGI 是否可以用已知的硬件实现,还是需要一些完全不同的东西?
萨姆·奥尔特曼:我们相信,通过目前的硬件,这是可以实现的。
网友:是否有计划为发布商添加集成功能以验证和注册账户,让他们能够看到自己在 ChatGPT 中的表现?理想情况下,他们可以看到自己被引用的方式和频率。
萨姆·奥尔特曼:这是个好主意!我们会讨论的。不过目前还没有计划。
网友:ChatGPT 最终能独立执行任务吗?先给你发消息?
Kevin Weil:我认为这将成为 2025 年的一个大主题。
网友:近年来,OpenAI 已从更开放源代码的方式转向更封闭的模式。您能详细解释一下这种变化背后的原因吗?您如何权衡开放性与广泛使用的先进 AI 技术带来的潜在风险之间的权衡?从长远来看,强大的模型最终落入坏人之手是不可避免的吗?
萨姆·奥尔特曼:我认为开源在生态系统中发挥着重要作用,世界上有很多伟大的开源模式。
我们还认为,强大且易于使用的 API 和服务在世界上发挥着重要作用,并且鉴于我们的优势,我们看到了一种更简单的方法来达到我们想要达到的安全阈值。我们为人们从我们的服务中获得如此多的价值感到非常自豪。
我希望我们将来能够开源更多的东西。
网友:大家好,OpenAI 团队,感谢你们举办这次 AMA。我的问题是关于 SearchGPT 与流行搜索引擎相比的价值。SearchGPT 有哪些独特优势或关键差异化因素值得普通搜索引擎用户选择?
萨姆·奥尔特曼:对于许多查询,我发现它是一种更快/更容易获取我正在寻找的信息的方法。我认为我们会看到这一点,特别是对于需要更复杂研究的查询。我也期待未来搜索查询可以动态地呈现自定义网页作为响应!
网友:我们是否会看到 Advance Voice 在某些时候放宽对音乐能力(如唱歌)的限制?有时间表吗?
Kevin Weil:正在努力!我也想听 ChatGPT 唱歌。
网友:我们能否找到一种无需动手即可结束 ChatGPT 语音对话的方法?使用 iPhone 上的操作按钮快捷方式,但每次都需要手动关闭语音聊天。
Kevin Weil:我喜欢这个想法。现在就与团队分享!
网友:总体来说没有什么问题。只是想感谢你们——有了 GPT,上大学和工作真的变得更容易了!
Kevin Weil:太棒了,我们喜欢听到这个消息!这比你知道的更重要,因为我们每天都在关注那些不工作的部分——知道它们什么时候工作是件好事 :)
网友:您好,我想问一下 GPT4o 的 token context 字段什么时候会增加。在我看来,与其他 AI 模型相比,32k 太小了,尤其是对于较长的编码或写作任务来说。
Kevin Weil:同意。我们正在努力!
网友:完整版 o1 什么时候发布?
Kevin Weil:(表情包:很快)
网友:幻觉会成为永久特征吗?为什么即使是 o1-preview,当接近“想法”的结尾时,幻觉也会越来越多?
您将如何处理现在不再“真实”的旧数据(即使是 2 年前的数据)?持续训练模型还是进行某种垃圾收集?这是真实性方面的一个大问题。
Mark Chen :我们非常重视减少幻觉,但这从根本上来说是一个难题——我们的模型从人类书写的文本中学习,而人类有时会自信地说出他们不确定的事情。
我们的模型在引用方面正在不断进步,这使得它们的答案有可信的来源作为依据,而且我们也相信 RL 也将有助于解决幻觉问题 —— 当我们可以通过编程检查模型是否产生幻觉时,我们可以奖励它不这样做。
网友:你们有计划增加 ChatGPT 可以存储的内存吗?
Kevin Weil:你是指更长的上下文窗口吗?如果是的话,没错。
网友:我很好奇,为什么你们所有的名字都正确大写,除了“sam altman - ceo”全部用小写字母?
Kevin Weil:这是 Sam 的风格。
网友:什么时候会增加 Plus 版本中的上下文窗口?
Kevin Weil:正在努力!我很期待更长的上下文。
网友:对那些有志为人工智能革命做出贡献的年轻人有什么建议吗?
Kevin Weil:我的建议是:每天开始使用它。用它来教你东西,学习你想学的任何东西——编码、写作、产品、设计,任何东西。如果你能比别人学得更快,那么你就能做任何事情。
Srinivas Narayanan:使用人工智能工具来提高您日常工作的效率 - 这将带来有趣的想法。然后构建一些有趣的东西并与他人分享。
网友:一旦实现了 AGI,您最想将它应用到什么地方?那一刻的快速拨号上是否有特定的领域?
Srinivas Narayanan:我希望它能加速科学发现。我个人对健康/医学非常感兴趣。
网友:你见过的最佳个人助理工作流程是什么?
Srinivas Narayanan:其中两个对我来说非常有趣:
1/ 使用它来总结医疗报告并帮助你向医生提出正确的问题。
2/ 人们上传他们的知识来创建其他人可以使用的自定义 GPT(我的朋友和家人上传了课程笔记或旅行建议)——我认为这作为一个用例仍然没有得到充分重视和充分利用。
网友:我们何时能获得有关 GPT4o 图像和 3D 模型生成的更多信息?
Mark Chen:很快!
网友:最喜欢的书?
Srinivas Narayanan:我很喜欢 Max Tegmark 的《生命 3.0》——尽管我并不同意他关于人工智能的所有观点。
萨姆·奥尔特曼:有很多,但我首先想到的是《无限之始》和《悉达多》
网友:完整版 o1 真的比 o1 预览版有明显改进吗?
Srinivas Narayanan:是的。
网友:有没有关于我们何时能获得 AVM(Advanced Voice Mode)愿景的时间表?为什么 GPT-5 花了这么长时间?完整的 o1 怎么样?
萨姆·奥尔特曼:我们正在优先发布o1和它的后继者。
所有这些模型都变得相当复杂,我们无法像我们希望的那样同时发布那么多东西。(我们还面临很多限制和艰难的决定,我们将计算分配给许多伟大的想法。)
尚未确定 AVM 视觉检查的日期。
网友:Sora 的延迟是因为推理所需的计算量/时间还是因为安全原因?
Kevin Weil:需要完善模型,需要正确处理安全性/模拟/其他事项,并且需要扩展计算!
网友:ChatGPT 搜索是否仍在使用 Bing 作为后台搜索引擎?
Srinivas Narayanan:我们使用一系列服务,Bing 是其中重要的一个
网友:什么时候会发布 ChatGPT 的相机模式?
Srinivas Narayanan:正在处理。还没有确定具体日期
网友:o1 将如何影响 LLM 的扩展?
您是否会继续按照扩展法则扩展 LLM,还是推理计算时间扩展意味着更小的模型和更快更长的推理将成为主要焦点?
Kevin Weil:这不是非此即彼的问题,而是两者兼而有之——更好的基础模型加上更多的草莓扩展/推理时间计算。
网友:这么多顶尖人才离开 openAI,您如何应对这种压力?这会增加额外的负担吗?我们距离通用人工智能 (AGI) 还有多远?
Srinivas Narayanan:虽然我们很遗憾失去了一些曾经密切合作的人,但我们拥有一支才华横溢的团队,最近也有许多新人加入了我们。我们继续发布,这真的很重要 :)
网友:chatgpt 有吉祥物吗?
Kevin Weil:
网友:为什么o1不支持图片输入?
Kevin Weil:我们专注于首先将其推向世界,而不是等待使其功能齐全。图像输入即将在 o1 中推出,总体而言,o 系列模型将在未来几个月内获得诸如多模态、工具使用等功能。
网友:问萨姆·奥尔特曼:你是草莓人吗?
萨姆·奥尔特曼:
网友:是否计划降低高级语音的 API 成本?
Kevin Weil:两年来,我们一直在降低 API 成本——我认为 GPT 4o-mini 的成本大约是原始 GPT-3 的 2%。预计语音和其他功能将继续保持这种状态!
网友:为了实现“思路链”或“多层思路树”,OpenAI 认为推理成本降低的速度有多快?从业务逻辑的角度来看,我们希望尽可能快速、廉价地执行推理链。
Srinivas Narayanan:我们预计推理成本将继续下降。如果你看看去年的趋势,就会发现它下降了 10 倍。
网友:GPT 产品线的下一个突破是什么?预计的时间表是怎样的?
萨姆·奥尔特曼:我们将会拥有越来越好的模型,但我认为下一个巨大突破将会是代理。
网友:你们每个人最喜欢哪种意大利面?
Kevin Weil:寿司。
顺便说一句,这个问题太棒了
网友:你可以给你的模型起更好的名字吗?
Kevin Weil:不。
网友:对 2025 年的大胆预测?
萨姆·奥尔特曼:满足所有基准。
网友:非常感谢您所做的一切,感谢您花时间回答我们的问题。我是一名医学博士,我对我们这个领域即将出现的事情感到非常兴奋。我想问一下,特别是在医学/健康领域,是否有计划使用特定的医学文献来训练新模型?目前有很多很棒的具体信息,但使用当前模型的普遍感觉是,它们是用不太具体的数据进行训练的。谢谢你,并祝贺你在过去几年取得的所有成就!
Kevin Weil:我喜欢这个想法!这个模型是否缺少了某些特定来源?我们也开始致力于使我们的企业产品符合 HIPAA 规定。
网友:是否有计划与欧盟进行谈判,以便欧盟用户能够更快地获得东西/不会变得简单?
萨姆·奥尔特曼:显然,我们将遵循欧盟政策。
我们都希望欧盟的政策越来越合理。强大的欧洲对世界来说很重要。
网友:OpenAI 的战略合作伙伴关系使普华永道等公司能够推动大型企业采用人工智能,您如何看待专业咨询公司在支持和采用生态系统中扮演的角色?
具体来说,精品 AI 支持公司可能存在哪些合作机会,可以补充大规模实施,同时让 OpenAI 继续专注于研究和创新?
Kevin Weil:我们愿意与企业建立合作伙伴关系,帮助企业更快地采用人工智能!电子邮件是我的姓名首字母缩写@
网友:当您发布 ChatGPT 时,有什么让您感到惊讶吗?
萨姆·奥尔特曼:最重要的是有多少人喜欢它。
该产品的早期版本是一个非常、非常幼稚的原型。现在它非常好,但当时肯定不是。它不太准确,没有很多功能,总是出问题,等等。
但人们发现它具有足够的价值并愿意坚持下去。
网友:除了英语之外,模型在其他语言方面如何改进?
Srinivas Narayanan:我们一直在改进其他语言的模型性能。与 4T 相比,gpt-4o 在标记化和总体质量方面有了显著的进步(请参阅https://openai.com/index/hello-gpt-4o/),我们希望保持这种趋势
网友:作为一名经验丰富的创始人和与许多人密切合作的人,您如何看待人工智能在创业过程中为创始人提供帮助?创业精神将因此发生哪些变化?
萨姆·奥尔特曼:我对此非常兴奋!
如果创始人的生产力可以提高 10 倍,我们就会拥有更多(更好的)初创企业。这在很多方面都比拥有 10 人创始团队更好(例如,协调开销更少)。
尽管生产率提高 10 倍还遥遥无期,但我相信它会发生。由此带来的总体经济加速,尤其是对初创企业而言,将是巨大的。
网友:今年会推出一些令人兴奋的事情吗?
Kevin Weil:鉴于您提出要求,我们今天早上在 ChatGPT 中推出了搜索功能 :)
今年我们还没有达到你期望的兴奋程度吗?!
网友:我们什么时候才能有更大的模型?openai 变得越来越小,越来越无趣了
Kevin Weil:你试过o1吗?
网友:您会添加更多的语音模型吗?
Kevin Weil:请问您想看到什么?
网友:别问,只管加速!
Kevin Weil:
网友:Sora 能处理视频输入吗?
Kevin Weil:是的!
网友:4o中的o和o1中的o一样 吗?
Kevin Weil:不!
网友:
问萨姆·奥尔特曼:你对未来五年人工智能在社会中的角色有何看法,尤其是 AGI 方面?哪些社会影响让你夜不能寐?
问Kevin Weil:ChatGPT 的搜索功能有哪些新功能或更新?有没有计划让它更直观或更具互动性?
问Mark Chen:在研究方面,您认为哪些领域将决定人工智能的下一个重大突破?您认为 OpenAI 在这些领域有何独特贡献?
问Srinivas Narayanan:随着高级语音功能的推出,哪些挑战或用户体验见解影响了他们的设计?有没有进一步扩展这一领域的计划?
问 Jakub Pachocki:从科学的角度来看,实现 AGI 的最大障碍是什么,您专注于哪些特定的研究领域来克服这些障碍?
Srinivas Narayanan:该模型可以处理中断,这在本质上是全新的。它也比以前的模型快得多。弄清楚如何将这些功能融入产品设计并非易事。
网友:应届毕业生是否应该优先学习有关 transformer 等的深层次知识,还是应该加入/创建一家初创公司,学习更多更高级的人工智能产品,如“代理”、LLM 知识图谱、创造出色的人工智能用户体验等,如果他们想为自己的技能提供未来保障?谢谢!
Srinivas Narayanan:它们都是有价值的。我会做你更感兴趣的事。
学习 Transformer 将为你提供有助于为特定用例构建定制模型的技能 - 蒸馏/微调等技术将很重要。
在现有模型的基础上,还可以构建各种各样的应用程序。
如果您仍在两者之间挣扎,我建议您从更高的层次开始,并尽可能深入地了解。
网友:关于ChatGPT 搜索产品的一个问题。
在过去,企业主、网络出版商、联属公司等都担心搜索引擎优化,以确保他们的网站“排名靠前”。您会告诉这些人他们可以做些什么来确保他们在 ChatGPTs 搜索中被找到?
Kevin Weil:这个问题问得好——产品今天才刚刚发布,因此在人工智能世界中,搜索与人工智能的相似之处和不同之处仍有很多问题需要解决。非常希望得到您的反馈!
网友:OpenAI 认为 AI 在未来个性化辅导中将扮演什么角色?
Srinivas Narayanan:这绝对是改变人们学习方式的巨大机会。https ://www.khanmigo.ai/在这里做了非常有趣的工作——它引导人们自己寻找答案,促进对主题的更深入理解。它还可以帮助教师补充他们的课程计划。
网友:你们觉得自己很快就会增加 ChatGPT 的内存吗?我正在写一本书,我对它被填满的速度感到震惊。
Srinivas Narayanan:致力于支持更长的上下文窗口
网友:草莓这个单词(strawberry)有多少个R?
Mark Chen:3,但有时是 2。
Kevin Weil:3,但有时是 2。
网友:ChatGPT 会给他们的狗起什么名字?
Kevin Weil:GPT-4o 表示 Ace 或 Dash。o1-preview 表示 Buddy,或者如果它举止冷静的话,则表示 Luna。
规则不是我制定的。
网友:让我们回到另一个维度。;) 如果您是一名 19 岁的开发人员,正在思考明年要做什么,您会使用 OpenAI 软件或 API 做什么?
Srinivas Narayanan:一些想法:
选择您最喜欢的应用程序/产品。重新想象人工智能可以做什么。
为代理未来构建一些东西——可以跨应用程序集成工作流程的东西。
网友:最好的提示词是什么?
Kevin Weil:这句话在 Twitter 上流传,但我真的很喜欢“根据我们的互动,你能告诉我什么我不知道的事情吗?”
网友:你觉得可以给 Kevin 展示的吉祥物起个名字吗?我知道这看起来微不足道,但对我们中的一些人来说却非常重要。
Kevin Weil:天空。
| |