人类慌了！OpenAI公司发布新模型GPT-4o，旨在革新人机互动方式

FX168财经报社(北美)讯在人工智能行业的竞争日益加剧之际，OpenAI周一(5月13日)在美国加州旧金山总部宣布推出新的人工智能模型GPT-4o。这一全新的旗舰模型不仅开放给免费用户，还大幅提高了与人类交互的自然度和效率，预计将重新定义数字助手的功能和用户体验。

（来源：OpenAI）

GPT-4o和ChatGPT什么关系？

GPT-4o是ChatGPT所使用的最新技术基础。通过 GPT-4o 的增强功能，ChatGPT 能够提供更加智能和多样化的交互体验，包括处理更复杂的查询、进行实时语音交流，以及理解和回应视觉内容。这样，ChatGPT 不仅仅是一个文本聊天工具，还能够作为一个多功能的数字助理，提供更广泛的服务和支持。

技术革新和功能扩展

GPT-4o的推出标志着OpenAI在其技术开发路径上的一次重大跳跃。

根据该公司周一的演示，GPT-4o将有效地将ChatGPT转变为可以进行实时语音对话的数字个人助理。它还能够使用文本和“视觉”进行交互，这意味着它可以查看用户上传的屏幕截图、照片、文档或图表，并就它们进行对话。

新模型在速度、成本效益及多模态交互方面都有显著提升。根据OpenAI首席技术官Mira Murati的介绍，GPT-4o的处理速度是其前身GPT-4 Turbo的两倍，而成本则减少了50%。此外，API的速率限制提高了五倍，使得开发者和用户可以更频繁地与模型互动。

在功能上，GPT-4o不仅能处理文本和视觉信息，还加入了实时语音对话能力。这使得用户可以通过语音直接与ChatGPT进行交互，无论是求解数学问题、获取编程建议，还是简单地进行日常对话。此外，GPT-4o还具备实时翻译和情绪检测功能，进一步拓宽了其应用场景。

（来源：OpenAI）

应对市场竞争和合作伙伴关系

新版本的发布，是OpenAI在AI领域竞争中保持领先地位的战略举措。OpenAI活动在谷歌年度I/O开发者大会前一天举行，预计谷歌将在会上宣布其Gemini AI模型的更新。与新的GPT-4o一样，谷歌的Gemini也是多模式的，这意味着它可以解释和生成文本、图像和音频。OpenAI的更新也是在苹果下个月的全球开发者大会上预计发布人工智能之前发布的，其中可能包括将人工智能融入到下一个iPhone或iOS 版本中的新方法。

OpenAI的这次率先发布更新无疑为市场增添了新的焦点。

此外，GPT-4o的推出对于其主要投资者微软来说，无疑是一个积极信号。微软已经在其多个产品中集成了OpenAI的技术，而新模型的推出可能会进一步加深双方的合作，带来更多创新的用户体验。

用户体验和市场响应

据OpenAI表示，新模型支持超过50种语言，平均响应时间仅为320毫秒，与人类在对话中的响应时间相似。这一点特别受到用户的欢迎，许多人在社交媒体上分享了他们与GPT-4o的互动经历，表达了对其响应速度和多功能性的赞赏。

在一系列现场演示中，OpenAI的研究团队展示了GPT-4o在处理实际问题中的实力。从解决复杂的数学问题到通过摄像头读取用户的情绪，GPT-4o都表现出了令人印象深刻的能力。特别是其在音频处理和情绪感知方面的表现，预示着 AI 技术在理解人类语言和非言语信息方面迈出了重要步伐。

未来展望和挑战

尽管GPT-4o的推出带来了许多令人兴奋的可能性，但OpenAI面临的挑战仍然存在。从确保模型的安全性和可靠性，到处理与隐私相关的问题，OpenAI需要在创新的同时，确保其技术的负面影响最小化。

在AI技术迅速进化的今天，OpenAI的GPT-4o不仅展示了公司在技术前沿的地位，也为用户提供了一个强大而灵活的工具，以更自然的方式与数字世界互动。随着技术的进一步迭代和完善，预计未来几个月会有更多企业和用户体验到GPT-4o带来的变革。

此次发布的GPT-4o无疑将推动整个行业向更高级的人机交互方式迈进，同时也为OpenAI在全球AI竞争中稳固了其创新领导者的地位。随着更多功能的逐步推出，市场和用户对OpenAI的期待值将继续攀升。

OpenAI 表示已有超过1亿人在使用ChatGPT。但更新的ChatGPT体验，以及在桌面上通过改进的语音对话与其进行交互的能力，可能会让更多的人有理由使用其技术。

更新的技术和功能将在未来几个月内推出到ChatGPT。免费ChatGPT用户将与新的GPT-4o模型进行有限次数的交互，然后该工具会自动恢复到以前的GPT-3.5版本。付费用户则可以使用最新型号访问更多数量。

人类慌了！OpenAI公司发布新模型GPT-4o，旨在革新人机互动方式

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

“AI界春晚”2024北京智源大会：新主角、共识和分歧｜大模界

GPT-4 更强的标志，原来藏在了 logo 里

英伟达开源3400亿巨兽，性能对标GPT-4o

走进深水区，和36氪一起画出AI行业的未来蓝图

硅谷AI精英人均“百万美元”薪酬，业界标配还是谣言？

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

纯太阳能电车何时能实现，马斯克怎么看？

大疆前高管带6人创业，做出了类目Top1的割草机器人

技术吹得再强，离用户不近有何用？

Google 搜索诞生 25 年来最大更新之一，用 AI 把搜索重做一遍。通过视频直接提问，看看

AlphaFold的伟大，只因做对了这5件事！DeepMind副总裁：团队注定会取得突破

20%的杨幂+80%的泰勒长什么样？全新风格化AI来了，可兼容SD

国产机器人也会空翻了！打破限制，世界首款！

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

何小鹏：智能驾驶的事故率是人工驾驶的十分之一以内

，打开AI+融合创新人才培养新局面

代码都让AI写，CS还有前途吗？加州大学伯克利分校：CDSS申请人数飙升48%！

这个机器人的手真的太灵活了！收纳、撸猫、修剪绿植样样都行，原速演示流畅程度堪比人类。这是星动纪

3分钟带你看遍IPF大会十年黑科技，迈向AI+新时代

人类慌了！OpenAI公司发布新模型GPT-4o，旨在革新人机互动方式

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

“AI界春晚”2024北京智源大会：新主角、共识和分歧｜大模界

GPT-4 更强的标志，原来藏在了 logo 里

英伟达开源3400亿巨兽，性能对标GPT-4o

走进深水区，和36氪一起画出AI行业的未来蓝图

硅谷AI精英人均“百万美元”薪酬，业界标配还是谣言？

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

纯太阳能电车何时能实现，马斯克怎么看？

大疆前高管带6人创业，做出了类目Top1的割草机器人

技术吹得再强，离用户不近有何用？

Google 搜索诞生 25 年来最大更新之一，用 AI 把搜索重做一遍。 通过视频直接提问，看看

AlphaFold的伟大，只因做对了这5件事！DeepMind副总裁：团队注定会取得突破

20%的杨幂+80%的泰勒长什么样？全新风格化AI来了，可兼容SD

国产机器人也会空翻了！打破限制，世界首款！

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

何小鹏：智能驾驶的事故率是人工驾驶的十分之一以内

，打开AI+融合创新人才培养新局面

代码都让AI写，CS还有前途吗？加州大学伯克利分校：CDSS申请人数飙升48%！

这个机器人的手真的太灵活了！ 收纳、撸猫、修剪绿植样样都行，原速演示流畅程度堪比人类。 这是星动纪

3分钟带你看遍IPF大会十年黑科技，迈向AI+新时代

Google 搜索诞生 25 年来最大更新之一，用 AI 把搜索重做一遍。通过视频直接提问，看看

这个机器人的手真的太灵活了！收纳、撸猫、修剪绿植样样都行，原速演示流畅程度堪比人类。这是星动纪