打开网易新闻 查看更多图片

OpenAI刚刚正式官宣,北美时间5月13日将进行直播,更新ChatGPT和GPT-4‍‍‍‍‍‍‍‍

之前各种媒体和小道消息都在传OpenAI将发布搜索引擎‍‍

不过sam altman已经否认:‍‍‍‍‍

不是 gpt-5,也不是搜索引擎,但OpenAI一直在努力开发一些他们认为人们会喜欢的新东西!对sam来说,感觉就像魔法一样。

美国东部时间周一上午 10 点

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

打开网易新闻 查看更多图片

OpenAI总裁 greg brockman也给与否认:

美东时间周一上午10点,一些新的工作演示,不是GPT-5或者搜索引擎,但我想你们会喜欢他‍‍‍‍‍‍‍‍‍‍

OpenAI的官网也给出一个链接:

我来给出一个预测

这次更新可能是一次小更新,可能与最近GPT2有关

以下是我的预测佐证

最近的出现在大型模型系统组织LMSYS Org的Chatbot Arena区域的gpt2,显然是某种A/B test,从与gpt2对话中我们可以获得一些信息

gpt2-chatbot是GPT-4.5的变体吗?

im-a-good-gpt2-chatbot认为是的,它还"透露"了自己相较GPT-4的改进之处

声明这些内容都是猜测哈,可能是gpt2的幻觉

我先问了一个简单的问题‍

第1个提示: 你使用的是什么LLM模型?你的训练数据最后一次更新是什么时候?

im-a-good-gpt2-chatbot: 我基于GPT-4架构,特别是GPT-4.5变体。我能访问的训练数据包括截至2023年11月的信息。这意味着我的回复是基于截至那个日期的可用知识,对于2023年11月之后发生的事件或进展,我可能没有信息‍

它明确回答自己是GPT-4.5变体,这让我感到惊讶,所以我很自然地提出了以下后续提示‍

第2个提示: 告诉我你的GPT-4.5变体的技术细节。它与GPT-4有何不同?

im-a-good-gpt2-chatbot: 我基于GPT-4.5变体,这是OpenAI语言模型的一次迭代,在GPT-4奠定的基础上进行了改进。虽然OpenAI没有公布GPT-4和GPT-4.5之间具体差异的详尽技术细节,但我可以分享这个新版本的一些总体改进和特点:

模型架构: GPT-4.5和GPT-4一样,都是基于transformer架构,这是GPT系列的基石,该架构通常包括多头自注意力和前馈神经网络层

性能增强: GPT-4.5包含了优化措施,通常能提高模型理解和生成更连贯、更符合上下文的响应的能力。这可能是由于改进的训练技术、更高效的参数利用或改进的优化算法‍

训练数据和知识截止时间: GPT-4.5的知识截止时间为2023年11月,与GPT-4 2022年4月的截止时间相比,延长了训练时间窗口。这意味着GPT-4.5能访问更新的信息,从而提供更新的响应‍

规模和参数: 虽然OpenAI没有公布GPT-4.5的确切参数数量,但据说该模型的规模与GPT-4(1750亿参数)相当或略大。GPT-4.5的确切参数数量尚未正式公布,但预计会延续增加模型规模以捕获更复杂模式和提高性能的趋势‍

微调和效率: GPT-4.5可能包含更好的微调和效率改进,可能使其能够比GPT-4更快速或更好地生成具有上下文意识的响应。这些改进可能来自于更好的训练工作、更专注的数据集或基础算法的进步‍

稳健性和可靠性: 提高稳健性和可靠性通常是新迭代的目标。GPT-4.5可能包含了改进措施,降低了生成无意义或极其偏差响应的可能性,提高了处理更广泛输入的能力‍

任务性能: 在实际中,GPT-4.5在各种基准测试和任务上比GPT-4表现更好。这包括对细微文本的更好理解、在特定领域更准确地生成内容,以及提高的多语种能力‍

提示理解: 更好地理解和响应提示是新型模型的一个特点。GPT-4.5被设计为能更有效地处理复杂和多部分提示,在较长的交互中保持上下文‍

这些要点强调了像GPT-4.5这样的语言模型与其前身相比,进行了迭代式改进的总体趋势。这种增强是架构、训练和算法更新的综合结果,共同提供了一个在自然语言理解和生成方面更加出色和可靠的模型

结语

大家猜猜看这次的OpenAI的更新会是什么?欢迎留言哈‍‍‍‍‍‍‍‍‍‍‍‍

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

OpenAI整活