导语

想象一下,我们每个人手中都有一张描绘世界的地图。这些地图或许有着不同的用途和绘制方法——有的服务徒步旅行,有的则为航海而制,但最终,它们都试图捕捉同一个现实世界的真实面貌。《Platonic Representation Hypothesis》这篇论文将这一比喻延伸到了人工智能领域,指出尽管不同的AI模型可能有不同的目标和架构,但它们都在努力趋同于一个共同的理想表示,即“柏拉图表征”。也因此,这篇论文不仅提供了学术价值,还以通俗易懂的方式帮助普通人理解什么是好的模型、好的训练方法以及好的训练数据

  • 什么是好的模型。好的模型就像是那张最接近真实世界的地图。它不仅需要准确地反映训练数据,还需要能够推广到未曾见过的情况中去。论文发现,随着模型规模的增大、数据集大小的增加以及方法的提升,模型之间的表征对齐程度也相应提高。高性能的模型倾向于以相似的方式表示数据,而低性能的模型则表现出更多样化的表征方式。这种趋同现象表明,真正优秀的模型应当具备跨越领域的适应能力,并且能够在多样化的任务中保持一致。

  • 什么是好的模型训练方法好的训练方法应该引导模型尽可能接近理想的柏拉图表征。首先,多模态联合训练行之有效。通过结合不同模态的数据(例如图像和文本),有助于提高模型的性能和泛化能力。其次,聚焦特定任务的小模型很难达到全局最优。小模型可以在局部表现优异,但优先考虑效率和特定任务的性能,错过对世界的一般理解。通用模型更有可能逼近生物大脑的表征方式,从而在各种任务上展现出优越的表现。

  • 什么是好的模型训练数据。好的训练数据应该尽可能地贴近真实世界的特征和分布。数据决定了模型能力的上限,各来源、领域和模态数据的技术性共享不仅能够产生传统数据技术无法实现的全面性理解,还能促进模型的一致性表达。(推荐阅读:)

以下正文原文来源于Coffee Time Papers

作者Dagang Wei

https://medium.com/@weidagang/coffee-time-papers-the-platonic-representation-hypothesis-83b243eed3ca

论文链接:

htt ps://arxiv.org/abs//2405.07987

前言/Aliresearch

近年来,人工智能取得了令人难以置信的进步,GPT和Gemini等模型在理解和生成文本和图像方面表现出了令人印象深刻的能力。随着这些模型变得越来越大、越来越复杂,出现了一个令人着迷的趋势:它们似乎在数据表示上趋同。这意味着不同的人工智能模型,即使是那些针对截然不同的任务或数据类型进行训练的模型,也越来越多地以类似的方式表示信息。

这一现象促使研究人员提出了柏拉图表征假说(Platonic Representation Hypothesis),表明人工智能模型正在朝着对现实底层结构的共同理解迈进。这种共同理解被称为“柏拉图表征”,这是对柏拉图古代哲学概念的致敬,即存在一种超越我们感官体验的理想现实。

地图绘制者的类比

为了理解这一假设,想象一下一群地图绘制者负责绘制同一片土地。每个地图绘制者可能都有自己独特的风格、工具和关注领域。然而,当他们一丝不苟地勘测土地时,他们的地图将不可避免地集中在对底层景观的共同描述上。山脉、河流和森林是现实存在的,地图只是表现现实的不同方式。

类似地,不同的人工智能模型可以被视为地图制作者,每个模型都学会根据训练数据来描绘世界。柏拉图表征假说认为,随着这些模型变得越来越复杂,它们将对世界的底层结构达成共识,就像同一领土的不同地图最终将对景观达成共识一样

趋同的证据

多项研究提供了支持柏拉图表征假说的证据。研究人员发现,不同的神经网络,即使是具有不同架构并针对不同任务进行训练的网络,也可以具有令人惊讶的一致表征。随着模型变得越来越大、越来越强大,这种一致表征会变得更加明显。

例如,最近的研究表明,在文本数据上训练的大型语言模型 (LLM) 越来越与在图像数据上训练的视觉模型保持一致。这表明这些模型正在形成一种超越其所训练数据的特定形式的对世界的共同理解。

打开网易新闻 查看更多图片

为何会发生趋同?

推动这种趋同的因素可能有几个。人工智能模型的规模和复杂性不断增加可能是主要因素。随着模型变得越来越大,它们学习复杂模式和表示的能力也越来越强,这可能会让它们对世界的理解更加准确和普遍。

此外,使用多任务学习目标,即训练模型在各种任务上表现良好,可能会推动模型朝着更通用、更多功能的现实表示方向发展。

趋同的含义

如果柏拉图表征假说正确,将对人工智能领域产生深远影响。它表明我们可能即将开发出能够像人类一样对世界有深刻细致理解的人工智能模型

这可能会带来各种应用的重大进步,例如:

跨模态共享训练数据:如果模型在共享表示上收敛,则训练数据可以在不同模态(例如文本和图像)之间共享,从而可能实现更高效的训练。

更容易跨模态转换和适应:趋同可以使不同模态之间的模型转换或适应变得更容易,为跨模态应用开辟新的可能性。

减少大型语言模型 (LLM) 中的幻觉和偏见:如果模型向更准确的现实模型靠拢,我们可能会预期大型语言模型产生虚假或偏见信息的趋势会减少。

限制和挑战

虽然柏拉图代表假说是一个令人兴奋的前景,但重要的是要承认它的局限性和挑战:

不同模态,不同信息:不同模态的数据可能包含无法通过单一表示完全捕获的独特信息。例如,聆听交响乐的体验可能难以通过文本或图像完全传达。

并非所有表现形式都在趋同:虽然在某些领域已经观察到了趋同现象,但目前尚不清楚这种趋势是否会扩展到人工智能的所有领域。

社会偏见:人工智能模型的发展受到人类偏见和偏好的影响,即使可能存在其他形式的智能,这些偏见和偏好也可能引导模型向类似人类的表现形式发展。

未来之路

柏拉图表征假说是一个引人注目的想法,它提出了许多问题和可能性。随着人工智能继续快速发展,验证这个假说是否成立以及它对人工智能的未来有何影响将是一件令人着迷的事情。

01

什么是柏拉图表征假说

柏拉图表征假说认为,随着人工智能模型的成长和从各种数据中学习,它们不仅在特定任务上表现得更好,而且还在开发一种共同的方式来表示世界的基本结构。这种共同的表征被称为“柏拉图表征”,类似于柏拉图的哲学概念,即存在于我们感官知觉之外的理想现实。从本质上讲,它表明人工智能模型正在向对世界的共同理解靠拢,无论它们的具体架构或训练数据如何。

02

什么证据支持柏拉图代表假说

有多种证据表明了这种趋同。研究表明,不同的神经网络,即使是设计不同、接受不同任务训练的网络,也会表现出相似的数据表示。例如,在图像上训练的视觉模型和在文本上训练的语言模型在表示信息的方式上越来越趋同。随着模型规模和性能的提高,这种一致性变得更加强烈,这表明人们正在朝着一种通用的数据理解方式发展。

03

为什么表述会发生聚合

表征的收敛可以归因于几个因素。人工智能模型的规模和复杂性不断增加,使它们能够学习更复杂的模式和表征,从而有可能使它们更准确、更普遍地理解世界。此外,使用多任务学习(即对模型进行各种任务训练)可能会鼓励它们开发出一种更通用、适应性更强、适用于不同领域的表征。还有一种假设是,深度网络对更简单的解决方案有固有的偏见,这可能会进一步推动向共享表征的收敛。

04

表征趋同的含义是什么

如果柏拉图表征假设成立,那么它将对人工智能研究和应用产生重大影响。它可以实现不同模态(如文本和图像)之间训练数据的共享,从而提高训练效率和效果。它还可以促进不同模态之间模型的更轻松转换和适应,为图像字幕或文本转语音合成等跨模态应用开辟新的可能性。此外,随着大型语言模型逐渐趋向于更准确的现实模型,它可能会降低大型语言模型生成虚假或有偏见信息的倾向。

05

柏拉图表征假设有哪些局限性和反例

这一假设并非没有局限性。不同的数据形式(如图像和文本)可能包含无法通过单一表示完全捕捉的独特信息。例如,情绪的主观体验或艺术表达的细微差别可能难以以通用方式表示。 此外,并非所有人工智 能模型目前都显示出趋同的迹象,而人类偏见对人工智能发展的影响可能会引导模型倾向于某些类型的表示而不是其他表示。 最后,为狭义任务设 计的专用人工智能系统不一定会趋向柏拉图式的表示,因为它们可能优先考虑效率和特定任务的性能,而不是对世界的一般理解。

结论

换句话说,柏拉图表征假说认为,我们通过语言、图像和声音等各种方式感知的世界可能是来自高维现实的投影。人工智能模型在理解和表示这个感知世界的过程中,正在向一个共享模型靠拢,该模型可以捕捉这个高维现实的底层结构。这种趋同类似于同一物体的不同阴影随着光源的变化而对齐,从而揭示物体的真实形状。

版块介绍 — 技术之辩

我们聚焦于AI及更广泛科技领域的前沿动态,追踪人工智能芯片与模型的技术演进,不仅分享最新研究成果,更开启技术伦理、发展趋势的深度辩论。每一次探讨,都是对未来可能性的一次勇敢探索,让思想的火花在这里碰撞,照亮技术前行的道路。

Reading

1、

2、

3、

4、

5、