打开网易新闻 查看更多图片

当今几乎所有领先的人工智能模型,例如 OpenAI 的 GPT-4o、Google 的 Gemini、Anthropic 的 Claude 等,都是基于神经网络构建的。然而,这种神经网络是基于 20 世纪 60 年代设计的生物神经元计算模型,并且基于这种旧技术可能会阻碍现代人工智能的进一步发展。新的神经元模型来取代它。

神经元可能拥有比之前想象的更多的能力

计算神经科学中心 (CCN) 是 Flatiron 研究所的一个部门,它开发模型来帮助改进科学实验的设计并创建理解人脑的新框架。

在阐明了单个神经元的工作原理并分析了 20 世纪 60 年代开发的当前神经元模型后,CCN 研究人员发现该模型并不能完全描述神经元的行为。他们的新研究表明,单个神经元对其周围环境的控制力可能比之前想象的更大。

该论文的资深作者 Dmitri Chklovskii 在一份新闻稿中表示: “神经科学在过去 60 年里取得了相当大的进步,现在人们认识到以前的神经元模型相当基础。神经元是比这个过于简化的模型复杂得多的设备。而且它更聪明。”

作者在论文中表示,以前的模型可能“无法完全捕获真实神经元的计算能力”,并且可能会阻碍人工智能的发展。

“人工智能的成就非常令人印象深刻,但仍然存在很多问题。目前的应用有时会给出错误的答案或产生幻觉,训练需要大量的精力,而且仍然存在很多人类大脑似乎回避的问题。如果我们能够理解大脑实际上是如何做到这一点的,我们就可以构建更好的人工智能。”Chklovskii 说。

人工神经网络旨在模仿人脑处理信息和做出决策的方式,但它们的方式比现实要简单得多。这些网络是根据 20 世纪 60 年代的神经元模型,用有序的“节点”层构建的。网络从接收信息的输入层节点开始,经过处理信息的中间层节点,最后以发送结果的输出层节点结束。

通常,只有当从前一层节点接收到的总输入超过某个阈值时,节点才会将信息传递到下一层。当前的人工神经网络在训练时,信息仅沿一个方向通过节点,并且无法影响节点从链中较早节点接收的信息。

但是,研究人员表示,“我们的脑细胞不仅仅是被动的输入中继器;它们实际上可能会控制其他神经元的状态。”

新公布的“神经元作为控制器模型”将神经元视为小型“控制器”。控制器是一种可以看到周围环境并相应地影响它们的设备。换句话说,我们的脑细胞不仅可以被动地传递输入,还可以实际控制其他神经元的状态。

神经元作为控制器模型的灵感来自于科学家对大脑大规模电路的理解,大脑的大规模电路由许多神经元组成。大多数大脑回路被认为是组织成反馈回路的,其中处理链中较晚的细胞会影响该链中较早发生的事情。就像维持房屋或建筑物温度的恒温器一样,大脑回路需要保持自身稳定,以避免身体系统因活动而不堪重负。

Chklovskii 说,“人们过去认为整个大脑或大脑的一部分都是控制器。但没有人提出单个神经元可以做到这一点。控制是一项计算密集型的工作,“很难想象神经元有足够的计算能力。”

但奇克洛夫斯基说,将神经元视为微型控制器也可以解释一些以前无法解释的生物现象。例如,神经科学家质疑人脑中是否存在随机性,因为一个神经元可能会发出另一个神经元可能无法接收到的信号。但对神经元作为微型控制器的新认识证实,其中一些噪声可以起到性能增强剂的作用。

换句话说,通过在新的和改进的模型中添加一些噪声,神经元现在可以更灵活地响应不断变化的环境。研究人员报告发现“这种随机性对于复制真实神经元的功能非常重要”。

换句话说,神经元可以控制输入,但并非所有神经元似乎都表现出这种能力,这是未来研究的一个方向。就像这个新模型所针对的大脑深处的神经元一样,这些神经元可能无法影响输入,但它们也可能能够预测它们。

“控制和预测实际上是非常相关的。如果不预测你的行为对世界的影响,你就无法有效地控制,”奇克洛夫斯基说。

直到现在,神经元执行计算的复杂程度还没有被完全理解。 “神经元对周围环境的控制比以前想象的要强。”

因此,更新后的模型有可能为利用人脑最复杂机制的更好、更有效的人工神经网络提供动力。

参考

美国国家科学院院刊:神经元作为直接数据驱动控制器

西蒙斯基金会:真实神经元的新计算模型可以带来更好的人工智能

研究总结

为了在缺乏生理数据的情况下对神经元功能进行建模,一个有前途的策略是开发规范理论,将神经元生理学解释为计算目的的优化。在这项研究中,我们扩展了当前的规范模型,主要通过将神经元概念化为最佳反馈控制器来优化预测。我们假设神经元,尤其是早期感觉皮层及其他区域的神经元,通过其输出将环境引导至某种所需状态。该环境由突触互连的神经元和外部动觉反馈回路组成,允许神经元通过突触反馈评估其控制的有效性。为了将神经元建模为生物学上可行的控制器,隐式识别循环动态、推断潜在状态并优化控制,我们使用现代直接数据驱动控制(DD-DC)框架。我们的 DD-DC 神经元模型的特点是从增强到抑制的转变及其尖峰时间依赖性可塑性的不对称性、前馈和反馈神经元滤波器的持续时间和适应性,以及在恒定刺激下无法产生尖峰的准确性,解释了各种准确性。神经生理现象,例如大脑特有的运动波动和噪音。我们的模型与传统的前馈、即时响应 McCulloch-Pitts-Rosenblatt 神经元有很大不同,并为构建神经网络提供了现代的、基于生物学的构建块。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片