转载声明:除调整格式外,不得对原文做改写、改编。原创不易,谢谢!E-mail:yellow@aliyun.com

♥声明:本文为原创文本,非生成式,转载请注明出处!

商务咨询/顾问/请@yellowscholar♥作者:黄先生斜杠青年

打开网易新闻 查看更多图片

通过:Google

今天的科学正站在一个十字路口:它的进步是由人类的思想还是我们创造的机器来推动的?

科学事业中正在出现分裂。一边是人类的思想,是我们物种所珍视的每一个故事、理论和解释的来源。另一边是机器,它们的算法具有惊人的预测能力,但其内部运作对人类观察者来说仍然完全不透明。当我们人类努力理解世界的基本本质时,我们的机器会不断产生可衡量的、实用的预测,这些预测似乎超越了思维的界限。虽然理解可能会满足我们的好奇心,但预测通过对因果关系的叙述满足我们的愿望,将这些机制映射到现实中。我们现在面临着一个选择,即哪种知识更重要,以及一种知识是否阻碍了科学进步的问题。

直到最近,理解和预测还是对抗无知的盟友。弗朗西斯·培根 (Francis Bacon) 是最早在科学革命早期将他们聚集在一起的人之一,当时他认为科学家应该走出去到世界各地,修补他们的仪器。他说,这种方法将避免学术界试图把握现实的痛苦停滞和循环。在他的 Novum Organum(1620 年)中,他写道:

我们发现科学的新方法是,不留给机智的敏锐和力量,而是将机智和智力放在同等水平。因为就像用手画一条直线或准确的圆圈一样,很大程度上取决于它的稳定性和练习,但是如果使用尺子或指南针,则几乎没有任何机会;我们的方法也是如此。

我是斜杠青年,一个PE背景的杂食性学者!♥致力于剖析如何解决我们这个时代的重大问题!♥使用数据和研究来了解真正有所作为的因素!

培根完全合理地提出,人类的感知和理性应该通过工具来增强,并且通过这些工具可以摆脱反思的迷宫。

艾萨克·牛顿 (Isaac Newton) 热情地采用了培根的经验哲学。他的职业生涯花在了开发工具上:物理镜头和望远镜,以及心理辅助工具和数学描述(称为形式主义),所有这些都加快了科学发现的步伐。但是,在这种对工具的日益增长的依赖中,隐藏着一种令人不安的分歧的种子:人类大脑能够辨别的关于世界潜在机制的内容与我们的工具能够测量和建模的内容之间。

今天,这个差距有可能使整个科学项目大开杀戒。我们似乎已经达到了一个极限,即理解和预测——机制和模型——正在不一致。在培根和牛顿的时代,人类头脑中易于处理的世界账目和可以检验的预测被加入了一个良性循环。令人信服的理论,以现实世界的观察为后盾,促进了人类对从天体力学到电磁学和孟德尔遗传学的一切的理解。科学家们已经习惯了用动力学规则和定律来表达的直觉理解——例如查尔斯·达尔文的自然选择理论或格雷戈尔·孟德尔的独立分类原理,以描述生物体的基因组如何通过其父母染色体的分离和重组来传播。

但在“大数据”时代,理解和预测之间的联系不再适用。现代科学在解释原子、光和力的唾手可得的成果方面取得了惊人的进步。我们现在正在努力接受更复杂的世界——从细胞到组织,从大脑到认知偏差,从市场到气候。新颖的算法使我们能够预测这些学习和进化的自适应系统行为的一些特征,而仪器则收集了前所未有的大量信息。虽然这些统计模型和预测经常能做出正确的结果,但我们几乎不可能重建他们是如何做到的。工具智能,通常是机器智能,不仅对理性有抵抗力,而且有时还积极敌对理性。例如,基因组数据研究可以捕获数百个参数(患者、细胞类型、状况、基因、基因位置等),并将疾病的起源与数千个潜在的重要因素联系起来。但是这些“高维”数据集和它们提供的预测违背了我们解释它们的最佳能力。

如果我们能用牛顿模型和量子模型来预测人类行为,那我们就会。但我们不能。正是科学与复杂现实之间的这种诚实对抗产生了分裂。一些批评者声称,正是我们自己顽固的人类中心主义——坚持认为我们的工具屈服于我们的智能——阻碍了科学的进步。他们说,如果我们不再担心安抚人类的思想,我们就可以使用机器来加速我们对物质的控制。智能的计算机模拟不需要反映神经系统的结构,就像望远镜反映眼睛的解剖结构一样。事实上,射电望远镜提供了一个令人信服的例子,说明一种全新的非光学机制如何超越纯粹的光学功能,射电望远镜能够探测到银河系视线之外的其他星系。

理解和预测之间的巨大分歧与巴鲁克·斯宾诺莎 (Baruch Spinoza) 对历史的见解相呼应:“分裂不是源于对真理的热爱......而是对至高无上的过度渴望。未来的战斗是大脑或算法是否将在科学王国中拥有主权。”

悖论 和它们的感性表亲 错觉 提供了两个有趣的例子,说明了预测和理解之间纠缠不清的关系。两者都描述了我们认为我们理解了某事,但实际上却遇到了异常情况。理解并不像看起来那么容易理解。

一些最著名的视觉错觉在对同一物体的两种不同解释之间“翻转”——例如花瓶、鸭兔和 Necker 立方体(一个线框立方体,在两个方向之一被感知,任何一张脸都离观众最近)。我们知道现实生活中的物体不会像这样真正地转动,但这就是我们的感官告诉我们的。痴迷于鸭兔错觉的路德维希·维特根斯坦 (Ludwig Wittgenstein) 认为,一个人在主要解释之后才看到一个物体,而不是在看到一个物体之后才理解它。我们所看到的就是我们期望看到的。

认知科学家理查德·格雷戈里 (Richard Gregory) 在他的精彩著作《看穿幻觉》(2009 年)中称它们为“挑战我们现实感的奇怪感知现象”。他解释了它们是如何发生的,因为我们的理解是由多个不同规则系统的预测提供的,这些规则系统是断章取义地应用的。在 Necker 立方体中,每个感知都与三维空间中的感知数据一致。但是没有深度线索意味着我们无法决定哪种解释是正确的。因此,由于缺乏足够的空间理解,我们在两个预测之间切换。

悖论,就像幻觉一样,迫使直觉与关于世界的明显基本事实发生碰撞。悖论是看似自相矛盾或在逻辑上站不住脚的有效论点或观察的结论。它们经常出现在自然科学中——尤其是在物理学中,无论是哲学还是科学的化身。双胞胎悖论、爱因斯坦-波多尔斯基-罗森悖论和薛定谔的猫都是源自相对论或量子力学基本结构的悖论。这些与观测悖论截然不同,例如在双缝实验中观察到的粒子波二象性。然而,在这两类悖论中,基于日常因果推理的人类理解都无法与实验的预测结果保持一致。

当规则应用于结构不同的输入时,我们可以预料到奇怪的情况

即使是机器也可能出现悖论。“辛普森悖论”描述了在多个数据集中独立出现的趋势在组合时消失甚至逆转的方式——这意味着一个数据集可以用于支持相互竞争的结论。这在体育运动中经常发生,在任何特定赛季中,单个球员的表现都优于其他人。然而,当多个赛季合并时,由于绝对差异,例如总比赛数、击球次数等,这些球员不再领先。还有一种被称为“准确性悖论”的东西,其中模型似乎由于完全循环的原因而表现良好——也就是说,它们的解决方案基本上被融入了样本中。这就隐藏在许多算法偏见的例子背后,其中基于种族和性别的少数群体经常被错误分类,因为用作准确性基准的训练数据来自我们自己有偏见和不完美的世界。

也许库尔特·哥德尔 (Kurt Gödel) 在《数学原理和相关系统的形式上不可判定的命题》(1931 年)中对悖论进行了最严格的研究。哥德尔发现,在每个严格形式化的数学系统中,都有无法确认或反驳的陈述,即使它们来自系统本身的公理。形式系统的公理允许矛盾的可能性,正是这些矛盾构成了悖论经验的基础。哥德尔的基本见解是,任何规则系统都有一个自然的应用领域——但是当规则应用于与指导规则开发的结构不同的输入时,我们可以预料到会很奇怪。

这正是对抗性神经网络可能发生的情况,其中两种算法竞争赢得比赛。一个网络可能经过训练来识别一组对象,例如停车标志。同时,它的对手可能会对新的数据集进行一些恶意的细微修改——比如,移动几个像素的停车标志——导致第一个网络将这些图像归类为从右转标志到限速标志的任何内容。从人类的角度来看,对抗性分类看起来是极其愚蠢的。但是,正如哥德尔所理解的那样,从神经网络中编码的不可见规则系统的角度来看,它们可能是完全自然的错误。

悖论和幻觉向我们表明,我们的预测和理解能力取决于思想的本质缺陷,而实现理解的限制可能与限制预测的限制截然不同。就像预测从根本上受到测量的敏感性和计算的缺点的约束一样,理解也因推理规则而增强和减少。

他对“限制”的含义提出了疑问,阐明了为什么人类首先会被所有这些机器和形式所吸引。科学文化的演变,以及最广义上的技术的演变,是突破认知和语言限制的手段的集合——这就是培根在《Novum Organum》中的黑色限制。

理解和预测之间的关系对应于本体论(洞察世界的真实本质)和认识论(获得世界知识的过程)之间的联系。基于实验的知识可以突破我们现有理解的障碍,并产生对现实的新基本特征的欣赏;反过来,这些基本定律允许科学家生成新的预测,以便在世界上进行测试。当被称为“集合论”的数学分支被证明会产生悖论时,随后被称为“范畴论”的东西的发展来拯救了这些限制,部分克服了这些限制。当太阳系的托勒密模型或牛顿力学模型产生不正确的天文预期时,相对论被引入来捕捉大质量在快速运动中的异常行为。通过这种方式,理论的本体论基础成为新的和更好的预测的基础;本体论产生认识论。

但是,一旦科学进步达到一定限度,本体论和认识论似乎就会成为敌人。在量子力学中,不确定性原理指出,粒子的动量和位置不能同时完全知道。它既描述了对进行完全精确测量的约束(认识论),又似乎涉及关于在量子尺度上创造位置和动量的基本不可分离性(本体论)的机制的争论。在实践中,量子力学涉及有效地应用理论以预测结果——而不是直觉产生结果的机制。换句话说,本体论被认识论吸收。

相比之下,量子力学中的基本机制领域试图打破这个极限,并解释为什么量子理论如此具有预测性。例如,“许多世界”的解释消除了量子幽灵,取而代之的是令人难以置信的命题,即每次观察都会产生一个新的宇宙。在这个极限下工作的兴奋之处在于智力探究在预测和理解的表象之间闪烁的方式。在这里区分认识论问题和本体论问题并非易事;它们是密切相关的,甚至是 “耦合 ”或 “纠缠 ”的。

让问题消失的一个无情方法就是简单地宣布,在适当的限度下,本体论会消失——这是哥本哈根量子力学学派的精确伎俩,他们的被动攻击格言是:“闭嘴计算!(用大卫·梅尔明 (David Mermin) 臭名昭著的造词来说)。换句话说,不要再喋喋不休地谈论量子幽灵的可能解释;寻找基本机制是浪费时间。然而,如今,现代计算机比量子理论家更缺乏说话的倾向,除了安静而高深莫测的计算之外,什么都不想做。

理解语音不是目标;预测正确的翻译是

很少有科学家会满足于这样一个微不足道的智力交易。在科学中,说一个好的理论是一个优雅的理论几乎是不言而喻的——它编码了一个可以直观地理解和交流的简单(或“吝啬”)解释。根据这种事物观,一个好的理论允许一个人在头脑中全面地持有一个概念,即兴创作一个微型的内部宇宙。在某些领域,特别是数学物理学中,人类账户的微型宇宙和现实的大宇宙是汇合的。苹果和行星都遵循由相同的运动方程描述的轨迹。这种快乐的巧合可以被多种地描述为“一致性”、“一致性”或“尺度不变定律”的存在。

这些符合标准的理论中最引人注目的是观察到某些力的强度与距源的距离的平方成反比——这适用于大尺度的引力和小尺度的电磁学。正如已故物理学家 Murray Gell-Mann 所说:

“当我们剥开洋葱皮,渗透到基本粒子系统结构的越来越深层次时,我们因其在某个层次上的实用性而变得熟悉的数学暗示了新的数学,其中一些可能适用于下一个层次——或同一层次上的另一种现象。有时,即使是旧的数学也就足够了。”

但有时我们自己神秘的直觉会成为实际进步的障碍。使用计算机对自然语言进行分类、翻译和学习的案例说明了寻求科学现象的直观描述的危险。电影《2001:太空漫游》(1968 年)和《禁忌星球》(1956 年)中 HAL 和机器人罗比的魅力在于他们能够理解人类语言并以适当程度的不祥讽刺做出回应,这是人类对话者可以理解的。但机器翻译和语音识别的演变最终看起来完全不是这样。1980 年代和 90 年代最成功的早期语音识别方法采用基于人类语音结构的数学模型,专注于单词类别以及句子的高阶句法和语义关系。然后在 1990 年代后期,深度神经网络真正出现。这些算法忽略了许多先前的语言知识,而是允许单词通过纯粹声学水平的训练自发出现。理解语音不是目标;预测正确的翻译是。他们继续变得非常有效。一旦研究人员社区接受了算法的不透明性,务实的解决方案就变得非常清晰。

神经网络捕捉到了当代科学面临的束缚。它们表明,包含很少或不包含有关它们所代表系统的结构化数据的复杂模型如何仍然优于基于数十年研究和分析的理论。在这方面,语音识别的见解反映了从训练计算机在国际象棋和围棋中击败人类所收集到的见解:机器偏爱的表示和经验法则不需要反映人脑偏爱的表述和经验法则。解决国际象棋解决国际象棋问题,而不是思考。

但是,我们超越人类在国际象棋和语音识别方面的表现极限的方式是否揭示了克服我们对物理现实的预测极限——即在科学上取得进步——可能意味着什么?它能否告诉我们,人类对理解的需求是否阻碍了科学的成功?

他的历史提供了一些摆脱当前科学僵局的途径。柏拉图是最早解决理解困惑的人之一,在 Theaetetus 中。文本专门讨论认识论的问题——即一种感知、一个真实的判断或一个真实的信念,并增加了解释。在对话中,古怪的苏格拉底举出几何学、算术和天文学作为最后一类的例子。

伊曼纽尔·康德 (Immanuel Kant) 在他的《纯粹理性批判》(1781 年)中进一步发展了理解理论。康德区分了物质世界和心理表征世界——作为本体论的现实与作为认识论的心理知识。对康德来说,头脑中只有世界的表征,而物质世界只能通过这些表征来了解。这意味着我们所谓的理解只不过是经验现实的近似和不完美的表示,其柏拉图式的存在(或者可能不存在)是知识的终极极限。康德的论点并没有真正帮助我们区分理解和知识;相反,它将理解从可以捍卫的信念转变为无法验证的内部表征。

哲学家约翰·塞尔 (John Searle) 在他颇具影响力的著作《心智、大脑和科学》(Minds, Brains and Science,1984 年)中探讨了知识/理解的区别,他在书中着手挑战机器智能的 Pollyannas。Searle 让我们想象一下,一个人在一个房间里,母语不懂中文,但拥有一套词典和语法规则。当看到中文句子时,这些资源用于将目标句子翻译成母语英语。当一个人考虑这个思想实验时,很明显他不需要理解他正在翻译的语言——只需要翻译达到保真度。

“中国房间”是一种分析算法局限性的隐喻手段,例如那些可以列出数字场景中的元素或翻译网页上的句子的算法。在这两种情况下,正确的解决方案都是在对内容没有任何“理解”的情况下产生的。那么,Searle 正在寻找的这种缺失的理解的性质是什么呢?

理解的本质是知识传播和积累的基础

有许多培根工具可以代替 Searle 的房间——例如解决大型乘法问题的计算尺,或使用圆规和量角器证明定理的几何结构,或使用微积分中的积分规则来解决大甚至无限和。这些技术之所以有效,正是因为它们消除了理解的需要。只需准确地完成规定的步骤即可保证获得预期的结果。在每种情况下,要理解就是解释对数的逻辑和适当使用、量角器或圆规的运动几何特性,或者将矩形限制为近似区域的基本数值基础。因此,即使在日常数学的实践中,我们也体验到理解和预测之间的分裂。

理解是我们通过打开知识的黑匣子进行修改来克服悖论和幻觉世界的手段。理解是对合理错误的阐明。一旦我们认识到线框立方体在三维空间中被解释为固体,那么为什么我们一次只看到一个立方体面就很清楚了。

无需解释和理解即可获取数据。不良教育的定义就是用事实来演练:就像通过死记硬背日期和事件来学习历史一样。但真正的理解是期望其他人,或者更普遍的代理人,能够向我们解释他们的方法如何以及为什么有效。我们需要一些方法来复制一个想法并验证其准确性。此要求扩展到声称能够智能解决问题的非人类设备。机器需要能够说明它们做了什么,以及为什么。

解释的要求是将理解与教学联系起来的原因。“教学”是我们给因果机制的有效交流起的名字(“如果你遵循这些规则,你就会实现长除法”),而“学习”是对因果关系的直觉的获得(“这就是长除法规则起作用的原因”)。理解的本质是知识可靠传播和文化积累的基础。而且,推而广之,它也是所有长期预测的基础。

棱镜作家豪尔赫·路易斯·博尔赫斯 (Jorge Luis Borges) 在《名字的回声史》(History of the Echoes of a Name,1955 年)一文中写道:

“在时间和空间中孤立无援的神、一个梦和一个疯狂并意识到事实的人重复着一句晦涩难懂的话。这些词,以及它们的两个回声,是这些页面的主题。”

假设神是宇宙,我们渴望理解的梦想,而机器是疯狂的人,都在重复着他们晦涩难懂的陈述。总而言之,他们的话语和回声就是我们科学探究的系统。将复杂性科学与机器学习和人工智能相结合是 21 世纪的挑战。未来知识最成功的形式将是那些将人类的理解梦想与机器日益模糊的回声相协调的形式。

了解更多时间深度剖析,尽在于此@黄先生斜杠青年

商业咨询和顾问业务,请@yellowscholar

打开网易新闻 查看更多图片

关注我,带你先看到未来!♥

转载声明:除调整格式外,不得对原文做改写、改编。原创不易,谢谢!E-mail:yellow@aliyun.com

♥声明:本文为原创文本,非生成式,转载请注明出处!

商务咨询/顾问/请@yellowscholar♥作者:黄先生斜杠青年