自古以来,人们就在思考知识来自何处。“冯翼惟象,何以识之?”对此的思考甚至发展成了哲学的认识论这一分支。但真正跳脱玄谈,实际着手定量研究知识来源的,还要等到18世纪概率论的出现。
谁又会想到,一条证明并不复杂的简短公式,经过两个世纪跌宕和无数研究之后,人们才明白它就是获取可靠知识的钥匙。
英国靠它破译了二战德军的密码,保险业靠它完成精算,而人工智能更是靠它得到了一次飞跃。更出人意料的是,人工智能启发了科学家对人类心智的研究,他们发现,同一条公式同样掌管着人类的基本感知和高级认知。
这就是贝叶斯公式。黄黎原的这本《贝叶斯的博弈》为我们揭开的,正是这一公式的神秘面纱。本文节选自“达尔文遇上贝叶斯”章节。
《贝叶斯的博弈》
作者:黄黎原(Lê Nguyên Hoang)
译者:方弦
01
幸存者偏差
在第二次世界大战中,英国空军雇用了统计学家亚伯拉罕·瓦尔德研究战机装甲的最优化。英国空军注意到,除了前部发动机所在之处以外,从战斗中返回的战机被打得遍体鳞伤。
于是空军得出结论,应该减轻前部装甲来强化后部装甲。
瓦尔德惊呼:这不对!他的看法是,事情正好相反,飞机只有后部中弹证明了应该加强飞机的前部装甲。
瓦尔德的这个说法相当惊人。但这其实本质上类似于查尔斯·达尔文对生物中复杂结构的出现做出的解释。在这两种情况下,我们当中大部分人所忽略的微妙之处正是淘汰的过程,或者说,我们注意的只是选择中的幸存者。
在瓦尔德的情况中,被淘汰的就是那些前部中弹的飞机,这些飞机的发动机被摧毁甚至爆炸,因此无法返航。
与之相似的是,达尔文断言那些因缺陷而无法繁衍的动物物种不可避免走向灭亡,因此,在至今仍然存活的物种中,重大缺陷极少。
达尔文的演化理论受到了科学界的一致赞赏,但时至今日,它仍有许多伪科学的批评者。
智能设计论证正是这些人用以反驳的工具,这项论证如下。想象一下你在沙漠的正中,如果你偶然发现一块奇形怪状的石头,那么你不会惊奇于它是自然过程的产物。
然而,如果你发现了一块结构精巧的钟表,那么认为它可以通过完全自然的过程产生,似乎太愚蠢了。钟表的精巧结构似乎只能用有一位拥有智慧的设计师精心制作来解释。
同样,人体那令人惊叹的精巧结构,从骨骼与肌肉的生物力学,到免疫系统的组织,再到灵巧的眼睛以及复杂得难以理解的大脑,都只能是智能设计的结果,而这位拥有智慧的设计者只能是上帝。
这个论证可能看上去很有说服力。然而,除了其中将“拥有智慧的设计者”与上帝混为一谈这一点值得商榷以外,它也低估了我们上文所说的淘汰过程——达尔文将其称为自然选择。
02
遗传算法
达尔文式演化远远不止是人类智慧苍白的复制品,实际上它能轻易创造出人类智慧也难以想象的结构——常被引用的经典例子就是人类大脑。虽然演化知道怎么将它设计出来,但即使有了超级计算机,神经科学到现在还无法完全理解人类大脑。
来自达尔文式演化的这种精巧复杂如此摄人心魄,令计算机科学家与应用数学家转向了所谓的遗传算法,用以找出某些问题的答案,而除此以外的解法无人知晓。这些遗传算法除了模仿自然选择,还模仿了杂交与变异。
比如说,假设我们希望确定一个访问法国最大的 100 个城市的方法,使得路程费时最少。这个问题又叫作旅行推销员问题。每个访问城市的顺序都是问题的可能解答,而我们的目标是找出最优的解答。
这个问题的难点在于可能的解答有如恒河沙数,一共有 100! ≈ 10^157 个可能的路线。即使我们将地球上所有超级计算机组合起来,列出所有排列,完成这一任务所需的时间也远远超过了宇宙的年龄。
遗传算法对于这类问题的处理无比高效。这种算法的原则就是维持一个多样化的种群,其中包含有前途但并非最优的解答。在每一步迭代时,算法会选择群中的两个解答,对其进行杂交操作,在其中添加(有益的)变异,然后进行择,其中最差的解答会被淘汰。
奇怪的是,这种达尔文式的优化方法好得惊人,甚至是许多情况下最优秀的解法!
达尔文式演化在这种情境下比人类的智慧要做得更好。所以,自然的精巧作为反驳演化理论的论点并不令人信服。但我们在第 11 章仍然会谈到这个问题。
03
构筑自己的意见?
科学与伪科学之间的区别,是被称为“怀疑主义”“批判性思考”或者“探索派”的思想运动偏好的话题。这一思想运动主要讨论伪科学支持者的常见诡辩与认知偏差。这些论证中的错误的确相当糟糕,是大量阴谋论、替代医学和超常现象的基础。
对于某些人来说,对这些问题的正确反应是构筑自己的意见。然而,这种反应的危险在于,有些事情必须具有大量知识或者经验储备才能得出足够切中要害的意见,但这种反应难免导致对这些事情的怀疑,甚至是无法避免的偏见、误解和错误。
例如琳达问题、p 值争议或者差分隐私的概念就属于这一类情况。某些更重要的问题,比如疫苗的有效性、谷歌和Facebook的算法,以及气候变化的人为因素,也都属于这类情况。除非你花上好几年细细研究这些问题,否则你自己形成的意见必定缺乏足够的信息,也因此无足轻重。
我们十分希望即使只花上几个小时,最终也能在这些问题上得出正确的答案,但事实远非如此。比如说在琳达问题中,直觉会使我们的错误率比一只随机选择答案的黑猩猩的错误率还要高。统计学家汉斯·罗斯林就证明了这一点。
对于许多问题,比如女性平均受教育时间、自然灾害造成的死亡人数、世界贫困人口等,我们的表现比无知还要糟糕,我们一贯选择的都是错误答案!
更糟糕的是,要估计应该对自己的直觉有多少信心,对我们来说难上加难。
因此,即使花上相当长的时间思考并汲取有关某个问题的信息,我们对于自己理解了多少,以及自己的意见是否考虑了足够多的信息,了解起来可能还是相当困难的。
雪上加霜的是,德里克·穆勒的博士论文证明,哪怕是对物理现象完全正确的视频解释,也可能会提高学生对自身直觉的信赖,即使学生刚才观看的视频解释完全否定了这些直觉!我们每个人都经历过太多次这种反复出现的自信过度了。
你可能也明白,这就是我在本书中尝试克服的主要认知偏差。这也是贝叶斯公式、埃尔德什在蒙蒂·霍尔问题中遇到的困难,以及所罗门诺夫不完备性迫使我们承认的东西:我们总是过分自信。
正如伟大的逻辑学家伯特兰·罗素所言:“世界上所有问题的根源在于,笨蛋和盲信者总是无比自信,而更有智慧的人却一直在怀疑。”艾蒂安·克莱因补充道:“要尽量避免得出结论。”
实际上,“只靠自己”去相信任何事物是个难于登天的任务,其中布满无法逾越的障碍。我很不建议你这样做。如果构筑正确的意见那么容易的话,那高等研究就不需要花那么长的时间了,而且知识也不会被如此切分为相互隔绝的学科了。
如果没有足够的财力、时间和认知能力去沉浸在特定问题的详细研究之中的话,那么我们就难免需要依靠他人的意见。这并不是个坏习惯。
实用贝叶斯主义者也更倾向于利用其他人在数十年甚至数百年中做出的工作来细化自身对世界的理解。即使是纯粹贝叶斯主义者也知道,其他个体能访问众多她无法访问的数据,所以她有不少东西可以向这些人学习。
上文转自图灵新知,节选自《贝叶斯的博弈》,【遇见数学】已获转发许可。
《贝叶斯的博弈:数学、思维与人工智能》
作者:黄黎原(Lê Nguyên Hoang)
译者:方弦
法国数学类科普书、大学数学参考及教材类图书畅销书目,深受读者好评。
有人生前波澜不惊,死后却名声大振,贝叶斯就是其中之一。以他命名的“贝叶斯定理”堪称一座知识宝库,从神经科学到人工智能,无所不及。
一个充满启示,实现革新,改变人类认知和预测方式,颠覆固有思维的奇妙定理。
入门级读物,谈论科学的新方式,严谨而全面,无须过多数学专业知识也可畅读。