文 | 追问nextquestion01 摘要
本文提出了一种基于自由能原理(FEP)的简约解释,试图从生物学理论的角度解释早期智人(Homo erectus)的行为演化,特别是他们制作石斧的行为。“认知惊奇”(cognitive surprise)可能促使早期智人偶尔展现出非传统或异常的行为,这些行为的协同演化倾向,如“蛇梯棋”游戏一样揭示了石器时代智人某些行为的出现、消失及再次出现的模式。
当这些遗物出现在早期和中新世记录中时,人类学家和考古学家通常会将它们想象成早期人类在想象中的系谱“梯子”上攀登的证据,用来解释人类认知能力如何渐进式发展,实现越来越创新的技艺,并最终导致了智人的认知优势。
然而,Héctor Marín Manrique, Karl Friston和Michael Walker提出了一种不同的假设:异常个体的行为并非总是被群体所接纳,群体可能无法理解或想象这些与以往不同的行为所带来的潜在优势,甚至无法表达这种不同。这种理解上的失败和偶发的种群事件,可能导致这些异常行为被忽略,从而不为后世所记。这种情况犹如在“蛇梯棋”中沿“蛇”滑落,可能会在人类行为演化的历程中造成断层,留下难以解释的进化谜团。
▷Manrique, Héctor Marín, Karl John Friston, and Michael John Walker. "‘Snakes and ladders’ in paleoanthropology: From cognitive surprise to skillfulness a million years ago." Physics of life reviews (2024).
02 “手斧”:考古学案例
石制“手斧”(Handaxes)是人类活动在早期和中期更新世的证据之一[1-2],它被归类为“双面剥片大型切削工具”(Bifacially-flaked large cutting tools”,简称BFLCTs),同属于此类的还有“薄刃斧”(Cleavers)。
▷一件早期“手斧”和一件“薄刃斧”,来自西欧(以厘米为单位标度)。
这些“手斧”的纵向和横向对称性,是其普遍且显著的特点,早在约170至160万年前便已经存在[3]。人们普遍认为,这种对称性体现了制作者的主观意图,即在制作工具前,制作者就已经对其外形进行了预设[4]。
这种预设反映了制作者在神经生物学上的一种认知意识倾向,即他们能够从一块原始石块中塑造出预想的三维形状,如“手斧”的形状[5-9]。旧石器时代的考古学家普遍认同,形态技术上的规律性可以在这些工具的形状中感知到,这标志着“手斧”其他缺乏此类特征的简单石器之间有着本质的区别,无论这些简单石器是否来源于“手斧”的遗址。
虽然BFLCTs代表了复杂的石制切削工具,其制作方式是通过从石块上削去大片部分而成,但它们并非最早的切削工具。最古老的剥片石器出现在约340万年前的非洲上新世晚期,其创造者可能是南方古猿人,而最古老的归为人类的化石骨骼则可以追溯到280万年前;在大约258万年前的早期更新世开始时,我们的远古祖先开始表现出合作的迹象。这些迹象之一就是他们制作的工具,这些工具通过敲打石块制成,留下的形状像贝壳一样,非常适合用手抓握。
相较于BFLCTs,这些更早期的工具在制作工艺上较为简单。更加精细的“手斧”首次出现在东非约176万年前,当时直立人已经取代了几种早期的人科动物[10-14]。在南非,“手斧”大约出现在160万年前[15],此后“手斧”在非洲和欧亚大陆的旧石器时代记录中都有零星出现,但在时间和空间上的分布并不均匀。从更晚的早期更新世开始,BFLCTs在西亚和南亚的少数几个遗址中出现,时间跨度从150万至100万年前。也就是说,BFLCTs是由各种形态的人类在长达150多万年的时间里持续制造的。
上面提到的300万年前就出现的简单石器,如“砍砸器”(choppers),它的考古发现一直延续到最近的千年。也就是说,当176万年前,人们开始通过更精细的双面剥片制作“手斧”时,那些更早期的更简单的手工技术在时间和空间上仍然广泛存在,与“手斧”的制造形成鲜明对比。后者在其首次出现后的一百多万年中的记录是间歇和稀疏的,因而它并非是正统的制作工艺。它们的稀少也支持了一个推论:从这些双面剥片石器的发明到它们在旧石器时代生活中发挥重要作用之间,可能存在数十万年的时间跨度。
▷砍砸器
于是这产生了一系列问题。既然“手斧”的制造反映了一种明确的意图性,那么这种认识是如何在早期人类成员中产生的?它可能已经产生过多少次?它是否在多个时间和地点出现和消失?[16]我们可以认为它只产生过一次,之后不仅技巧性地代代相传,而且还作为一种技能从一个社区传递到另一社区,在时间和空间上产生了深远的影响吗?
一些旧石器时代的考古学家和古人类学家认为这种可能性是可信的。它基于一种“进步主义”的假设,即BFLCTs为早期人类提供了功能优势。这些优势具有明显的适应价值,有助于生存并且促进了人口的日渐增长和繁殖成功。这些技能通过使早期人类能够广泛利用生态区和生物群落的资源,推动了人口和地理的扩张。
但这种观点遭到了来自许多方面的反驳。首先,“手斧”存在的时间和空间跨度极大。即使在地理区域≥500公里范围内发现了几个包含“手斧”的考古组合,并且这些考古年代可以归在一个大致相似的时间段(可能≥200,000年),我们也难以断言这一定代表了一种连续不断、世代相传的“文化传统”。因为如果一个世代平均持续25年,那么200,000年意味着8000个世代,这对用“社会传播”、“累积文化”和“文化历史”的方法来解释考古记录的可能性(更不用说合理性)构成了重大挑战。
其次,手斧的时空分布并不规律,在时间上多次呈现“出现,消失,然后又出现”的特征,在空间的分布上也较为零散,如果我们认为手斧的制作是文化传播的结果,并且带来了生存优势,就很难解释这种稀疏性和间歇性。有观点认为,手斧的“社会传播”或“文化传播”在考古记录中的保存并不完整,但这仅是一种补救性的解释。最后,如果“手斧”与制作工艺更简单的“砍砸器”并存,且后者并未显示出显著的优势,为什么“砍砸器”会被不断制作出来呢?
本文将对此现象,给出一种基于自由能原理(FEP)的简约解释[17]。它除了可以解释“手斧”等石器工具,也可以解释古人类的其它技术发展。为此,我们首先引入一个很有帮助的类比——“蛇梯棋”游戏。
03 “蛇梯棋”游戏的类比
古老的“蛇梯棋”是一种适合两个或更多玩家的桌游,棋盘如下图。棋盘上的梯子和蛇分别连接两个不同的方格。游戏开始时,玩家的棋子放置在起点(编号为1的方格),通过投掷骰子来决定前进的步数,若投出6点,就可以再投一次。
如果棋子停留在梯子的下端,就可以沿梯子上升至对应的上端;若停留在蛇的头部,则须沿蛇身滑落至尾部。首先到达终点的玩家获胜。显然,游戏过程中,玩家的棋子经历多次升降,有时甚至在某些位置循环徘徊。
▷蛇梯棋:https://en.wikipedia.org/wiki/Snakes_and_ladders
从“文化累积”的角度看,人类的技术和文化的发展如爬梯子一般不断上升。但实际上,历时两百万年的“人类上升”就像这个游戏一样,并非一帆风顺,也不是直线前进的。夸张地说,它几乎可以被看作一个寓言,描述了我们在技术和文化发展过程中,以蜗牛般的速度,缓慢、犹豫、跌跌撞撞,有时甚至倒退。“手斧”这种规律性技术在时空范围内的不规律出现,也可以这样理解。
接下来的论点将解释为什么这种发展模式是蹒跚而断续的。这一论点植根于自组织物理学的理论。简单来说,远离平衡状态的自组织系统必然呈现一种特殊的巡游行为,这种行为在许多方面都与“蛇梯棋”游戏的特点相似[17]。
04 自由能原理、主动推理与人类进化
自由能原理(FEP)提供了一种基于统计物理学的非琐碎、第一性原理的方法,来理解自组织系统(如生物体)是如何调节其响应以适应进化的,以及具有感知能力的生物(即能够体验感觉的主体)如何做出行为反应。我们特别考虑那些具有“层次机制性心智”(hierarchically mechanistic mind,简称HMM)的动物[18-19]。
HMM将具身、定位的大脑定义为一个复杂的自适应系统,该系统通过其内部分层组织的神经认知机制之间的动态相互作用,产生感知-行动周期,主动地最小化人类感觉和身体状态的熵(即扩散或衰减)[19]。HMM可以看作是一种神经生物学推理机[20],它的运行机制符合自由能原理。
自由能原理指出,所有生物都倾向于消耗与生存相兼容的最小能量。然而,可适应环境的自组织系统却会通过主动推理,在感知预测之外对变化的环境进行反应,消耗更多的能量。这种试图最小化的能量,被定义为自由能,它可以衡量对外部的感知预测与内部信念(偏好、先验)之间的差异。可以简单地认为,感知预测是根据外部接受到的信息所进行的“客观推理”,比如走在路上遇到了下雨,我们根据对雨滴的视觉观察、触感做出自己会被淋湿的预测,而内部信念的偏好则是不希望被淋湿的主观意愿。前者与是否厌恶被淋湿无关。
生物系统需要尽可能减小感官预测与信念预测之间的差异。要做到这一点,除了可以通过根据外部信息修正信念,比如在上述情景中不得不接受被打湿的事实,还可以通过行动改变外部世界的状态,也就是跑去避雨。在基于自由能原理的主动推理的框架下,生物体的认知和行为都遵循相同的规则,服务于最小化感知上的惊奇(surprise),惊奇即是一种预测误差(prediction error)。在信息论和预测编码的贝叶斯条件概率分析中,这种预测误差通常被称为“意外”或“自信息”,其计算方式是可能事件概率的负对数。
▷自由能原理中,系统的状态可分为四类:代表外部环境的外部状态(external state)、智能体的观测状态(sensation state)、内部状态(internal state)以及动作状态(action state)。
对生态系统中的生物而言,负自由能被视为其适应度的一种表现,它要求生物与生态位之间的互动达到热力学效率的最优化。自由能作为一种信息度量,衡量了各种结果对生物体来说的平均惊奇程度。因此,当一个生物体能够准确模拟并预测其与生态位的交互时,我们便可以说它已经适应了那个环境。因为它避免了与环境的惊奇交换(例如,偏离稳态设定点),或者避免处于极低概率的状态(例如,受伤或死亡)。
某些生物,例如人类,已经发展出深层的生成模型,有能力预测其行为的结果。这种生物有能力设想不同行动下的“反事实未来”:简单地说,他可以进行规划[21-25]。因为这种生物在进行感知预测时,会将其即将执行的行动纳入考量,从而能预测各种行动的潜在结果,并据此作出行动决策,以进行主动推断(规划)。
这是“主动推理”的一个关键方面:根据最小化计划下的预期自由能来选择行动和计划。更简单地说,行动的选择旨在最小化预期的惊奇,以避免发生低概率的不良事件(如受伤或死亡),并通过产生的结果减少对环境的不确定性。减少不确定性是至关重要的,因为它意味着在深层生成模型规定下的感知行为具有认识的方面,使感知行为对显著性和新颖性保持敏感。
只有具有这种深层生成模型的系统才会表现出这种探索行为,因为它们是唯一能够响应认知启示并回答“如果我这样做会发生什么?”的系统[26-28]。因此,驱动计划或策略选择的预期自由能可以分解为实用和认知部分,分别支撑实用性(exploitative)行为和探索性(exploratory)行为。
我们可以这样理解:如果一个生物能够尝试预见未来行为的后果,那么在行动尚未展开之前,其心中便充满了由想象带来的种种可能性与惊奇。这种对未来结果的预期,促使个体试图降低感知中的惊奇,从而增强对环境的掌控力,并更深入地理解各种行为可能带来的后果。这便是探索性行为的动力所在。
在生物进化的大背景下,自由能最小化不仅支撑着生物的存活,还包括其成功繁衍后代的能力[29-30]。自然选择是渐进和保守的,面对环境相互依赖性和规律性,生物的生成性自组织系统的完整性,是由包括“主动推理”在内的适应性交互所支持的。这种“主动推理”与由生成模型所引发的,以及由进化所赋予的先验期望密切相关[31-33]。主动推理实例化了一个生成模型,其组成部分是大脑中能够预测接下来最有可能感知的神经网络。在条件概率的贝叶斯统计中,进化和自然选择可以被视为自然的“贝叶斯模型选择”(也称为“结构学习”[34])。
因此,进化在生物、技术,甚至是在心理社会层面上逐渐且间歇性地发展[35-37]。自由能原理与生物学,特别是神经生物学相关,无论是在细胞动力学、神经回路和行为的个体发育层面,还是在通过生物适应和适应性的自然选择进化的种群的系统发育层面。
05 “认知惊喜”与“蛇梯图”
现在,让我们利用前文的观点来解读与“手斧”相关的考古发现。在讨论这一主题时,我们或许不应过分强调“群体大小”在推动“手斧”制作技术社会传播方面的作用,反而应更多地关注个体层面。即,是什么激发了制作者对制造石制“手斧”可能性的认知意识?以及观察者(其它同伴或者制作者本身)对这种创新做法的反应又是如何?
在传统工具作为主流的环境下,个体耗费更多时间和精力制作精细的、步骤更繁复的“手斧”,需要一种探索性的倾向,意识到采用不同的方式制作可能产生什么结果(如我们在文中第一部分所见,“手斧”的形态反映了制作者对形状的预先设想),或者认识到新技术的产物可能带来更长远的实用性价值,也即减小后续能量消耗的潜在可能。这些都需要个体具备更深层次的生成模型。
于是我们可以这样认为,在“手斧”存在的时空跨度中,各种古人类群体的整体认知能力,并未达到能够认识到“手斧”的创新性和长远价值的水平[38-39]。然而,偶尔也会有个别个体可以拥有更具表达性(即更深层次)的生成模型,洞察这种探索(认知)和利用(实用)价值,于是在偶然的情况下发展出了这些更复杂的工艺。但是,群体中的其他个体(有时包括这些异常个体自身)往往未能意识到同伴这种创新行为的特殊之处,并未产生“认知惊奇”[40]。
对于旁观者来说,这种行为与他们的行为模式库中的典型活动不吻合,因为典型活动是基于他们实用的先验知识,而这种有利的先验的规范性信念往往会压倒对新认知的探索。这就导致了这些新的创造并未被群体所接受,创造者的“技艺”被视为浪费了群体为维持生存所需的(不可调和的)宝贵能量和时间。
值得注意的是,在维持基础稳态时,我们的大脑在休息状态下每公斤消耗11.2瓦特的能量,而整个身体仅消耗1.25瓦特/公斤,耗费了我们50%的葡萄糖摄入量和20%的氧气摄入量,其中75-80%的能量用于支持脑神经元的活动[41]。
因此,直立人一百万年前的活动必须满足更大的日常能量需求,否则我们今天就不会存在。这种情况下,经过验证的例行公事成了生活的主导,那些能高效执行这些任务的人赢得了群体的信任,而那些古怪、非正统或异质的行为则被置于不闻不问之中,未能在集体的记忆或传说中留下痕迹。此外,在我们的远古祖先制作石器时,他们通过敲击大石块来打造工具,过程中偶尔会敲出一些奇特的形状。这些形状其实是意外产生的,当时的人们可能并没有意识到这些偶然形成的石块也可以用作工具[42-43],尽管考古学家从比较形态学的角度将它们分类为工具。
▷Vadim Sherbakov
总的来说,我们认为,在早期和中期更新世时期,那些异常的、异质的行为活动在人类成员中遭遇的命运就是这样起起落落。在技术能力“梯子”上看似达到的个人成就,很可能被同伴忽视,他们无法想象或表达这些行为可能带来的生存优势。并且,彼时的人类缺乏足够流畅的沟通能力,再加上各种人口事故,异质行为的记录往往会丢失。即使这些技术在某些小型的狩猎采集群体中被记住,它们也可能因人口的波动而在灭绝时消失。
那个时期的人类交流十分有限,即便存在语言沟通也相当原始;加之该时期人类寿命较短,生物成熟期早于现在,脑容量也有限(这些小型大脑只有我们今天大脑大小的三分之二),这在任何情况下都限制了小型成人脑中神经生物学的灵活性,进而影响了深层次的认知能力*。
论文原文第四部分着重讨论了直立人与现代人在细节上的大脑差异,由于与文章的整体逻辑无关,仅作为佐证,在这里不再赘述。
除此之外,群体还面临各种各样灭绝的风险,如不平等的性别比例、分娩时的死亡或先天性残疾、感染、牙齿脱落,或由于瘟疫、枯萎、干旱、洪水、野火、霜冻、暴风雪或其他暴力气候事件造成的食物或水稀缺。这些因素共同作用,导致异常行为结果难以在种群中稳定传承。
最后一个问题是,如果这些分布在各个地点以及各个时间的“手斧”是由不同的个体独立制作的,那么它们的形态为何会具有一定的相似性呢?比如横向和纵向的对称性等。
对此,我们或许可以理解为,自组织的本质具有内在的周期性、随机性以及最小化自由能的倾向,这使得系统总会反复探索巨大状态空间中的某些特定状态,从而导致深层的生成模型在偏好上呈现某种相似性(比如对对称性的意识,显然,对称在认知上是更加简洁的,符合最小化的原则)。同时,原料的局限性、生理结构(比如便于抓握)等也限制了制作的形态。这使得各地出土的不同时间制作的“手斧”等工具可以在独立制作的情况下具有某种形态上的相似性,这种相似除巧合外也有一定进化的必然性,并不一定是文化传播的结果。
总而言之,在审视“手斧”技术的演变过程中,我们发现了技术发展的不规则性和周期性,这种现象并非人类特有的历史剧本,而是一种普遍存在于生物系统中的自组织行为。自由能原理为我们提供了一个理解这种现象的有力工具。
技术的每次“跳跃”或“滑落”都可能是对外部环境变化的一种适应性回应,其中既包括物理环境的变化,也包括社会、经济和文化背景的转变。在全球化和快速信息流动的当代社会,人类技术和文化的发展可能呈现出更加复杂的动态变化。
正因如此,我们更应促进开放的创新体系,允许“非传统”思维的存在和发展。通过这样的开放与合作,可以最大限度地减少技术进步中的“惊奇”元素,促进一个更为稳定和可持续的技术和文化发展环境。
参考文献
[1] de la Torre I, Mora R, Domínguez-Rodrigo M, de Luque L, Alcal´a L. The Oldowan industry of Peninj and its bearing on the reconstruction of the technological skills of Lower Pleistocene hominids. J Hum Evol 2003;44(2):203–24.
https://doi.org/10.1016/s0047-2484(02)00206-3.
[2] de la Torre I, Mora R. The early Acheulean in Peninj (Lake Natron, Tanzania). J Anthropol Archaeol 2008;27(2):244–68. https://doi.org/10.1016/j.jaa.2007.12.001.
[3] Diez-Martín F, Wynn T, S´anchez-Yustos P, Duque J, Fraile C, de Francisco Rodríguez S, Uribelarrea D, Mabulla A, Baquedano E, Domínguez-Rodrigo M.A faltering origin for the Acheulean? Technological and cognitive implications from FLK West (Olduvai Gorge, Tanzania). Quat Int 2019;526:49–66. https://doi.org/10.1016/jquaint.2019.09.023.
[4] Shipton C, Clarkson C, Cobden R. Were Acheulean bifaces deliberately made symmetrical? Archaeological and experimental evidence. Camb Archaeol J 2018;29(1):65–79. https://doi.org/10.1017/S095977431800032X.
[5] Wynn T. The evolution of spatial competence. Urbana and Chicago: University of Illinois Press; 1989. ‘Illinois Studies in Communication’ and ‘Illinois Studies in Anthropology No. 17.’.
[6] Wynn T. Archaeology and cognitive evolution. Behav Brain Sci 2002;25(3):389–438. https://doi.org/10.1017/s0140525x020000794.
[7] Hodgson D. Evolution of the visual cortex and the emergence of symmetry in the Acheulean techno-complex. C R Palevol 2009;8:93–7. https://doi.org/10.1016/j.crpv.2008.10.009.
[8] Hodgson D. The symmetry of Acheulean handaxes and cognitive evolution. J Archaeol Sci Rep 2015;2:204–8. https://doi.org/10.1017/j.jasr2015.02.002.
[9] Hodgson D. Stone tools and spatial cognition. In K.A. Overmann, & F.L. Coolidge (editors). Squeezing minds from stones. Cognitive archaeology and the evolution of the human mind. Oxford: Oxford University Press; 2019. p. 200–24.
[10]: Asfaw B, Beyene Y, Suwa G, Walter RC, White TD, WoldeGabriel G, et al. The earliest Acheulean from Konso-Gardula. Nature 1992;360(6406):732–5. https://doi.org/10.1038/360732a0.
[11]: Beyene Y, Katoh S, WoldeGabriel G, Hart WK, Uto K, Sudo M, Kondo M, Hyodo M, Renne PR, Suwa G, Asfaw B. The characteristics and chronology of the earliest Acheulean at Konso, Ethiopia. Proc Natl Acad Sci USA 2013;110(5):1584–91. https://doi.org/10.1073/pnas.1221285110.
[12] Duke H, Feibel C, Harmand S. Before the Acheulean: the emergence of bifacial shaping at Kokiselei 6 (1.8 Ma), West Turkana, Kenya. J Hum Evol 2021;159:103061. https://doi.org/10.1016/j.jhevol.2021.103061.
[13] Lepre CJ, Roche H, Kent DV, Harmand S, Quinn RL, Brugal JP, Texier PJ, Lenoble A, Feibel CS. An earlier origin for the Acheulian. Nature 2011;477(7362):82–5. https://doi.org/10.1038/nature10372.
[14] Roche H, Brugal JP, Delagnes A, Feibel C, Harmand S, Kibunjia M, Prat P, Texier PJ. Les sites arch´eologiques plio-pl´eistoc`enes de la formation de Nachukui,
Ouest-Turkana, Kenya: bilan synth´etique 1997–2001. C R Palevol 2003;2(8):663–73. https://doi.org/10.1016/j.crpv.2003.06.001.
[15] Kuman K. 21. Development of the archaeological record in southern Africa during the earlier stone age. In J. Kingh, & S.W. Grab (editors). Quaternary environmental change in southern Africa: physical and human dimensions. Cambridge: Cambridge University Press; 2016. p. 349–70. https://doi.org/10.1017/CBO9781107295483.021.
[16] Bar-Yosef O. The known and the unknown about the Acheulian. In N. Goren-Inbar, & G. Sharon (editors). Axe age: Acheulian tool-making from quarry to discard. London and Oakville CT: Equinox Publishing Ltd; 2006. p. 479–94. “Approaches to Anthropological Archaeology”. http://refhub.elsevier.com/S1571-0645(24)00004-6/sbref0022
[17] Friston K, Da Costa L, Sakthivadivel DAR, Heins C, Pavliotis GA, Ramstead M, Parr T. Path integrals, particular kinds, and strange things. Phys Life Rev 2023.
https://doi.org/10.1016/j-plrev.2023.08.016. PLREV 1451(pre-proof).
[18]Badcock PB, Friston KJ, Ramstead MJD, Ploeger A, Hohwy J. The hierarchically mechanistic mind: an evolutionary systems theory of the human brain,cognition, and behavior. Cogn Affect Behav Neurosci 2019;19:1319–51. https://doi.org/10.3758/s13415-019-00721-3.
[19] Badcock PB, Friston KJ, Ramstead MJD. The hierarchically mechanistic mind: a free-energy formulation of the human psyche. Phys Life Rev 2019;31(10):104–21. j.plrev.2018.10.002. http://refhub.elsevier.com/S1571-0645(24)00004-6/sbref0018
[20] Parr T, Pezzulo G, Friston K. Active inference: the free energy principle in mind, brain, and behavior. Cambridge MA and London: The MIT Press; 2022. http://refhub.elsevier.com/S1571-0645(24)00004-6/sbref0217
[21] Attias H. Planning by probabilistic inference. In: Proceedings of the Ninth International Workshop on Artificial Intelligence and Statistics; 2003. p. 9–16. PMLRR4. http://refhub.elsevier.com/S1571-0645(24)00004-6/sbref0016
[22] Botvinick M, Toussaint M. Planning as inference. Trends Cogn Sci 2012;16(10):485–8. https://doi.org/10.1016/j.tics.2012.08.006.
[23] Friston K, FitzGerald T, Rigoli F, Schwartenbeck P, Pezzulo G. Active inference: a process theory. Neural Comput 2017;29(1):1–49. https://doi.org/10.1162/NECO_a_00912.
[24] Friston KJ, Lin M, Frith CD, Pezzulo G, Hobson JA, Ondobaka S. Active inference, curiosity and insight. Neural Comput 2017;29(10):2633–83. https://doi.org/10.1162/neco_a_00999.
[25] Millidge, B., (2019). Deep active inference as variational policy gradients. Preprint in arXiv:1907.03876.
[26] Schmidhuber J. Developmental robotics, optimal artificial curiosity, creativity, music, and the fine arts. Connect Sci 2006;18(2):173–87. https://doi.org/10.1080/09540090600768658.
[27] Schwartenbeck P, Passecker J, Hauser TU, FitzGerald THB, Kronbichler M, Friston KJ. Computational mechanisms of curiosity and goal-directed exploration.
eLife 2019;8:41703. https://doi.org/10.7554/eLife.41703.
[28] Still S, Precup D. An information-theoretic approach to curiosity-driven reinforcement learning. Theory Biosci 2012;131(3):139–48. https://doi.org/10.1007/s12064-011-0142-z.
[29] Frank SA. Natural selection. V. How to read the fundamental equations of evolutionary change in terms of information theory. J Evol Biol 2012;25(12):2377–96. https://doi.org/10.1111/jeb.12010.
[30] Friston K, Friedman DA, Constant A, Knight VB, Fields C, Parr T, Campbell JO. A variational synthesis of evolutionary and developmental dynamics. Entropy2023;25:964. https://doi.org/10.39390/e25070964.
[31] Friston K. The free-energy principle: a unified brain theory? Nat Rev Neurosci 2010;11:127–38. https://doi.org/10.1038/nrn2787.
[32] Friston KJ, Rosch R, Parr T, Price C, Bowman H. Deep temporal models and active inference. Neurosci Biobehav Rev 2018;90:486–501. https://doi.org/10.1016/j.neubiorev.2018.04.004.
[33] Parr T, Friston KJ. Generalised free energy and active inference. Biol Cybern 2019;113(5–6):495–513. https://doi.org/10.1007/s00442-019-00805w.
[34] Smith, R., Schwartenbeck, P., Parr, T., & Friston, K.J. (2019). An active inference approach to modeling structure learning: concept learning as an examplecase. Preprint in bioRxiv: 633677. 10.1101/633677. http://10.1101/633677
[35] Ramstead MJD, Badcock PB, Friston KJ. Answering Schr¨odinger’s question: a free-energy formulation. Phys Life Rev 2017;24:1–16. https://doi.org/10.1016/j.plrev.2017.09.001.
[36] Ramstead MJD, Badcock PB, Friston KJ. Variational neuroethology: answering further questions: reply to comments on ‘Answering Schr¨odinger’s question: a
free-energy formulation. Phys Life Rev 2018;24:59–66. https://doi.org/10.1016/j.plrev.2018.01.003.
[37] Ramstead MJD, Constant A, Badcock PB, Friston KJ. Variational ecology and the physics of sentient systems. Phys Life Rev 2019;31:188–205. https://doi.org/10.1016/j.plrev.2018.12.002.
[38]Friston K, Rigoli F, Ognibene D, Mathys C, Fitzgerald T, Pezzulo G. Active inference and epistemic value. Cogn Neurosci 2015;6(4):187–224. https://doi.org/10.1080/17588928.2015.1020053.
[39] Friston K, Adams R, Montague R. What is value - accumulated reward or evidence? Front Neurorobot 2012;6:11. https://doi.org/10.3389/fnbot.2012.00011999.
[40] Manrique HM, Walker MJ. To copy or not to copy? That is the question! From chimpanzees to the foundation of human technological culture. Phys Life Rev2023;45:6–24. https://doi.org/10.1016/j.plrev.2023.02.005.
[41] Hyder F, Rothman DL, Bennett MR. Cortical energy demands of signaling and nonsignaling components in brain are conserved across mammalian species and activity levels. Proc Natl Acad Sci USA 2013;110(9):3549–54. 10.1073 pnas.1214912110. http://refhub.elsevier.com/S1571-0645(24)00004-6/sbref0138
[42] Gould SJ, Lewontin RC. The spandrels of San Marco and the Panglossian paradigm: a critique of the adaptationist program. Proc R Soc Lond Ser B 1979;205(1161):581–98. https://doi.org/10.1002/rspb.1979.0086.
[43] Moore MW. ‘Grammars of action’ and stone flaking design space. In A. Nowell, & I. Davidson, (editors). Stone tools and the evolution of human cognition.Boulder: University Press of Colorado; 2010. p. 13–43. http://refhub.elsevier.com/S1571-0645(24)00004-6/sbref0203