超级人工智能变得越来越像人,而现在的教育却让很多学生放弃思考和追问。
最近,Open AI发布新一代大模型“o1”,它可以像人类一样 深度 思 考 ,具备复杂推理能力。当 处理数学、物理、化学等 复杂问题时, “o1”的表现甚至和该领域的博士生不相上下。
如果说之前的Chatgpt像一个文科生,在文字识别、处理和生成等方面表现突出;“o1”模型就像一个理科学霸, 在国际数学奥林匹克竞赛资格考试中,模型正确解决了83%的问题,相比之下GPT-4o仅能解决13%的问题。
探究“o1”的工作原理,我发现人工智能的学习方式,对于学生的学习也有很大启示:
1、自我学习
模型通过自我对弈强化学习(Reinforcement Learning),类似AlphaGo自学围棋的过程,左右互搏, 自我推演,通过自我对抗提升解决问题的能力。
这种方法类似于人类通过不断尝试和纠错来掌握新技能。 犯错是必然的,快速犯错,快速改错,从而快速找到正确答案。
机器在这方面比人类更强大,因为机器没有内耗和纠结, 犯错之后不会懊恼和自责,而是立即调整策略,投入下一个挑战。
2、思维链条
通过内置的思维链(Chain of Thought, CoT)进行推导,并将其推理过程外化,使模型的决策过程更为透明。
思维链就像人类处理复杂问题的思路,把一个问题分解成一系列子问题,然后逐个解决这些子问题,从而得出最终答案。
数理化等理科为什么难学?因为思维链条长,情况复杂多变。学会把问题拆解,把大问题拆解成小问题,然后分而治之,各个击破。
3、推理标记
模型引入65536个推理标记(Reasoning Tokens),有助于模型在对话环境中进行深层思考。
我的理解是:在进行深度推理时,通过一些关键节点的路标,指引推理方向,选择不同的逻辑路径。
理科学习最难的是思路,尤其是面对复杂问题。如果你能够形成一套相对固定的解题流程,头脑中有相关知识的基本框架,你碰到任何一道新题时,就有多种选择,就有更多的解题思路。
此外,o1模型使用专门的训练数据集,包含了大量复杂问题和对应的解题步骤。换句话说,模型做了大量的相关练习,也没少“刷题”。
我一直关注人工智能技术的进化,我发现机器学习的路径是照搬人类、模仿人类、超越人类,机器变得越来越智能。反观当前的教育环境,还在强调学生死记硬背,而不是培养批判性思维和创新能力。填鸭式的教学方法只会让 学生越来越讨厌学习、讨厌思考。
学习不是逼不得已的任务,是人类必须具备的能力。终身学习,持续进化,与人工智能共生,这才是出路。
提高学习能力,才能面向未来。
—— 相关阅读 ——