图灵花了近10年时间陆陆续续引进了众多经典数学教材,《线性代数应该这样学(第3版)》便是其一,这本书被斯坦福大学等全球 40 多个国家、300 余所高校采用的数学教材,成为公认的阐述线性代数经典佳作。
今天,终于迎来了这本书的新版封面,也是与图灵专业数学系列丛书的封面保持一致,更美观!借林开亮老师的一篇文章,让更多的人看到这本书的经典之处。
图 | 作者谢尔登•阿克斯勒(Sheldon Axler)和他的猫
作者 | 林开亮,现任教于西北农林科技大学理学院
图书 | 《线性代数应该这样学(第3版)》
在中国,线性代数一般等同于矩阵论,这主要是受华罗庚先生的影响,他的矩阵功底炉火纯青,因此他的学生曾肯成教授这样说:“龙生龙,凤生凤,华罗庚的学生会打洞。”所谓“打洞”,就是用相似变换或其它矩阵变换将矩阵化成标准型(其中有很多元素为0,即“洞”)。
据华罗庚的另一得意弟子陆启铿院士讲,当初邀请华罗庚访问美国普林斯顿高等研究所的外尔(H. Weyl)曾这样评价:“华罗庚玩矩阵就像玩数字一样得心应手。”大概是陆启铿先生的话被人听岔了,做出这一评价的外尔教授,有时被讹传为韦伊(A. Weil)。稍微了解韦伊的人都知道,他不可能说这话。为什么呢?因为韦伊是法国布尔巴基学派的灵魂人物,他跟谢瓦莱(C. Chevalley)都致力于消除代数中的行列式、结式等计算性的概念,而华罗庚是以矩阵计算见长,绝非韦伊所欣赏的风格。
“ 即便是本科生的线性代数教学,也留下了阿廷(E. Artin)清晰可见的印记:他在我们面前从来绝口不提基和行列式(考虑到他是那么喜欢计算,这真是奇怪的禁令)。阿廷的盟友,谢瓦莱和韦伊,竭尽全力将行列式和结式驱逐出代数。每每想到革命尚未成功,九泉之下的两位(注:指1962年过世的阿廷和1984年过世的谢瓦莱,韦伊也在1998年过世)可能都无心睡眠。 ”
在这方面,韦伊和谢瓦莱的先驱,正是罗塔这里所提到的阿廷。荷兰数学家范德瓦尔登(van der Waerden)曾根据阿廷和诺特(E. Noether)的讲义,写成抽象代数的经典名著《近世代数》(后来更名为《代数学》,有中译本,科学出版社),此书直接刺激了布尔巴基学派的诞生。希尔伯特(Hilbert)、诺特、阿廷是近世代数的先驱,近世代数的思想一度在德国盛行。特别地,受到量子力学的刺激,冯•诺依曼(von Neumann)将这一思想应用到无限维空间的泛函分析中,导致了线性代数的几何化。
这方面的第一本书,就是冯•诺依曼在普林斯顿高等研究院的助手哈尔莫斯(P.R. Halmos)根据他的讲义写成的《有限维向量空间》(Finite-Dimensional Vector Spaces)。该书1942年出版,之后多次再版,现已成为经典(期待有朝一日能够引进中译本,这是笔者心目中独一无二的线代数圣经)。
眼下这本《线性代数应该这样学》(Linear Algebra Done Right 第三版),可以说,基本上是按照《有限维向量空间》的精神写的一本新书。这毫不奇怪,作者是圣弗朗西斯科州立大学数学系的教授阿克斯勒(Sheldon Axler)。他是哈尔莫斯的徒孙,中间的链接是萨拉森(Donald Sarason)。阿克斯勒写作这本书,可以追溯到他在1995年发表在《美国数学月刊》上的一篇阐述性文章《打倒行列式!》(Down with determinants!),该文次年获得了美国数学协会颁发的 Lester R. Ford 写作奖。标题取名为“打倒行列式! ”,也许在中国的读者看来,有点不可思议!因为在通行的线性代数教科书中,行列式通常放在一开头讲的,如果直接扔掉了,后面还怎么讲?事实上,这是完全可以做到的,《线性代数应该这样学》就做到了这一点。在全书中,迹和行列式是最后一章,而之前讲完了线性代数所有其它内容(尤其是作为矩阵灵魂的特征值与特征向量),根本不需用到这两个概念!
阿克斯勒之所以要打倒行列式,可能主要是想突出线性代数的本质方面是概念而非计算。正是出于对后一个看法的支持,促使我在这里向读者推荐这本书。
如前所说,线性代数的教学分两派:一派注重代数计算,以华罗庚先生为代表,这条线最终可溯源到美国的代数与数论学家迪克森(L. E. Dickson),中间的链接是杨武之教授(杨振宁的父亲,把近世代数和数论引进到中国);一派注重几何直观,以哈尔莫斯为代表,最终追溯到诺特和阿廷,中间的链接是冯•诺依曼。虽然我本人经受的课堂训练是偏计算的(教材用北大的经典《高等代数》,它以丁石孙先生的《高等代数简明教程》为蓝本,丁先生在自传中说他借鉴了苏联斯米尔诺夫的《高等数学教程》;课堂之外,我的高等代数老师、天津大学数学系田代军教授指引我去读华罗庚、万哲先的《典型群》以及雅各布森(N. Jacobson)的抽象代数著作),然而只是在我后来用哈尔莫斯的《有限维向量空间》重新学了一遍线性代数以后,我才敢说我对线性代数有了一点底气。我希望我说这话时,你不要认为我是在吹牛,我甚至希望这话能得到专业人士的认可,因为我在博士论文中的部分工作,就是用阿廷、冯•诺依曼、哈尔莫斯那一派的几何观念和方法,完善了华罗庚先生1947年的一项纯代数的矩阵工作。因此可以说,我是华罗庚先生和哈尔莫斯教授两派结合的产物。
代数计算将线性代数机械化了(我有一次在打乒乓球时感觉每一次回球就像在做一次初等变换),同时也变得有点无聊。我常常有一种天真的想法,也许可以考虑用吴文俊先生倡导的数学机械化,将华罗庚学派炉火纯青的打洞技术给实现了!
要想让线性代数生动起来,除了介绍一些精彩应用的例子外, 一个可行的办法是强调几何的语言。几何的语言, 自然是相对于代数的语言而说的。简单讲, 就是用线性变换代替矩阵, 用抽象向量代替列向量。几何语言的优点是简洁明快, 例如“作用(action)”这个词给人的感觉就是如此。代数语言的好处是具体清晰, 两个矩阵“相乘”在我们头脑中的图象,是一系列具体运算的运作。通常的教科书往往过分强调了代数的语言, 这同时也充分暴露了其诸多弊端。最大的缺点在于容易将几何淹没于代数。而且,在很多问题中坐标的选取并不重要,我们所需要的往往只是一些基本的运算规律, 例如分配律、结合律等。这时抽象的几何语言就十分适用了, 例如在内积空间的理论中, 我们往往采用几何语言。其实,数学家正是靠这种几何观点来指引具体的代数运算的, 例如所谓Gram-Schmidt正交化, 无非就是将第二个向量沿第一个向量作垂线(从三角形的一个顶点往底边引高线), 一旦指出这一点, Gram-Schmidt正交化的公式就很容易理解了。更近一步,理解Cauchy-Schwarz不等式就是水到渠成的了:它所对应的,无非是这样一个熟知的几何事实:直角三角形的直角边长不超过斜边长。
我要指出,我这里并非说代数计算不好,我想强调的是,要尽可能在在几何直观的指引下做代数计算。我觉得借用阿廷在其名著《几何化的代数》(Geometric Algebra,1957年出版)一书中的一句话来评论阿克斯勒的《线性代数应该这样学》再好不过了:
“ 我的经验是,一个用矩阵进行的证明,如果你抛开矩阵的话往往可以使这个证明缩短一半。有时,这一点是办不到的,你需要计算一个行列式。 ”
我将阿克斯勒的这本书郑重推荐给所有想重新从几何的观点看待线性代数的朋友,所有想从零开始学习线性代数的朋友。该书继承和发扬了哈尔莫斯《有限维向量空间》的几何化特色,以几何引代数,以概念指导计算!它会告诉你,线性代数不仅仅是矩阵论,或者更恰当地说,从几何的观点看,线性代数和矩阵论原来可以很简单!你不再需要 -矩阵,不再需要分块矩阵,更不必担心复杂的行列式计算会挡住你前行的道路!而且,额外的好处是,一旦熟悉了这种几何的观念和思维,当你应用线性代数和学习泛函分析时会更加得心应手。
根据我的经验,要使线性代数在你心中扎根,你需要读哈尔莫斯的Finite-Dimensional Vector Spaces。如果你还不习惯读外文教材,那么阿克斯勒的《线性代数应该这样学》中译本在目前是首选。
下面我们简单介绍一下本书的内容。全书共十章,其中三章讲向量空间(1,2,6), 一章讲多项式(4),六章讲线性映射(其余)。
第一章讲向量空间,从经典的 维实列向量空间与 维复列向量空间出发,引出线性空间的一般概念。向量空间是线性代数演出的舞台。(记得我博士毕业找工作时面试高校教师时抽到的一刻钟试讲题目,就是向量空间。)
第二章讲有限维向量空间,维数是向量空间的基本不变量,借助基与坐标映射可以给出抽象向量空间到列空间的同构。限制于有限维的好处是,所有的运算都是有限的代数运算(不会涉及无穷)。
现在舞台搭好,主角要出场了,第三章给出线性映射的基本概念。线性映射是向量空间之间的自然映射,在基底下体现为矩阵。给定一个线性映射,就诱导出两个重要的子空间,核空间与像空间。线性映射的基本定理(3.22节)给出了这两个子空间的维数关系。(这样一个定量关系,其实可以用线性方程组的基本定理来描述。)这个基本定理只是对线性映射给出了最粗略的描述,为了更精细地观察线性映射,我们需要将它分解为简单的线性映射。
为此,一个有效的工具是多项式,这是第四章的主题。这个概念其实不属于线性代数,但它的理论可以服务于线性变换,此即第五章的内容。主要的原因在于,当一个线性变换 作用于有限维向量空间 时,一定存在多项式 ,使得 。这样的零化多项式 可用于研究 。例如, 的分解就对应给出 的不变子空间分解。在最理想的情况,若 分解为不同的一次因子的乘积,则 就分解为特征子空间的直和。(特征值与特征向量是观察线性变换的最佳视角,不过并非所有的线性变换都可以完全通过特征向量刻画)。
第六章讨论内积空间。内积空间中因为赋予了可以度量长度、角度等几何观念的内积,从而拓展了中学阶段所熟悉的平面向量和空间向量的几何知识,例如勾股定理、正交投影等。但这不只是简单地重新唤醒我们的记忆,让我们将向量几何从二维三维推广到高维;现在有了前面关于向量空间与线性映射的概念,自然我们就要问,内积空间的不变量如何刻画?这就自然引出正交变换的概念,最终我们发现,原来正交变换(以及平移变换——注意它一般不是线性变换)就是我们中学所学习的全等(也称为欧几里得运动)概念的实质。(在中学时,我从未了解到,平面上两个图形全等的真正含义是,存在平面上的一个全等变换可以将其中一个图形一一映射成另一个图形。)
第七章的主题是谱定理,主要的结果是内积空间上的对称变换可正交分解为一些伸缩变换的直和。这是线性代数最核心的结果。据我分析,每年高等数学考研线性代数两道大题,分别考察线性方程组的基本定理与实对称矩阵的谱定理。遗憾的是,我接触到的一些迎考学生甚至在线性代数课程中都没有学过谱定理!在我看来,对大部分学生,线性代数至少要学到这里,还应知道正交变换的谱定理——因为只有知道了旋转与反射的几何图景,你才会与全等变换的直观印象联系起来,代数与几何才合二为一。就我个人来说,我真的是学完第2遍线性代数才明白我们通常说的三维空间的旋转是什么含义!
致敬科比(单指转球可以看成三维空间的一系列旋转)
第八章讲复向量空间上的线性变换的标准型,第九章讲实向量空间上线性变换的标准型,它们都是线性代数中的经典结果,要用到诸如广义特征向量之类的概念。不过对一般读者来说,也许你知道有这么一回事就可以了,毕竟通常呈现在你眼前的线性变换(或矩阵)都是比较简单而特殊的,用不到如此一般的系统理论。
第十章是迹与行列式,这是线性变换的两个基本不变量。行列式比迹要复杂,所以放在后面。我的朋友吴帆在线性代数教学方面颇有心得,他曾说过,任何一本线性代数教材,如果一开头就讲行列式,学生基本上就学不会线性代数了。我想,这正是国内许多人学不会线性代数的原因吧。因此,我们特别提醒那些想学会线性代数的读者,如果你不想一开头就被行列式弄头大,不妨选择我们推荐的这本书。
对了,各章开头插入的精美彩图也会令你眼前一亮,心向往之!我们仅取第一章和最后一章的两幅插图为证!
本书的前两版曾在美国近300所院校作为教材使用,作者因此收到了成千上万条反馈意见,可以想见,第三版将何等卓越。奇文共欣赏,疑义相与析。预祝你们阅读愉快,有疑问不妨直接与作者联系,据我的经历,阿克斯勒非常欢迎读者给他提意见与建议。
注:正规矩阵(normal matrix)是一类重要的矩阵。此处的笑点在于,normal 在英文中是“正常”的意思。所以,如果要真正体现出幽默来,可能要将“正规矩阵”翻译为“正常矩阵”。请允许我多说一句,可以说,正规矩阵的谱定理(各个版本)是线性代数中最重要的一个定理。
温馨提示1:虽然这本书中穿插着一些幽默的图片与言论(如上图,取自原书7.B节习题15,题目是求图片中第一个矩阵被挡住的右下角元素。),但它更适合比较严肃的读者,特别是数学系的学生。读完这本书,再接触抽象代数(如小阿廷(M. Artin)的著作),应该会比较容易。对于非数学专业的学生,我想可能你们会更适应MIT数学系教授Gilbert Strang的线性代数教材和公开课视频。我想这两本书的差别可以概括为:本书重线性映射的理论,从不变量的角度以几何的观点考察线性代数;Strang的书重矩阵的应用,强调具体计算以诠释线性代数的种种应用。简单说,如果你更喜欢线性映射之类的几何语言,那么用本书;如果你更习惯矩阵之类的代数语言,用Strang的书。当然,并无绝对,本质上线性代数是代数与几何的统一,两种观点都是需要的。Strang的个人主页为:
http://www-math.mit.edu/~gs/
温馨提示2:《线性代数应该这样学》原书在2016年出版了一个删节版,可以在作者的个人主页免费下载:
http://linear.axler.net/LinearAbridged.pdf
温馨提示3:作者制作了本书的音频(带幻灯片),有兴趣的读者可以浏览:
https://www.bilibili.com/video/av63561127/
“ 致谢:感谢本刊编委、美国南密西西比大学丁玖教授和付晓青博士对初稿提出了有价值的建议! ”
《线性代数应该这样学(第3版)》
作者:【美】阿克斯勒(Sheldon Axler)
译者:杜现昆 刘大艳 马晶
斯坦福大学等全球 40 多个国家、300 余所高校采用的数学教材,公认的阐述线性代数经典佳作。从向量空间和线性映射出发描述线性算子,包含 561 道习题和大量示例,提升熟练运用线性代数知识的能力。