| 选课类别:计划内与自由选修 | 教学类型:理论课 |
| 课程类别:本科计划内课程 | 开课单位:数学科学学院 |
| 课程层次:通修 | 学分:4.0 |
王新茂老师的《线性代数(A2)》课程以线性空间理论为核心,内容较为抽象,重点在于区分和理解矩阵与线性空间的关系。点评中反映,王老师往往将矩阵与空间理论割裂开教学,部分同学认为此方法缺乏科学性,因为它可能导致学生难以全面理解矩阵在空间中的作用。然而,王老师也致力于丰富学生对无限维线性空间的理解,这在他编写的讲义中有所体现,虽然这些内容在期末考试中并没有被考察。
讲义精简而富有难度,适合有一定基础的学生深入研究,也有人认为不适合初学者。作业要求较为灵活,通常并不占成绩,然而完成作业的人普遍认为习题具有很高的练习价值,可以帮助深入理解线性空间背后的直观感觉。对于自学能力强的同学,王老师的课程被认为是自我提升的好机会。此外,有同学建议结合其他教材或资源(如李尚志的书或线性代数的网络资源)以更好地理解课程内容。
期中期末考试常与隔壁班统考,且偶数年与奇数年的出题安排可能不同。总体来说,考试内容相比课程学习中涵盖的内容基础,很多题目没有过多涉及复杂计算或高深理论。王老师给分较为宽松,调分幅度大,尤其是对于分数接近及格线的学生。尽管管理严格,他在出分后也会非常愿意处理学生的特殊情况,显示出对教学和评分的负责态度。
许多同学称赞王新茂老师态度认真和友好,尽管教学内容安排不乏争议。推荐对线性代数有初步了解且自学能力强的学生选修,因为这门课在relaxation lesson安排上较为宽松。有同学强烈建议融会贯通矩阵与空间的联系,增加直观几何背景,以弥补教学中的缺失。对于希望挑战自我或需要课堂速通的同学来说,选择王新茂的课程可能会有特别的价值。
“我只教基本的玩意儿”
“有的书上说‘空间为体,矩阵为用’,这是李尚志老师说的。李尚志老师是我的导师,我不同意这个理念。”
“网上有人说矩阵是奇技淫巧,这是统治阶级对劳动人民的污蔑!”
以此为嚆矢,我开始了上xxds的第四个学期。
期中考前,wxm 发表了一些餐前(大嘘)演讲:
我出题从来不卡人,卡人的题都是欧阳出的
我出题只卡那些不来听课的
期中不来就不来呗,那就期末赌一把,反正期末是欧阳出题
期中81,期末77,计算崩得有点严重,不知道能不能上4。重修只拿3.7太亏了。
出分90,这个 wxm 开课前承诺的“样条函数”力度还行。
线代(A2)的期中是各自考,而期末,大概是是偶数年王新茂出,奇数年隔壁出。这个规律最近几年都适用,所以最好提前做准备,不然考到不少 A1 的东西,要是忘了,哭都没处哭。
之后有时间再写点东西
两年wxm,一生打洞情
首先,线性代数绝对不是打洞,至少不只是打洞。wxm 和 mj 都认为,线性空间比矩阵抽象得多,学起来更难。果真如此吗?大抵是
矩阵只需要打打洞、算算标准型就够了,理解线性空间要考虑的可就多了。
两年的线性代数学习下来,我深切体会到把矩阵论和线性空间“串联”而非“并联”是多么离谱的做法。当然,到了后期术业有专攻,数值计算打洞用的多、纯数线性空间用的多。但直接给人分到两学期,尤其是 wxm 的教材,那就是大一下强度拉满,大二上课时用不完。
另外,矩阵未必真比线性空间“具象”。说矩阵不抽象,大概的 idea 是不需要空间想象,只需要在一个数表上做计算就行了。但问题是,不了解背后的几何直观,而是嗯打洞,算到最后只知道算出了个比较好看的形式。至于为什么要这么打洞?“因为这样能打出来。”对于初学者,这种没有什么动机的运算实在是无聊。很多大一下同学,既对线性代数这一学科没有宏观概念,又不知道它有什么应用,只是机械地打洞,很容易削减学下去的动力。
我也是在大一下快期末的时候看了 3B1B 的《线性代数的本质》,才知道我为什么要学线性代数。但那时已经接近期末,再去从头再来已经来不及。于是 A1 寄了。至于 A2,我当时并不知道“奇变偶不变”的规律,选了叶先生班,但 wxm 出题,遂再寄,用 3.0 刷新了最低绩…
所以,初学者选 wxm 当然可以,但一定要对各种矩阵理论背后的空间背景有所了解,不然很容易打洞打懵了,压根不想学下去。
矩阵就是线性变换。那什么又是线性变换呢?保持线性性的就是。
怎么样,听懂了吗?没听懂说明你直接听 wxm 的课也是会卡住的。
以 2 维空间(也就是平面直角坐标系)为例,我们允许对向量进行拉长、缩短(缩成 0 都行)、旋转,但不能掰弯!就像那种推拉门,推拉的过程中支撑杆夹角有变化,但彼此平行、相邻间距相等。
由于给定两个基向量,2 维空间的点可以被它们唯一线性表示。而线性变换就是能保持这个“存在唯一性”的变换。我们要求变换后也能“线性表示”,这直观意义就是对 2 维空间中的网格进行伸缩、旋转,但保持相邻直线平行、且间距相等。
要做到这一点,我们要做的就是对且只对基向量进行变换,把它们从一对基向量变成另一对向量。举个例子,在 i=(1,0), j=(0,1) 基向量下,某点的坐标是 v=(2,3),也就是 v=2i+3j。如果 i, j 线性变换成了 i', j',那么 v 就变换成了 v'=3i'+2j'。假设 i'=(0,1), j'=(0,-1),那么 v 在新坐标系下的坐标就变成了 v'=(-2,3)。
因此,我们用矩阵 A 去乘一个向量 v,那么相当于用这个矩阵对应的线性变换去“变基向量”,然后在新坐标系下 v 也有了新的坐标,这就是 Av 的意义。
既然矩阵是线性变换,那么矩阵乘矩阵自然就是线性变换的复合了。
还有一个重要的问题是矩阵能不能乘,与行数和列数有关。这是因为,m×n 矩阵左乘列向量,是将 n 维向量变成 m 维向量。m×n 矩阵是 n 维空间上的线性变换,只能作用在 n 维空间。
既然矩阵是线性变换,那么自然可以想到,矩阵的逆是逆变换,即“反函数”。当然,单位阵就是恒同变换(一动不动)。
那么什么样的矩阵可逆呢?别忘了,我们线性变换本质是基在变。如果我们把一组基还能打成一组基,那么这个线性变换才可逆。这也直接说明了可逆阵一定是方阵。如果不是方阵,例如 m×n,m>n 时是“升维”,凭空加了 m-n 个坐标轴,只要我们再把它去掉,那就无事发生,这就是说明它有左逆,也就是有个线性变换能让它“恢复原状”。但如果反过来,m<n,那么就是“降维打击”,你都给人家压扁了,怎么可能再恢复?因此它没有左逆。(右逆类似讨论)
而什么样的方阵才有逆呢?我们下面再讨论。
行列式的一种写法是 det A=|A|,那么我们会第一反应想到某种“模长”。
是也不是。
它不是范数,所以不是模长。但它确实带有某种“大小”的意味。这回以 3 维空间为例,考虑正方体 [0,1]^3。它由三个两两垂直单位向量张成,体积为 1。在线性变换下,它的平行的棱还是平行,所以我们会得到一个平行六面体。这个平行六面体的中的点,就是 A 作用在 [0,1]^3 中的点对应的向量得到的。
而 |A| 就是这个新的平行六面体的体积。比如 |A|=114514,那么新平行六面体的体积一定为 114514。更一般地,对于三维空间中的任意几何体,设它的体积为 V,那么在 A 的作用下,它的体积就是 V'=|A|V。对于二维,则将体积改为面积。如果学过叉乘、混合积,就会对行列式的“放缩”性质产生更深刻的理解。
好了,那么行列式为零是啥意思?显而易见,对于三维,那就是把任何一个一个空间几何体的体积都能打成 0。想要以“线性”的方式把体积变为 0,那就是通俗易懂的降维打击。比如把一个球压成圆,甚至压成线段、压成点,都能达到这样的效果。这种情况下,这个线性变换对应的矩阵的行列式就是 0。自然而然地,如果只是“揉揉搓搓”,那还是能变回来的,但降维打击了,铲都铲不起来。这就是为什么方阵可逆等价于行列式为 0。
另一方面,行列数不相等的矩阵,直接给升维或降维了,当然也没法定义“体积”的放缩倍数,也就没有行列式了。
前面说到,一个线性变换可以把一个高维的东西打成低维的,那么究竟打成几维?秩是几维那就是几维。
这通过相抵能更容易看出来。对于一般的基,一个线性变换作用上去,可能把这组基打得乱七八糟的。我们希望找到一组好一点的基,当矩阵作用上去后,可以“不怎么动”。那么,我们要提前做准备,也就是把提前把基换一下,从一组基到另一组基的变换,需要乘一个过渡矩阵。基换了以后,我们可以接受线性变换的洗礼。但这还不够,还需要“物归原主”,也就是把基变回去。当然有时候降维了,基就没这么多了,那能变回去几个算几个,所以还要再乘一个过渡矩阵,它的大小可能就和最开始那个不大一样了。这实际上就达到了 A=Q^{-1} Σ P 的效果。由于基变完了还得是一组基,所以我们要求 P Q 可逆。
相抵的理论告诉我们,最中间那个 Σ 可以长得很好看,即 Σ=diag(I_r, O)。这时候,后 n-r 个向量就被线性变换 Σ 打没了,因此一个 n 维的东西被打成了 r 维的。P,Q 可逆,所以不影响维数。至此,我们就能看出秩 r 的几何意义。
相抵中,P,Q 未必相同,所以可能走了一圈回不了家了。我们希望怎么过去就怎么回来,即 A=P^{-1} B P,这就是相似。
换句话说,我们研究相似的目的,就是看这个线性变换比较糟糕,希望在一个新坐标系下面会好一些。直观理解,就是送过去、做变换、原封不动拉回来。
但是,并非所有线性变换都能相似对角化,在任何一组基下,都做不到“只伸缩、不旋转”。不过,我们还是可以把它“分而围之”,将矩阵分成 Jordan 块,每一块内部长得难看一点,但总体还是个准对角阵。而准对焦阵每一块,就是一个子空间。子空间内部可能无法做到只伸缩,但可以构成一个循环,通过不断作用某一个向量,生成整个子空间的基,这就是循环子空间。也就是说,Jordan 标准型正是线性空间的循环子空间分解。这可能是我们能做到的最好的结果了。
wxm 会告诉你,特征值是特征多项式的根,但这和没说没啥区别。我们从 Av=λv 来看,这正是做到了只伸缩、不旋转。对于特征向量 v,A 作用上去就会把他变成同方向的 λ 倍(由于 λ 可负,所以可以反向)。
当然,不是所有矩阵都有这么好的性质。如果它可对角化,就意味着可以找出一组基,这些基向量全是特征向量。在这种意义下,我们在所有方向上都可以只伸缩、不旋转,这也是为什么可对角化的矩阵这么好。
不可对角化也没那么糟糕,我们可以将它相似三角化。以 4 维为例,线性变换后,x'轴方向我们可以只伸缩。但 y' 方向不行,非得带个旋转,那我们可以做到只带 x' 轴方向的旋转。而 z' 轴可能就要把前俩都带上了,但仍然可以不带 w' 轴…
另一个重要的结论是行列式等于特征值的乘积。很显然,每个维度变成原来的 λ_i 倍,那么整个的“n 维体积”就变成了它们的乘积倍。
我们前面谈了这么久的只伸缩、不旋转,那能不能倒反天罡?
当然可以,如果一个方阵它能让基向量“只旋转、不伸缩”,而且这个旋转是刚体的,那么它就是正交阵。
因为是刚体旋转,所以正交阵保夹角,进而保垂直。所以它的等价判定是将标准正交基映到标准正交基。
另一方面,正交阵不伸缩,所以特征向量模场只能为 1(可能是复的)。
矩阵可以左乘可以右乘,但小孩子才做选择,大学生我都要。
矩阵当然可以左拥右抱:左乘一个行向量,再右乘一个列向量。当它是方阵时,那么写出来就是一个 n 元二次多项式,所以我们只研究方阵。进一步,二次多项式的交叉项由矩阵里的 2 个元素决定,我们自然可以让它们一人一半,所以只要研究对称阵就行了。
陈计名言:所有代数不等式的本质是 x^2≥0。那么,推广到 n 元肯定也是我们想要的。因此我们想要一种对称阵,它左乘再右乘同一个向量后,永远是正的,除非它是零向量,那这就是我们要求的正定阵。
一个很直观的理解是,正定阵诱导的正定二次型,在每个方向都是“抛物线开口向上”,平着也不行,到了谷底就赶紧上去。而如果有个方向比较平,那么它也能保证非负性,但零点会不止一个,而是一条线、一片乃至更多,这就是半正定。负定和半负定也是这么来的。如果有正有负,也就是有的方向开口朝上、有的朝下,那么就是不定。
正定要求各主子式为正,或者特征值全正,也是出于这般考虑。但凡有个负的,那么就会出现“负体积”或“反向伸缩”,就不能保证恒正了。
假如当初的我也能体会到这一点,也不至于在这上面驻足两年了罢…
看起来 wxm 还要统领线代 A 好多年,只能祝福后来人尽可能趋利避害,各取所需。至少,我不希望再看到两年王新茂的悲剧发生了。
除了给分很好以及老师上课很认真之外其他都很难称得上好的一门课,线性空间和矩阵完全脱节,基本上还是要靠自己找题去练,尽管考试都是一些简单无比So easy的计算题。一学期下来你会发现其实根本没讲什么东西,只是给你罗列了线性空间,线性映射,内积空间的基本概念和定理而已。 不是说老师教学不能创新,只是王老师的这种A1阉割掉线性空间A2只讲线性空间的做法绝对是不科学的。建议王老师去带线代B1,他的讲法对于线代B的同学应该是非常适合的。
把之前的too simple的评课重写了一下,,,感觉看前面的评课大多也是大一大二同学写的,现在又学了一年半,我的评价是:如果想学数学那都不建议选wxm的线代。事实上我觉得上wxm的迫真课程是典型的在学字,一上来巨大多矩阵打洞让初学的同学无法看清线代究竟是什么,到后面好不容易开始结合线性空间的语言了,也不注重几何直观,最后硬塞入的半点被泛函分析完全cover的无穷维线性空间的内容更是不知道为了什么。感觉大多数同学(包括当时的我)都是刷刷讲义上的难题感觉做出来挺有成就感,考试出的不难给分也好,整个一套混下来具有迫真很满意。但是这样越到后面越是有害,碰到遇到线代的地方都比较容易蒙古,而那些所谓的打洞机巧,因为不被(显著地)用到,也只不过是沦为神必科气壬的谈资,这种人真叫他做个讲义上的题114.514%做不出来。
不过话说回来,我觉得这门课与其巨大讲一些没法用上的迫真内容,不如讲讲多重线性代数(陈省身的《微分几何讲义》Chapter 2)。你科数院好像没有好好讲了张量的本科课,但是并不是每个人都会修微分流形和黎曼几何,,,