高等代数到底讲了什么
在北大版的高等代数书上,我们从多项式,行列式,线性方程组,矩阵,二次型,线性空间,线性变换,λ矩阵,欧氏空间以及双线性函数这些地方分别讲解了高等代数,但实际上,很多遍通下来我们也未必能有一个直观的感觉,到底在学些什么,想必用这本书的学校的老师也不会说我们到底在学什么。
对于高等代数,大家应该会想,为什么会有矩阵,我们可以用它来做什么,为什么会有二次型,这个东西到底有啥用,为什么把这么一堆东西放在一起就可以叫做高等代数,到底什么是高等代数。我打算用我的理解去简述一下高等代数这个东西,当然,理解不一定对,也不一定足够深刻。
现在在我这里有一堆东西,我试图研究这堆东西之间有什么样的联系,例如我这里有一包小熊饼干,有大的也有小的,我想看看这些不同的小熊饼干之间有什么联系,我要去刻画他们之间的关系,首先我想去研究他们的线性关系,这是最简单的关系了,那么我们要如何去研究这种简单的关系呢,当然第一步就是把它们放在线性空间里,因为一旦有了这样的空间我们就可以开始定义线性变换了,(当然我们还需要找到一组基,为了研究小熊饼干我们可以把基分别定义成一个小熊饼干的四肢躯干加头)而我们只要弄明白了线性变换的样子我们就把这种不同小熊饼干之间的关系刻画出来了。(即这个饼干是那个饼干胳膊的多少倍头的多少倍等等)
接下来问题转移到了研究这种线性变换上,只是看这个花写的符号我们当然看不出什么,即使给了他作用的原像和像我们也无法弄清楚这个被叫做线性变换的映射到底是个啥,那么我们该要如何来刻画它呢,这时候我们就有了矩阵,每一个线性变换都有一个对应的矩阵,我们只要找到它所对应的矩阵就可以了,现在问题转移到了研究矩阵上。(实际上,每个矩阵都是一个线性变换,我们在学习高代的时候会学习好多种矩阵,诸如上三角,对角,秩1等等,与其说我们在学习矩阵不如说我们在学习线性变换,很多我们看不懂的特殊矩阵性质,一旦把它放在线性变换上一切就变得自然了)
现在我们来到了矩阵上,试图发现矩阵的奥妙,但凡学习过一点高代的人都知道,一个东西乘上矩阵就相当于是把这个东西进行了翻转伸缩,(这里的翻转伸缩并不是简单的把一个小熊饼干放大或者转圈,而是包括了只变长胳膊或者进行镜面反射等的很多高级变换)。我们现在渴望把每一个矩阵的作用都说明白,试图对任意的矩阵我们都可以说出来它的翻转伸缩,多少次的翻转伸缩或者是什么程度的翻转伸缩。可实际上我们做不到这一点,但即使做不到这一点我们也试图可以找到一个更为简单的矩阵去刻画映射关系。可是仅仅在以一个普通小熊饼干的身体做基从而刻画关系的矩阵毕竟是有限的,我们未必能把它变得简单。这时候就要求我们去换基了,我们打算换一个小熊饼干以期望通过这个小熊饼干刻画关系的矩阵能非常简单,这是可以做到的,我们只要找到那个和所有小熊饼干相似程度最高的小熊就可以了,更残忍一点,我们也不需要非要拿这一只小熊饼干做基,我们可以扯一个其他饼干的胳膊配上我的头等等组成一组基,只要四肢躯干和头和其他的矩阵相似程度足够高,我们刻画关系时的矩阵就可以更简单,这是可以做到的。那么虽然我们无法刻画出一个准确的矩阵,但我们至少做到了让这个矩阵简单。我不知道大家有没有疑惑,这个简单的矩阵是怎么定义的呢。
要想弄清楚简单矩阵的定义那么还是要回到变换上,矩阵是用来刻画变换的,这里的矩阵简单无非就是变换简单,简单的翻转简单的伸缩,如果这个矩阵是单位矩阵,那么这一袋小熊饼干就都成为了清一色的某种熊,大小都是一样的。而如果这是一个对角矩阵,那么就成了一袋四肢躯干头大小不一的小熊饼干,毫无疑问这也是简单的。这实际上也是我们期望的最简单的样子了,只有伸缩没有翻转,因为翻转总是困难的,他要比伸缩困难了太多。于是我们试图找到一组基即找到一组四肢躯干头使得任何一个小熊饼干都是它的多少多少倍,这是我们期待的样子,也就是说想办法把矩阵搞成对角矩阵,于是我们有了对角化,他的意义在于,找到一组基,使得在这个基上的变换只有伸缩变换。
可即便是这样的对角化也并不是每个矩阵都可以做到的,这条对角化的路已经断了,毕竟不是所有的矩阵都能刻画成只有伸缩的样子,(实际上因为可对角化矩阵的稠密性,我们总可以在一定误差内用可对角化矩阵逼近不可对角化矩阵)我们开始想别的方法来研究这个矩阵,在这种情况下我们迎来了若尔当标准型,既然翻转已经无法避免,我们便开始研究翻转,但是一次性研究包括头躯干四肢的翻转无疑是困难的,我们试图把它们分成互不干扰的部分分别进行研究,如统一研究头或者躯干,他们之间必然是无关的,又比如一对胳膊,如果左右胳膊没有联系我们也要把它们分开研究,如果有联系那么我们只能同时研究,这个时候当然是分的部分越细越好,但是前提是我们一定要把它们分成互不干扰的几部分,这就是我们所说的不变子空间,我们用不变子空间把那些含有翻转的变换分开来研究。
当然下一个问题就来了,我们要如何去分呢,怎么分才能让一个整体变成互不相关的几部分呢,这时候我们又引出了高代的另一个巅峰:根子空间分解,有了这个东西,我们就可以通过零化多项式把整个空间都分开了,并且分成了互不相关的几部分,这样就达到了分开研究的目的,这样一个大矩阵就被我们肢解了。当然,前提是我们需要找到零化多项式,我们可以找到吗?当然可以,因为哈密顿凯莱定理已经把特征多项式给我们了。
这样以来,这个线性变换就被我们给弄清楚了,我们找到了小熊饼干之间的关系,即当找到一组合适的基之后任意两个小熊饼干我们都能说明白从这一个饼干怎么转化到另外一个饼干上,当然这还没有结束,我们只是研究了小熊饼干之间的关系,并没有将小熊饼干自身的几何意义说明白,即虽然我们知道小熊一比小熊哪里大了大了多少倍但是小熊本身的大小我们并不知道,为了让小熊饼干具体化,我们引入了欧氏空间即给予小熊饼干度量,当然欧氏空间还有角度上的定义,如果非要研究角度,我们这一袋小熊饼干就不够用了,需要一个小熊礼盒来固定小熊饼干的位置,这样我们才能继续研究,但在这里我们只需要明白欧氏空间到底给了我们什么就可以了。
到此,还差一个二次型我们就可以把这些都串起来了,我常常去想合同与相似的联系,但实际上它们并没有什么联系,大家现在可以通过二次型写出一个圆的方程来,然后在用二次型写出一个椭圆方程来,然后把它们写成矩阵的样子,认真的看这两个矩阵,这两个矩阵是可以通过一系列线性变换互相转化的,这也就告诉我们圆和椭圆在一个角度看是一种线性关系,如果说我们刚刚研究的小熊饼干是直线的线性变换,那么到了圆锥曲线这里,我们就是在研究曲线的线性变换了,当然这取决于基的次数,(我不知道这么说对不对,但大概是这个道理)。
如此这般我们便把所有东西都串了起来,我们学习高代实际上是在研究变换,于是有了线性变换以及二次型(我们主要是在学习线性变换,因为二次型只是告诉我们我们还可以往更高维度拓展,本质还是变换),为了研究变换我们引入了矩阵,期间我们学习了很多特殊矩阵实际上就是特殊变换,进一步去研究矩阵,为了研究矩阵我们有了对角化,这是最简单的东西了,但是因为我们做不到每个矩阵都对角化,于是我们有了若尔当标准型,为了得出若尔当标准型我们学习了λ矩阵,又为了更简单的分块研究我们引入了根子空间分解,为了直接找到根子空间分解的零化多项式,我们还学习了特征多项式,但是只有一个多项式还不够,我们得会分解多项式才行,这样我们就学习了多项式(整章多项式其实都在说怎么分解的问题),还有一个线性方程组,这实际上是对系数矩阵的一种刻画,我一直认为线性方程组的解空间是用来描述系数矩阵的,通过这种方法更好的了解矩阵。
这样,我就说了我自己的理解,在我看来,贯穿整个课本我们都是在说相似程度,你能不能代替我,如果不能,哪里不能,我们试图寻找更简单的东西来取代复杂的东西,多项式互素,重因式,线性相关,合同,相似,我们一直在找差不多的东西来相互替换,把问题在不同的地方翻来覆去的去想,如果一个问题在这里解决不了,那么在那里能不能解决,如果解决了,我们在把它移回来就可以了。即寻找变化中的不变量。