說到矩陣,我們可能會立刻想到線性代數。
線性代數,不僅是大學理工科本科生的必修課,也是工作中十分有用的理論工具。
例如在機器學習、圖像處理、機器人導航、自動控制等領域,線性代數都有着十分廣泛的應用。理解并學會運用它,是十分劃算的。
但是,線性代數并不友好。
對于很多初學者而言,雖然期末考試可以考個八九十分,但在整個學期的學習過程中,往往從第一節課開始,從頭到尾,自始至終,心中都充斥着幾個字,那就是,
“莫名其妙”。
很多概念,好像都是無中生有地出現在課本上,前不着村後不着店,讓人感覺非常虛無缥缈。雖然我們憋屈地通過死記硬背,解決了作業和考試的問題,但實際上,對于知識本身來說,我們往往跟沒學差不多,考後一個月内,立即忘得一幹二淨。
那麼,問題究竟出在哪?為什麼線性代數如此難以理解?
好,為了理清思路,我們先來研究一個問題。
在研究這個問題之前,我們先來介紹一下,
什麼是矩陣。
比如,
這就是一個兩行三列的矩陣,記作2×3的矩陣。
當然,也有三行兩列的矩陣,比如:
這裡,矩陣中的元素都是實數,因此稱為實矩陣。當然,也可以填入複數,那就是複矩陣。
為了方便,我們往往将一個矩陣用大寫字母來表示,比如:
這就是教科書上的矩陣了。
那麼現在,我有一個很自然的疑問,就是,
矩陣它為什麼是這樣方的?為啥是矩形的?
有人說,老王,你是不是來搗亂的?這有啥可研究的?
矩陣為啥是方的,那當然是因為數學界把它定義成方的啊!
所謂定義,就是“規定”,
你可以這樣定義,也可以那樣定義。
比如,
3×5,
表示五個三相加。
這個“叉”的含義,就是定義出來的,你完全可以把3×5定義成5個3相減。但是,這種定義方式就不是數學界所使用的了。
好,既然這個矩陣,它是被定義成方形的,那麼,請問,
為什麼不定義成别的形狀?
比如,三角形:
有人說,因為矩形好看。
我認為三角形也挺好看啊。
有人說老王你不要糾纏這種問題好不好,你到底是來幹什麼的?
事實上,不是我無聊啊,而是,我翻開書,大腦中第一個問題就是這個問題!
你說,矩陣定義成這個東西,那麼,你這本書起碼要給點說法不是?
否則,當然會讓人産生莫名其妙,無中生有的空虛感。
好,有人說,我想起來了。
之所以矩陣被定義成矩形,是因為,矩陣是用來表示方程組的,
一個方程組就對應一個矩陣,而一個矩陣就對應一個方程組。
比如,
這是一個二元一次方程組,而在消元的過程中,x和y實際上并沒有發生任何變化,因此我們可以直接将x和y的系數拿出來,組成一個“數組”,即:
增廣矩陣
這,叫作方程組的“增廣矩陣”。
所以,很多人就認為,
一個矩陣就對應一個線性方程組,而且,矩陣就是方程組的系數。
有這種理解是很正常的,因為幾乎所有教科書第一章第二章都在折騰方程組嘛,所以,很多人在學習矩陣的時候,就是用這條思路學下去的。
但是,如果你一旦陷入這套原理,那麼你會發現,整個學習過程,都将是十分難受,十分便秘的,很多概念完全無法理解。
我随便舉幾個例子。
比如,
相似矩陣。
說,有兩個矩陣,A和B,如果你找得到另外一個矩陣P,使得這仨哥們滿足:
那麼,我們就說,A和B相似。
(P-1指的是P的逆,反正也是個矩陣,這個以後再說)
注意,這個相似的英文就是similar,就是長得像的意思。
好,如果我們陷入矩陣就是方程組的思維,那麼,矩陣相似,應該是兩個方程組相似了?
方程哪有相似的說法呢???
真是一頭霧水,莫名其妙。
又比如,還有一套著名的概念:
矩陣的特征值和特征向量。
也就是說,矩陣它有特征,而且有幾個數字,可以代表矩陣的特征。
難道方程組還有特征?
是不是又覺得很莫名其妙。
這樣的例子簡直是多如牛毛,不勝枚舉。
那問題到底出在哪?
實際上,這個問題,跟我們教科書有一定的關系;跟我們的課堂,也有一定的關系。
我不知道是不是很多老師覺得我剛才問的那幾個問題太簡單了,不屑于在課堂上講。但實際上,我覺得,解答這些問題是非常重要的。
就是,
我們一定要在一開始,讓大家覺得,這些東西是很自然的,而不是需要死記硬背的。
那麼,為什麼矩陣有這麼多相關概念,卻又難得理解呢?
是因為我們理解的方法錯了。
首先,
矩陣就不一定表示方程組的系數。
而是,
矩陣隻是一堆數字的陣列,僅此而已。
矩陣的定義,無需引入方程組。你讓矩陣的這些數字代表什麼,它就可以代表什麼。
比如,我統計每天上午和下午的工作時間,連續統計了三天,分别是,
上午1小時,下午4小時;
上午2小時,下午5小時;
上午3小時,下午6小時;
那麼,我們可以将這些數據,表達成一個矩陣,
然後我可以對這些數據進行各種計算和處理,比如,我需要計算平均值,或最大值,等等。
也就是說,
矩陣它沒有必要是方程組的系數,其定義與方程組無關。
那麼,有人說,
為什麼人們又可以用矩陣的方式,去表示方程組呢?
這就是問題的要害。
事實上,所有的問題,根本在于,我們很多人在學習的過程當中,
把矩陣的曆史發展順序,與矩陣理論的邏輯順序,搞混了。
而且更要命的是,這兩個順序,正好是個反的。
什麼意思呢?
首先,曆史上,矩陣這個東西是怎麼發展出來的?
我們剛才已經講了,就是人們在研究方程組的時候,把它的系數,提取出來,解方程。用系數的陣列來解方程,最早在公元1世紀的《九章算術》中就有了。
然後,我們就來研究這堆矩形的數字的陣列,發現,其實可以單獨搞成一門學問,于是就給它起了個名字,叫“矩陣(matrix)”。
Matrix這個詞是1850年才出現的。
因此,矩陣的曆史發展順序是,
先有方程組,然後,為了解方程,而搞出了一個系數矩陣,然後推廣,成了一門學問。
而現代線性代數理論的邏輯順序是什麼呢?
是,
我們先脫離了方程組,來直接定義了什麼是矩陣。
什麼是矩陣呢,矩陣就是一堆數字的陣列:
這個A,就是一個矩陣。除此之外,再無其它的意思,和方程組沒半毛錢的關系。
那麼有人說,既然這樣,那麼這矩陣在理論上,怎麼又跟方程組扯上關系了呢?
那是因為,
我們後來又定義了矩陣的計算方法。
矩陣,
它可以做加法。
矩陣和矩陣,可以做乘法。
矩陣和數字,可以做乘法。
矩陣它還有逆運算,就是我們剛才說的那個P逆。
矩陣還有轉置運算。
矩陣它還可以平方,它可以進行幂運算。
等等。
但是注意,定義這麼多運算,也不需要引入方程組這玩意,而隻需要在矩陣的定義基礎上,再定義矩陣的運算法則。(關于矩陣的計算,專欄有詳細介紹)
然後,對于一個方程組,
我們可以利用該方程組的系數,創造出三個矩陣:
然後,利用矩陣的乘法法則,将該方程組表示為:
這樣,矩陣和方程組在教科書中就扯上關系了。
但是,我們一定要非常明白,在線性代數課本中,
矩陣的定義無需方程組的參與。
這就是為什麼,很多人無法理解線性代數的原因。因為很多人,包括我剛上課時,總是在想,這相似矩陣和方程組到底有啥關系呢?
實際上,相似是另一套理論體系中的東西,鋪墊相當多,不是一兩句話可以說清的。關于這個,我們在專欄的視頻中詳細介紹。
可見,我們不理解很多東西的原因,并不是我們的智商問題,而是一些稀爛的教科書,讓我們一開始就掉進坑裡,再也爬不出來,直至懷疑人生。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!