注:本文來源于“周鐵戈”老師發表在科學網上的原創博文,點擊閱讀原文關注他!
“抽象”是從衆多的事物中抽取出共同的、本質的特征,舍棄其非本質的特征的過程。本文介紹數學中的“抽象”思想和一些我們已經熟知但可能卻不知道确切定義的抽象概念。數學中的抽象比我們想象的要簡單的多,本文主要分為三個部分:一、問題的提出;二、數學中的“抽象”;三、常見的抽象概念及其定義。本文介紹的抽象數學概念主要包括概率、對等關系、測度、群、環、域、線性空間、距離、距離空間、範數、賦範空間、巴拿赫空間、内積、内積空間、希爾伯特空間、線性算子和泛函等。 錯誤在所難免,歡迎多多批評指正。
一、問題的提出
首先看兩個最常見的概念來提出問題。第一個是“距離”,這個“距離”既是北京到上海的距離,也是平面上兩個點之間的距離;既是直線距離,也是實際距離,那麼數學上“距離”的定義應該是什麼呢?第二個是“概率”,我們都會使用概率這個概念,比如:買中大獎的概率很低;明天下雨的概率很高;扔一個硬币出現其中一面的概率為1/2,那麼數學上“概率”的定義究竟是什麼?其實距離和概率都是數學裡的抽象概念,涉及到其中的抽象思想。
二、數學中的抽象思想
為了給出“距離”和“概率”的定義,我們看一個更簡單的問題:“水果”的定義是什麼?假使我們還不知道水果的定義是什麼,那麼一定知道蘋果、梨和西瓜等都是水果,或者說都屬于水果(見圖1)。
圖1 水果
蘋果、梨和西瓜的共同的、本質的特征是什麼呢?很簡單,首先它們都是植物的果實,其次都富含水分,再次都比較甜。依據具體水果的共同特征(或者性質),我們就可以給水果做出如下的定義:如果一個東西滿足下面三個條件,就被稱為水果,(1) 是植物的果實;(2) 富含水分;(3) 比較甜。在數學上,這就可以稱為水果的嚴格定義。
可能有同學會問“東西”的定義又是什麼?在這裡,我們額外介紹的一個數學思想:對任何一個概念下定義,必須借助于比它更為基本的概念,因此總會有一些不加定義而直接引入的最基本的概念,這些最基本的概念隻能通過舉例或者打比方等進行描述。“東西”是比水果更為抽象和更為基本的概念,“東西”這個概念,是否有嚴格定義,是否是最基本的概念,本文不再進行探讨。
知道了水果的定義,再看概率,網上給出的概率的解釋如下:概率,又稱或然率、機會率或機率、可能性,是概率論的基本概念,是一個在0到1之間的實數,是對随機事件發生的可能性的度量。其實這隻是“概率”的通俗的介紹,并非嚴格的數學上的定義。類似于水果的例子,我們應該從一些熟知的和具體的概率中抽象出它們的共同性質作為概率的定義。首先概率應該大于等于0,因為負的概率沒有意義;其次肯定發生的事情的概率應該為1;再次,擲一個骰子“出現1或者2”的概率應該是“出現1”的概率與“出現2”的概率相加。所以數學上概率的嚴格定義如下:
設E是随機實驗,S是它的樣本空間。對于E的每一事件A賦予一個實數P(A),P(A)稱為事件A的概率,如果P滿足下列條件:(1) 非負性,對于每一個事件A,都有P(A) ≥0;(2) 規範性,對于必然事件S,有P(S) = 1;(3) 可列可加性,設A1、A2……是兩兩互不相容的事件,則有P(A1∪A2∪……) = P(A1) P(A2) ……
定義中随機實驗最簡單的例子就是抛硬币;樣本空間就是所有可能出現的情況,比如抛硬币會出現正面或反面兩種情況;互不相容就是不會同時發生;A1∪A2表示的是“A1發生或者A2發生”。這個定義是蘇聯數學家柯爾莫哥洛夫(見圖2)在1933年給出的,柯爾莫哥洛夫提出了概率論的公理化結構,使概率論有了迅速的發展。
圖2 柯爾莫哥洛夫(1903.4.25-1987.10.20)
關于距離,我們将在下一部分的距離空間中詳細介紹。
三、常見的抽象概念及定義
這一部分是本文的重點,主要介紹近代數學中一些常見的抽象概念以及相關例子。
1、測度
直線上點集的測度是線段長度概念的推廣,設E為直線R上的集合(可能是簡單的線段,也可能很複雜),用 mE 表示E的測度。對于普通區間 (a , b),測度就是這個區間的長度b – a。對于一些複雜的集合,用長度這個概念就不合适了,比如我們可以問這樣一個問題:把所有有理數都緊挨着放到一起,長度是多少?有了測度這個概念,這個問題就可以直接表達為:所有有理數的測度是多少?答案是0,至于原因,感興趣的同學可以在網上搜索。那麼測度的定義是什麼呢?顯然,隻要把長度的性質拿出來就可以了,測度的定義如下:設E是直線上的點集,如果mE滿足下面的條件則稱為測度:(1) 非負性,mE ≥ 0;(2) 若E1 ∩ E2 = Φ,則m(E1∪E2) = mE1 mE2;(3) m[0,1] = 1。第一條很好理解,長度都是大于等于零的,負的長度沒有意義;第二條,通俗的說就是兩個線段如果沒有重合的地方,那麼它們放到一起的測度就是它們分别的測度的和;第三條很簡單,就是要求[0,1]這個區間的測度為1,因為這個區間的長度就是1。與概率的定義對比,大家可以發現兩者非常相似,其實概率就是事件發生的可能性的測度。有一個很有意思的問題:從實數中随機的拿出一個數,這個數是有理數的概率是多少?這個概率和有理數的測度一樣,是0。
2、對等關系
我們都知道“相等”是一種最簡單的數學關系,比如0.5 0.5=1。那麼相等有哪些性質呢,首先a = a,就是一個數和它自身相等;其次,如果a = b,那麼就有b = a;再次,如果有a = b且b = c,那麼就有a = c。把這三條性質拿出來就是數學上“對等關系”的定義:具有下面性質的關系稱為對等關系(用符号~表示),(1) 自反律,A ~ A;(2) 對稱性,若A ~ B,則B ~ A;(3) 傳遞性,若A ~ B,且B ~ C,則A ~ C。
除了相等,還有很多關系也都是對等關系,比如三角形的相似、直線的平行、定理的等價、矩陣的相似等(見圖3)。大于、大于等于、小于、小于等于等都不是對等關系。
圖3 對等關系
3、群、環、域
群、環、域是三種典型的代數系統(代數系統也是一個抽象概念,就是帶有運算的集合)。群這個概念同學們見到的最多,尤其實在固體物理中,都用群來描述晶體的對稱性。先看群的概念,簡單的說,群表示一個擁有滿足封閉性、滿足結合律、有單位元、有逆元的二元運算的代數系統。群的定義如下:
設G是一個非空集合,在G中定義了一個二元運算*,即對G中任意的a和b,有G中唯一元素a*b與之對應,且滿足如下規律:
(1) 封閉性,對任意a,b∈G,總有a*b∈G;
(2) 結合律,對任意a,b,c∈G,總有a*(b*c)=(a*b)*c;
(3) 恒元,存在e∈G,對任意a∈G,總有e*a=a;
(4) 逆元,對任意a∈G,存在b∈G,總有b*a=e;
定義中恒元e是固定的,與a無關,逆元不是固定的,與a相關。群的定義中的運算*一般稱為乘法,但是這個運算既可能是我們熟知的加法(1 1=2),也可能是我們熟知的乘法(3×7=21)。如果一個群中的運算還滿足交換律的話(即有a*b = b*a)就可以稱為Abel群。
下面我們看群的具體例子,見圖4,
圖4 群
第一個是(整數;加法),即整數結合上我們熟知的加法,對照定義進行檢查:一個整數加上一個整數肯定還得到整數,所以第一條能夠得到滿足;整數的加法運算肯定符合結合律,所以第二條也得到滿足;恒元是0,一個整數逆元是是它的相反數,第三條和第四條都得到滿足。所以(整數;加法)是一個群,類似地(有理數;加法)和(實數;加法)都是群。
最有意思的例子是四個操練動作(立正、向右轉、向左轉和向後轉)也可以構成群,兩個動作的運算就是依次執行這兩個動作。立正就是恒元,向右轉和向左轉互為逆元,向後轉的逆元是自身。向左轉*向後轉=向右轉,向右轉*向後轉=向左轉,向後轉*向後轉=立正,滿足封閉性。
環的定義如下:設R是一個集合,在R上定義了兩個二元運算,分别記為加法( )和乘法(•)且滿足:(1)(R; )是Abel群;(2)(R;•)是半群,即滿足封閉性和結合律,不要求有恒元和逆元;(3)分配律:a•(b c) = a•b a•c,(a b)•c= a•c b•c,∀ a, b, c∈R。環一般記為(R; ,•),相對于群,環更為複雜,增加了一種運算。(整數; ,×),即整數配合上我們熟知的加法和乘法運算,就是一個環。環這個概念我們不做過多介紹。
域的定義如下:設F是有兩個二元運算( )和(•)的集合,且滿足:(1)(F; )是Abel群;(2)(F*;•)是Able群,F*指F的非零元全體;(3)分配率。域這個概念見到的比較多,比如有理數域、實數域和複數域。整數是不能構成域的,因為對于乘法沒有逆元,比如2的逆元應該1/2,但1/2不是整數。有理數、實數和複數能構成域,拿有理數來說,一個有理數關于加法的逆元就是相反數,關于乘法的逆元就是倒數,都是有理數。
4、線性空間
在數學中,通常把賦予某些數學結構的集合稱為空間(和代數系統非常接近)。簡單說定義了線性運算的集合就是線性空間,嚴格定義如下:
設X為一非空集合,K為數域(實數域或複數域),通過規定映射
S:X×X→X,其内容為 S (x,y) =x y,x,y∈X
M:K×X→X,其内容為 M (λ, x) = λx, λ∈K,x∈X
定義X中兩元素之間的加法運算以及數與X中元素之間的乘法運算(稱為數量乘法,或簡稱為數乘),如果這兩種運算遵守以下條件,就稱X為數域K上的線性空間。加法運算滿足:
(1) x y =y x, ∀x,y∈X;
(2) (x y) z =x (y z), ∀x,y,z∈X;
(3) ヨθ∈X,使得θ x=x,∀x∈X,θ為零元素;
(4) ∀x∈X,ヨx’∈X,使得x x’= θ,x’稱為x的逆元素并記作x’= -x
乘法運算滿足:
(1) λ(μx) = ( λμ)x, ∀ λ, μ∈K, ∀x∈X
(2) λ(x y)= λx λy, ∀ λ∈K, ∀x,y∈X
(3) (λ μ) x = λx μx, ∀ λ, μ∈K, ∀x∈X
(4) 1 × x=x, ∀x∈X, 1∈K
定義中X×X是X與自身的笛卡爾積,笛卡爾(見圖5)積的定義如下:設A、B為任意兩個集合,對于 x∈A,y∈B,以(x,y)表示有序元素時,則所有有序元素對組成之集合稱之為A與B的笛卡爾積。定義中使用X×X表示S是一個二元函數,其實就是有兩個矢量相加。
圖5 笛卡爾(法國哲學家、數學家和科學家,1596.3.31-1650.2.11)
定義中的符号∀表示“任意”,符号ヨ表示“存在”。有人說數學中是沒有減法的,這有一定道理,其實在線性空間裡減法是一個矢量與另一個矢量的逆元相加。可以看出線性空間的定義與群、環、域的定義非常相似,都是帶有運算的集合。但是線性空間中的乘法運算并不是集合中兩個矢量之間的乘法,而是一個實數或者複數與集合中的矢量的乘法。
下面介紹線性空間的具體例子,見圖6,
圖6 線性空間
第一個是矢量空間,比如三維矢量空間R3。設x=(x1,x2,x3),y=(y1,y2,y3),最常用的加法和數量乘法的定義如下:
x y=(x1 y1,x2 y2,x3 y3)
λx=( λx1,λx2,λx3)
在加法定義式的左端是兩個矢量相加,是被定義的加法;加法定義式的右端的加法是我們熟知的具體的數之間的加發。數量乘法的定義式也是這樣。
連續函數也可以構成線性空間,設 x(t) 和y(t) 是連續函數,最常用的加法和數量乘法的定義如下:
(x y)(t)=x(t) y(t)
(λx)(t)= λx(t)
加法定義的含義是,兩個函數相加在t處的取值等于兩個函數分别在t處取值然後再相加,第一個相加是函數的相加(是我們要定義的),而第二個相加是具體的實數或者複數的相加(是我們熟知的1 1=2的相加)。乘法的定義也是這樣。
與矢量和函數類似,數列之間也可以定義加法和數量乘法運算成為線性空間。兩個數列相加一般定義為對應項相加,數量乘法一般定義為數列每一項都乘以這個數。
5、距離、距離空間
本文第一部分已經提出距離的嚴格定義是什麼的問題。距離指(兩物體)在空間或時間上相隔或間隔的長度,但這并不是數學上距離的嚴格定義。下面給出的是距離空間(也叫度量空間)的定義,裡面的核心就是距離:
度量空間(X, d)是指在其中定義了距離距離(或度量)d 這種結構的集合X,d是定義在X×X上且對所有x,y, z∈X,滿足以下公理的函數:
(1) 非負性, d(x,y) ≥ 0;
(2) 當且僅當 x=y 時,d(x,y) = 0;
(3) 對稱性, d(x,y) =d(y,x);
(4) 三角不等式, d(x,y) ≤d(x,z) d(y,z)。
這四條要求常被稱為距離公理(或度量公理)。
定義中“ d是定義在X×X”通俗的說就是d有兩個自變量,因為距離是兩個點之間的。距離公理一共有4條要求,隻要符合要求就可以稱為距離。首先要闡明的一點是同一對象可以定義不同的距離,比如平面上兩個點x(x1,x2) 和y(y1,y2) 之間的距離可以定義為坐标差的平方和再開方,即
d(x,y)= SQRT[(x1-y1)2 (x2-y2)2]
SQRT表示開方,這是我們最常用的直線距離。還可以定義為坐标差的絕對值的和,即
d(x,y)= |x1-y1| |x2-y2|
這是折線距離(見圖7),對折線距離感興趣的同學可以利用折線距離畫一個圓,比如到(0, 0)點的折線距離都等于1的點構成的曲線,看看結果是什麼。
圖7 直線距離(斜邊)與折線距離(兩條直角邊的和)
除了點,隻要符合距離公理,函數之間也可以定義距離。比如 x(t)和y(t)是兩個連續函數,距離一般定義為兩個函數的差的絕對值的最大值,即:d(x,y) = max |x(t) -y(t) | 。
6、範數、賦範空間、巴拿赫空間
範數是絕對值、複數的模、矢量的模等概念的抽象,見圖8,隻要把具體的對象的性質拿出來就是範數的定義。
圖8 範數
賦範空間是具有範數這一結構的集合,嚴格定義如下:設X是數域K上的線性空間,在X上定義映射 || . ||:X→R,使每一個x∈X對應一個實數 ||x|| ,對任意的x,y∈X和α∈K,滿足以下條件:
(1) 非負性,|| x|| ≥ 0;
(2) 當且僅當 x= θ時,||x|| = 0;
(3) 齊次性,||α x|| = |α| ||x||;
(4) 三角不等式,|| x y|| ≤ ||x|| ||y||;
則稱 || x|| 為x的範數,稱( X,|| . || )為賦範線性空間,簡稱賦範空間,也簡記作X。很明顯範數的四條要求都是絕對值等概念的共同性質。
範數與距離一樣,對于同一個對象可以有不同的定義,隻要滿足範數的四條要求即可。比如三維空間的矢量x(x1,x2,x3),範數可以定義為
|| x|| = SQRT(x12 x22 x32)
也可以定義為
|| x|| = |x1| |x2| |x3|
連續函數也可以定義的範數,設x(t)是連續函數,最常用的範數定義為:
|| x|| = max |x(t) |
也就是函數的絕對值的最大值。函數範數的定義也不是唯一的,同樣的函數可以有不同的定義。
可以利用“範數”在中定義距離 d(x,y) = ||x-y||,即兩個矢量的距離是它們差的範數,稱為由範數誘導的距離。可以看出前面給出的矢量之間的兩種距離可以分别由剛給出的兩種矢量範數導出。
巴拿赫空間:一個賦範空間,如果是完備的,就稱為巴拿赫空間。關于“完備”的定義,先看一個簡單的例子,下面是一個有理數列:
它的每一項都是有理數(有理數可以寫成兩個整數的比),可是這個有理數列的極限卻不是有理數,而是無理數e。這樣我們說有理數是不完備的,而實數是完備的。“完備”的嚴格定義是:如果度量空間 X 中的每個柯西序列均收斂于 X 中的點,則稱 X 為完備的度量空間。柯西序列的定義如下:設( X, d)為度量空間, (xn) 是 X 中的序列,如果對于任意的 ε > 0, 存在 N = N(ε) > 0 , 當m,n> N 時,有d(xm,xn) < ε,則稱(xn)為度量空間 ( X,d) 中的基本柯西序列。基本柯西序列說的是隻要序列中的項足夠靠後,那麼任意兩項之間的距離就可以任意小,比如我們剛給出的序列就是一個柯西序列。柯西序列滿足一定的條件就能找到它的極限,這個條件就是完備。
7、内積、内積空間、希爾伯特空間
内積是我們熟知的矢量點乘概念的推廣。比如中學學習過的“功”等于物體受到的力乘以物體在力的方向上的位移,即
W = FS cosα
F是力的大小,S是位移的大小,α是力和位移之間的夾角。如果矢量F =( F1, F2, F3),S =( S1, S2, S3), 這個公式還可以寫成對應坐标相乘再求和的形式:
W = F1S1 F2S2 F3S3
或者寫成點乘的形式:W = F·S,這就是一種具體的内積。
内積空間的嚴格定義如下:設X是數域 K 上的線性空間,如果映射< · , · > :X × X → K 對任意的x,y,z∈ X 及 α ∈ K 滿足
(1) < x y,z> = <x,z> <y,z>
(2) < α x,y> = α <x,y>
(3) < x,y> = <y,x>
(4) < x,x> ≥ 0, 當且僅當x= θ 時,<x,x> = 0
則稱< x,y> 為x,y的内積。定義了内積的線性空間X稱為内積空間。有了内積的概念,還能定義垂直(也叫正交)的概念,如果兩個矢量x與y的内積 <x,y> = 0,就說x與y相互垂直。比如圖9給出的兩個矢量x(1, 1)和y(-1, 1),内積為
< x,y> = 1×(-1) 1×1 = 0
所以矢量x和矢量y相互垂直。
圖9 矢量的垂直
函數之間也可以定義内積,比如x(t)和y(t)是兩個函數,内積通常定義為兩個函數相乘(也可以再乘以一個權函數,是帶權形式的内積),然後積分:
如果兩個函數的内積為零,就說這兩個函數彼此正交。正交多項式(多項式也是函數)是我們經常遇到的概念,其實就是彼此垂直的一系列多項式。圖10給出的是勒讓德多項式,就是一種正交多項式。勒讓德多項式有無窮多個(圖中給出的是前7個),所有的勒讓德多項式都是兩兩正交的。圖11給出的是勒讓德多項式圖形(前7個)。
圖10 勒讓德多項式
圖11 勒讓德多項式的圖形
希爾伯特空間:若内積空間X是完備的,就稱X為完備的内積空間或希爾伯特空間。由于是完備的,在希爾伯特空間中可以放心地讨論序列的收斂問題,不會出現類似于有理數的問題(數列本身是有理數,但極限卻不是有理數)。
由内積可以導出範數 || x|| = SQRT(<x,x>),進一步還能導出距離d(x,y)= ||x-y||= SQRT(<x-y,x-y>),所以内積空間中不僅有内積,還有線性運算、範數、和距離等,所以應用範圍很廣,尤其是量子力學之中。
8、線性算子和線性泛函
算子是我們經常遇到的概念,比如量子力學中的算符就是算子,其實很簡單,算子就是一種映射。線性算子的嚴格定義如下:設X和Y為同一數域K上的兩個線性空間,X與Y之間的映射也稱作算子,如果算子T:X→Y,滿足如下兩個條件則稱T為線性算子,
(1) T的定義域D(T)是X的線性子空間,T的值域R(T)在Y中。
(2) 對于任意x,y∈D(T),任意α∈K,有T(x y) = Tx Ty, T(αx) =αT(x)
第一條要求T的定義域是線性子空間,就是要求對加法和數量乘法運算封閉,即定義域中兩個矢量相加的結果還在定義域中,定義域中的一個矢量的數乘還在定義域中。第二條要求大家都清楚,可以等價的表達為 T(αx βy) =αTx βTy。
恒等算子、零算子、微分算子、積分算子、矩陣等都是線性算子。恒等算子就是把任何矢量或者函數都映射成自身。零算子是把任何矢量或者函數都映射成零元素。微分算子是把一個函數映射成它的導數。積分算子是把一個函數映射成它的不定積分。一個m×n階實矩陣可以利用矩陣與矢量相乘把n維矢量空間的一個矢量映射到m維矢量空間。
泛函是一個重要概念,有人說泛函是函數的函數,這并不十分準确。線性泛函的定義如下: 設X為線性空間,f為 D (f) ⊂X到數域K的線性算子,則稱f為線性泛函,D (f) 為f的定義域,而
R ( f) = {f(x)∣x∈D (f) }
為 f的值域。簡單說:值域為數域的算子稱為泛函。
從定義可以看出,泛函的核心是把一個矢量或者函數映射成一個具體的實數或者複數。泛函的最簡單的例子是定積分,定積分可以把一個函數映射成一個實數。
在上面定積分表達式的左邊,f表示泛函,x(是t 的函數)是泛函的自變量,對x(t)積分就得到泛函的取值,可以看出這個泛函确實是函數的函數。
下面舉一個關于泛函的很有名的例子——最速降線問題。在鉛直平面中的不同高度上給定兩個點A和B,A高于B,見圖12。設一質點在初速度為0且僅受重力作用的情況下,沿光滑曲線由點A無摩擦地滑行到點B,求解光滑曲線形狀,使得滑行時間最短。
圖12 最速降線問題(A點和坐标原點O重合)
設軌道的形狀用函數 y = y(x) 表示,則質點從A沿 y(x) 滑行到B所需的總時間為
詳細推導過程請大家參考變分法的相關書籍或者在網上搜素,本文不過多介紹。可以看出時間T是函數y(x)的函數,不同的y(x)對應不同的時間T,這和定積分一樣是把一個函數映射成一個實數,所以是一個泛函。采用變分法(泛函求極值的方法)就可以求出這個問題的解(就是時間最短的軌道形狀y(x))如下:
曲線是用參數方程的形式給出來的,θ是參數,是一個旋輪線,就是一個在地上滾動的輪子上的一點描繪出的曲線。可以看出時間最短的軌道形狀y(x)并不是直線,雖然直線的長度最短,路程最短,但時間卻不是最短。采用曲線軌道時,質點一開始的加速度大,能夠在一開始就取得較大的速度,這樣整個過程中的平均速度就會高于直線的情況,從而縮短總時間。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!