機器學習中的數學修煉總結-tft每日頭條

機器學習中的數學修煉總結

生活更新时间:2025-07-05 03:27:16

在機器學習中，一個基礎的概念就是如何判斷兩個樣本之間的差異，從而能夠評價兩個樣本之間的相似性和類别等信息。而判斷這種相似性的度量就是兩個樣本在特征空間内的距離。

根據數據特征的不同，度量方法有很多種。一般而言，對兩個數據樣本x，y，定義一個函數d（x，y），如果定義其為兩個樣本之間的距離，那麼d（x，y）則需要滿足以下幾條基本性質：

1、非負性：d（x，y）>=0

2、同一性：d（x，y）=0 ⇔ x=y

3、對稱性：d（x，y）= d（y，x）

4、三角不等式：d（x，y）<= d（x，z） d（z，y）

通常來講，常見的距離度量包括：點在空間中的距離、字符串間的距離、集合的相似度、變量/概念分布間的距離四種。

今天我們首先來介紹一下最為常用的點在空間中的距離。

點在空間中的距離包括以下幾種：

1、歐幾裡得距離（Ecllidean Distance）

毫無疑問，歐氏距離是人們最熟悉的距離，它即是兩點之間的直線距離。學過初中數學的同學都知道在笛卡爾坐标系中如何計算二維空間兩個點之間的距離

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）1

其計算公式為：

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）2

推廣到N維空間的歐氏距離即為：

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）3

2、曼哈頓距離（Manhattan Distance）

曼哈頓距離又稱為出租車距離，其概念來源于紐約曼哈頓區這樣有很多橫平豎直的街區，在這種街區中，出租車司機如果想從一個點走到另一個點的話，計算直線距離是沒有用的，因為出租車不可能從建築物上飛過去。因此，這種距離通常是将兩個點的東西向、南北向距離分别相減再相加，這也就是出租車實際要經過的距離。

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）4

如圖所示，紅線和黃線就是兩種不同路徑的曼哈頓距離。數學上，二維空間的曼哈頓距離計算方法如下：

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）5

3、切比雪夫距離（Chebyshev Distance）

切比雪夫距離定義為兩個點之間各坐标數值差的最大值。

其最直觀的例子即是國際象棋中的國王，因為它可以橫走直走斜走，但是每次都隻能走一格，所以切比雪夫距離就是他要走到另一個格子所需要的最小距離。

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）6

4、闵可夫斯基距離（Minkowski Distance）

闵氏距離本身不是一個特别的距離，而是将多個距離（曼哈頓距離、歐氏距離、切比雪夫距離）合并成為的一個公式。

其定義為，對于兩個n維變量，闵氏距離為：

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）7

當p=1時，可以看到

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）8

此時為曼哈頓距離。

當p=2時，可以看到

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）9

此時即為歐氏距離。

當p=∞時，可以看到

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）10

此時即為切比雪夫距離。

5、标準化的歐幾裡得距離（Standardized Euclidean Distance）

歐氏距離可以測量兩個點之間的直線距離，但是在某些情況下，可能會受到單位不同的影響。例如同時是差5，差5毫米的身高和差5公斤的體重，觀感可能是完全不同的。如果我們想對三個模特進行聚類，她們各自的屬性如下：

A：65000000毫克（即65公斤），1.74米

B：60000000毫克（即60公斤），1.70米

C：65000000毫克（即65公斤），1.40米

按我們正常的理解，A和B是身材比較好的模特，應該歸到一類。但是以上述單位實際計算的時候，卻發現A和B的差異大于A和C之間的差異。原因在于屬性計量單位的不同導緻數值差異過大。同樣的數據如果換個單位。

A：65千克，174厘米

B：60千克，170厘米

C：65千克，140厘米

那麼就會得到我們想到的結果，将A和B歸為一類了。因此，為避免出現這種由于計量單位的不同而出現的差異，我們就需要引入标準化歐氏距離。在這種距離計算中，會将各個分量都标準化到均值、方差相等的區間。

假設樣本集X的均值(mean)為m，标準差(standard deviation)為s，那麼X的“标準化變量”表示為：

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）11

其中，标準化後的值 = ( 标準化前的值－分量的均值 ) /分量的标準差。經過簡單的推導就可以得到兩個n維向量間的标準化歐氏距離公式為：

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）12

如果将方差的倒數看成是一個權重，這個公式可以看成是一種加權歐氏距離(Weighted Euclidean distance)。通過這種操作，我們就有效的消除了不同計重單位之間的差異。

6、蘭氏距離（Lance and Willianms Distance）

蘭氏距離又稱為堪培拉距離，

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）13

它是一個無量綱的指标，克服了闵氏距離與各指标的量綱有關的缺點，并且對于較大的奇異值不敏感，特别适合調度偏倚的數據。但是這種距離也沒有考慮到變量間的相關性。所以如果需要考慮變量之間的相關性的話，還是需要馬氏距離。

7、馬氏距離（Mahalanobis Distance）

對數值進行标準化之後，就一定不會出問題嗎？也不一定。例如在一個一維的例子中，如果有兩個類，一個類均值為0，方差為0.1，而另一個類均值為5，方差為5。那麼如果一個值為2的點應該屬于哪一類呢？我們直覺上認為它肯定是第二類，因為第一類顯然不太可能在數值上達到2。但是實際上從距離上計算的話2這個數就得屬于第一類。

所以，在一個方差較小的維度下，很小的差别就可能成為離群點。例如說下圖，A與B相對于原點的距離是相同的，但是由于樣本整體沿着橫軸分布，所以B點更有可能是樣本中的點，而A點則更有可能是離群點。

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）14

而在維度間不獨立同分布的情況下，也會出現問題，例如說下圖中的A點與B點到原點的距離相等，但是主要分布類似于f(x)=x，所以A更像是一個離群點。

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）15

因此，我們可以看到，在這種情況下，标準化的歐氏距離也會有問題，所以我們需要引入馬氏距離。

馬氏距離将變量按照主成分進行旋轉，讓維度間相互獨立，然後再進行标準化，讓維度同分布。而主成分即為特征向量方向，所以隻需要按照特征向量的方向進行旋轉，然後縮放特征值倍就可以了。例如上圖變換之後會得到下面的結果：

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）16

可以看出離群點被成功分離了。

馬氏距離是由印度數學家馬哈拉諾比斯提出的，表示數據的協方差距離。它是一種有效地計算兩個未知樣本集的相似度的方法。

對于一個均值為

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）17

，協方差矩陣為Σ的多變量矢量

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）18

，其馬氏距離（單個數據點的馬氏距離）為：

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）19

對于兩個服從同一分布并且其協方差矩陣為Σ的随機變量X與Y的差異程度，數據點x, y之間的馬氏距離為：

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）20

如果協方差矩陣為單位矩陣，那麼馬氏距離就簡化成了歐氏距離。如果協方差矩陣為對角陣，那麼馬氏距離就變成了标準化的歐氏距離。

8、餘弦距離（Cosine Distance）

顧名思義，餘弦距離來源于幾何中的夾角餘弦，它可用來衡量兩個向量方向的差異，而非距離或長度上。當餘弦值為0時，兩向量正交，夾角為90度。夾角越小，餘弦值越接近于1，方向更趨同。

在N維空間中，餘弦距離為：

值得指出的是，餘弦距離不滿足三角不等式。

9、測地距離（Geodesic Distance）

測地距離最初是指球體表面之間的最短距離。當特征空間為平面時，測地距離即為歐氏距離。在非歐幾何中，球面上兩點間距離最短的線是連接這兩點的大圓弧，在球面上的三角形、多邊形的邊也是由這些大圓弧組成的。

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）21

10、布雷柯蒂斯距離（Bray Curtis Distance）

布雷柯蒂斯距離主要用于植物學、生态學和環境科學，它可以用來計算樣本之間的差異。其公式為：

機器學習中的數學修煉總結（機器學習基礎之數字上的距離）22

其取值在[0, 1]之間，如果兩個向量坐标都為0的話，那麼值就無意義。

喜歡本文的話，歡迎關注活在信息時代哦：）

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活折紙——漂亮領結
第一、準備一張長方形的紙、剪刀和膠棒。第二、先用剪刀從長方形紙上剪下一小條。第三、把紙的一端往上折一公分寬度。第四、把紙反過來，再往上折一公分的寬度。第五、來回這樣翻面後再折一公分，直到把長方形紙折完。第六、把開始裁下來的小紙條在折好的紙的中間纏繞，纏緊後，用膠棒把末端粘牢。第七、把兩端的紙打開，就... 2023-07-18
生活淋浴房多大尺寸合适淋浴房防水怎麼做
淋浴房在近幾年得到業主們的喜愛，因為其占地面積小，可進行幹濕分離，同時功能齊全得到一緻好評。但是在選擇淋浴房的時候糾結了，到底淋浴房多大尺寸合适？淋浴房防水怎麼做？接下來小編為大家詳細解答，附上淋浴房品牌排行，給需要購買的朋友一些建議。淋浴房多大尺寸合适一般衛生間的高度在2.4米左右，因此淋浴房生産... 2023-07-18
生活淘特支付寶登錄安全嗎
有在使用淘特的小夥伴應該注意到，想要在淘特上面購物就需要綁定支付寶，不然你就無法使用支付寶付款了。那... 2023-07-18
生活大衛博士是央視合作品牌嗎大博士内褲是...
大衛博士并不确定有沒有和央視合作，隻是在很早以前在央視上過廣告，有一定的知名度，現在已經很久沒在電視打廣告了，基本在朋友圈可以看到很多微商都在宣傳，具體可以看看小編帶來的詳細介紹吧！大衛博士是央視合作品牌嗎我不确定大衛博士是否與央視合作過，但是大衛博士内褲的品牌宣傳中可能會提到與央視某些節目的合作或... 2023-07-18
生活冷藏室是保鮮還是冷凍
一、冷藏室是保鮮還是冷凍保鮮。冰箱的冷藏室是屬于保鮮範疇。一般冰箱冷藏室的溫度設置在4度左右，可以抑制細菌的滋生，同時保持食物短時間的新鮮口感，所以是屬于保鮮冷藏區。而冷凍的溫度是設置在零下18度至零下20度左右，使物體迅速凍起來，可以保持長時間的新鮮。所以一般在一周之内的食用的食物放入冷藏室冷藏即... 2023-07-18
生活科普一下關于廚房牆面裝修的相關内容
正所謂“三分産品，七分安裝”，不僅僅對于安裝木地闆來說，對于鋪貼瓷磚也是一樣的道理。而鋪貼不同房間内的瓷磚所要注意的事項也或多或少會不一樣，就比如說廚房，廚房裡的油煙多、有時還會潮濕，那它對鋪貼瓷磚有... 2023-07-18
生活人造石櫥櫃台的清潔小妙招有哪些讓你的...
人造石就時通過将無機礦物材料及部分輔料加有機粘合劑混合後，進行人工加工而成的，而人造石櫥櫃台就是人們将人造石做成的櫥櫃台，用人造石做出的櫥櫃台它有很多的優點，它具有抗污抗漬的特性，而且還有防腐蝕的作用，它不像一般的家具維護還需要打蠟，它無需這些操作，那麼我們在日常清潔的過程中，關于人造石櫥櫃台的清潔... 2023-07-18
生活有必要給孩子買變速車嗎為什麼不建議孩...
變速自行車比一般的自行車要貴一些，此外對于年齡小的孩子來說，并不利于學車，那麼，有必要給孩子買變速車嗎？下面小編就帶來介紹。有必要給孩子買變速車嗎首先，太小的孩子如果不是有特别的需要是可以不用買變速車的，因為小朋友們如果不懂得操作和駕馭，容易引發危險。而且一輛好的變速車可是不便宜的，市面上有很多質量... 2023-07-18
生活廚房拉籃尺寸是多少如何挑選拉籃規格
我們根據不同的戶型，在對家居裝修的材料選擇上，也會有所偏差。我們的櫥櫃根據不同的規格，内在的一些附屬物件也會随之改變，拉籃就是其中之一。我們廚房拉籃尺寸，是根據我們的櫥櫃以及實用的空間來定的，在我們的生活中，有着許多不同種類的櫃體，對應這些櫃體，我們拉籃的規格應該如何去選擇呢？如何進行挑選，才能為我... 2023-07-18
生活按摩浴缸你會選哪個牌子呢？選購方法在...
很多的家庭在裝修的時候會在衛生間裡安裝浴缸，随着生活品質的提高，人們對享受的要求也随之提高，按摩浴缸就被更多的家庭所青睐，如果你購買按摩浴缸你會選擇哪個牌子呢？今天就給大家介紹下按摩浴缸的十大品牌和選... 2023-07-18
生活海底撈營業時間海底撈是哪個國家的
2023-07-18
生活櫥櫃門用什麼材料好櫥櫃門用什麼材料的...
櫥櫃是現代家居廚房中必不可少的一種設施，主要用來存放煤氣罐、柴米油鹽和鍋碗瓢盆等等。它是廚房中件的家具，需要使用很長一段時間，因此一定要選擇質量好的。那麼究竟櫥櫃門用什麼材料好呢？下面小編就給大家推薦四種比較好的材質，感興趣的朋友一起看看吧！櫥櫃門用什麼材料好一、實木實木是很常用的一種家具原材料，通... 2023-07-18
生活驗收定制櫥櫃台面注意幾要點為你詳細介...
近年來，定制櫥櫃深受人們的歡迎和喜愛，定制櫥櫃可以根據人們的需求進行設計，更大限度的使用空間。定制櫥櫃在安裝好以後，要仔細對其進行驗收，尤其是定制櫥櫃的台面，接下來齊裝小編将為大家詳細介紹驗收定制櫥櫃台面注意幾要點，希望可以幫助到大家！驗收定制櫥櫃台面注意幾要點一、驗收定制櫥櫃台面注意幾要點——外表... 2023-07-18
生活電磁爐突然火力變小要怎麼修電磁爐用久...
電磁爐作為一種方便又安全的一種家用電器，已經成為了不少人煮飯做菜的第一選擇了。那麼，大家在日常使用電磁爐的時候有沒有遇到過問題呢。今天，小編來為大家講解一下電磁爐突然火力變小要怎麼修，電磁爐用久了火力會減弱嗎。希望可以對大家有所幫助。電磁爐突然火力變小要怎麼修1、電磁爐火力變小一般來說是發熱管損壞導... 2023-07-18
生活 AppleCard中國能用嗎？支持哪...
最近有關AppleCard的使用情況網上還是有不少用戶關注的，尤其是國内蘋果用戶對于AppleCard功能也都比較感興趣。那麼，AppleCard中國能用嗎？AppleCard支持哪些國家？随着越來越多的用戶開始關注AppleCard，下面來看下關于AppleCard目前可使用地區分享。AppleC... 2023-07-18
生活支付寶掃碼領紅包二維碼在哪
大家都知道支付寶裡面有掃碼領紅包活動，2018年底的紅包金額非常大風靡一時，最近大家涮朋友圈時會發現... 2023-07-18
生活裝修選購櫥櫃要注意哪些事項質量安全帶...
我們在裝修廚房的時候，首先要考慮到的是廚房的整體規劃，尤其是對于小戶型的廚房而言，合理的規劃才能為我們帶來整潔實用的廚房空間。在我們的廚房中裝修櫥櫃，可以為我們的廚房儲物帶來一定的幫助，為我們的廚房帶來整體的規劃，但是我們在裝修選購櫥櫃的時候，應該注意哪些事項呢？如何才能為我們帶來更加實用的廚房櫥櫃... 2023-07-18
生活 shit bro是什麼梗
2023-07-18
生活嬰兒潤膚霜可以塗臉嗎嬰兒面霜每天擦幾...
通常大多數的嬰兒都是塗過嬰兒潤膚霜的，這種産品能夠幫助保護寶寶的皮膚，而很多寶媽會用潤膚霜幫寶寶塗臉... 2023-07-18
生活帥康櫥櫃質量怎麼樣帥康櫥櫃好用嗎
在當今科技飛速發展的時代，廚衛市場的競争同樣十分激烈，帥康櫥櫃便是其中的一員，當然大家也知道帥康進軍廚房櫥櫃領域還不是很久。那麼，這就會有人問了：帥康櫥櫃好不好呢？帥康櫥櫃質量如何呢？下面我們就一起來了解一下帥康櫥櫃。帥康櫥櫃質量怎麼樣一、品牌介紹帥康集團創辦于1984年，經過29年的發展，已經成為... 2023-07-18
生活元氣森林真的0糖0脂肪嗎元氣森林真的...
2023-07-18
生活科勒浴缸質量怎麼樣科勒浴缸是幾線品牌
科勒浴缸是科勒集團旗下的産品，該集團是一個美國廚衛品牌，于1873年創立，是美國目前*龐大的家庭企業之一，總部位于威斯康辛州，在全球範圍内擁有50家工廠、20000多員工。接下來，我們就一起來了解一下科勒浴缸質量怎麼樣，科勒浴缸是幾線品牌以及科勒浴缸價格多少錢的相關内容，希望可以幫助到大家。科勒浴缸... 2023-07-18
生活景崗衛浴有質量問題嗎景崗衛浴是幾線品...
随着人們的生活水平在不斷的提高，使得生活質量也有了很明顯的提升，随之高品質的家居生活成為了他們所追求的，就拿衛浴産品的選擇上來說吧！如今市面上的衛浴品牌非常的多，景崗衛浴就是其中一個非常不錯的選擇，下面就讓我們一起來了解下景崗衛浴有質量問題嗎，景崗衛浴是幾線品牌，一起往下看吧。景崗衛浴有質量問題嗎1... 2023-07-18
生活如何正确選購廚房水槽選購廚房水槽看哪...
廚房水槽對每個家庭來說，是不可或缺的廚具之一。如何正确選購廚房水槽，是每個媽媽們希望的。所以廚房水槽的各個部件選購，顯得格外重要，選的不好完全是會影響做飯的心情的。下面給大家介紹如何正确選購廚房水槽，讓你在挑選水槽時更！如何正确選購廚房水槽一、如何正确選購廚房水槽——看工藝水槽有兩種工藝，一種是水流... 2023-07-18
生活生日和國慶節同一天朋友圈怎麼寫生日和...
相信大家都知道自己的生日是幾月幾日，有人在1月1日，有人在10月1日，10月1日是我國的國慶節，跟國... 2023-07-18
生活别人網貸留我電話會影響征信嗎？别人網...
2023-07-18
生活吃柿子能喝飲料嗎
吃柿子能喝碳酸飲料和果汁，但盡量不要飲用奶制飲品和酒，碳酸飲料中的物質不會與柿子含有的物質産生反應，适量食用也不會危害身體健康，同果汁食用營養價值更高，但是同奶制品和酒一起食用容易形成不易消化的物質，危害腸胃健康。吃柿子能喝飲料吃柿子可以喝碳酸飲料例如可樂、雪碧等，因為碳酸飲料中中不含酒精、蛋白質、... 2023-07-18
生活穿别人洗過的内褲會得病嗎穿别人洗過的...
内褲是現在很多人都穿過的，但是需要注意衛生問題，自己的内褲自己穿，不要想着穿别人的内褲，上面會有很多細菌的，除非是别人的内褲沒穿過未拆封的，全新内褲就是可以穿的。穿别人洗過的内褲會得病嗎穿别人洗過的内褲有一定的健康風險，因為即使内褲經過清洗，仍然可能殘留有細菌和病毒。特别是性病和皮膚病，這些疾病可以... 2023-07-18
生活杏鮑菇能和胡蘿蔔一起吃嗎
通常情況下杏鮑菇和胡蘿蔔是能一起吃的，可将兩者放在一起清炒，是一道傳統的美食，而杏鮑菇和胡蘿蔔都是營養價值很高的食物，經常同吃的話能起到營養互補的作用，還能起到強身健體、補血益氣等功效。杏鮑菇能和胡蘿蔔一起吃杏鮑菇和胡蘿蔔都是平時見到的一種食物，一般來說它們是能一起吃的，在營養成分上不會有什麼相克的... 2023-07-18
生活卧室裝修燈具的選擇和安裝很重要，這些...
卧室是我們休息的重要場所，雖然卧室的家具用品不是很多但是每一樣都是很重要的，今天我們要說的卧室裝修中燈具的選擇和安裝，卧室燈具的選擇和安裝正确與否是會對我們的睡眠有很大影響的，下邊就一起來了解下卧室用... 2023-07-18

tft每日頭條

> 生活

> 機器學習中的數學修煉總結

機器學習中的數學修煉總結

相关生活资讯推荐

热门生活资讯推荐

网友关注