機器學習降維圖解-tft每日頭條

機器學習降維圖解

圖文更新时间:2025-07-18 14:54:14

機器學習降維圖解（周末AI課堂線性降維方法）1

周末好啊各位同學，我們又見面了。

科幻名著《三體》裡有句犀利的台詞——降低維度用于攻擊。不過，這個“降維”絕對不隻是科幻界的專用名詞。

在機器學習中，你同樣得了解它。

很多初學者往往會把降維（Dimensionality reduction），特征選擇（feature selection），以及特征提取（feature extraction）混為一談，因為這三者都削減了進入模型的變量個數。

但降維是一個更為寬泛的概念，它包括了特征選擇和特征提取。

雖然降維過後，最終使用的變量個數減少了，但特征選擇挑選的是特征子集，也就是說，保留下來的所有特征都在原來的特征集中可以找到；而特征提取所提取的是不再是特征子集，而是原來特征的線性（或者非線性）組合，我們經過特征提取後的變量都是新的變量，它的本質是将原始高維空間向低維空間投影，我們所使用的特征不僅少了，而且不再是原來的特征。

距離是機器學習中的一個很重要的概念。每個樣本可以表示為一個向量，也就是高維空間的一個點，距離可以用來衡量樣本之間的相似度。但是在高維空間，距離的計算會變得非常困難，而我們關心的問題可能在低維空間就會得到很好的解決。但這不意味着低維空間隻是對高維空間的近似，有些問題中，高維空間會增加很多噪聲，而在低維空間中會得到比高維空間更好的性能。

在上周《如何進行特征選擇（理論篇）》的學習中，相信大家已經對特征選擇有了足夠的認識，所以本文的“降維”特指特征提取。

對于降維有兩種分類方式：其一，根據目标值（target）的參與與否，分為有監督降維和無監督降維；其二，根據高維空間與低維空間的關系，分為線性降維和非線性降維。

我們對每種方法分舉一例：

線性\監督

無監督

監督

線性

PCA

LDA

非線性

ISOMAP

KLDA

機器學習降維圖解（周末AI課堂線性降維方法）2

主成分分析（PCA）

數學準備：

1.協方差矩陣：随機變量組成的向量，每組随機變量的協方差構成的一個對稱矩陣，其對角元是每組随機變量的方差

2.矩陣的對角化：對于矩陣M，有可逆矩陣V，使得

成為對角矩陣，而M的特征值對應的特征向量組成了該可逆矩陣V。（換而言之，矩陣V的每一列對應着M的特征向量）

3.正交矩陣：轉置矩陣等于其逆矩陣（

），構成矩陣的列向量彼此正交。

4.數據中心化：對每組随機變量減去均值，再除以标準差。本質是将每組随機變量變為标準的高斯分布。

PCA（Principal component analysis）是用投影的方法将高維空間壓縮到低維。

想象一下，此時你站在路燈下面，你本身是三維的（此時此刻除去了時間維度），你的影子卻在一個二維平面上。

如圖，我們将二維空間的點投影到一條直線上。

但是，我們有無數個投影的方向，就像上圖我們可以找出無數條直線來進行投影，那麼哪條直線，哪個方向才是最好的呢？PCA的目标就是，找一條直線，使得投影之後的點盡可能的遠離彼此，因為點之間的互相遠離而不是相互重疊，就意味着某些距離信息被保留了下來。

在高維空間（維數D）的所有的樣本可以被表示為一個向量:

在投影之後的低維空間（維數d），樣本也是一個向量：

向量的變化可以通過一個矩陣聯系起來，這個矩陣我們把它叫做投影矩陣，它的作用是将一個高維向量投影到低維空間得出一個低維向量：

此時，中心化數據的優勢就體現了出來，因為經過中心化的數據，

，這就意味着數據的協方差矩陣就成了

，投影之後的協方差矩陣就成為了

,我們的目标是使其方差最大，而協方差矩陣的對角元正是方差，所以我們隻需要對其求迹：

換而言之，我們需要找的投影矩陣W其實是一個使

對角化的可逆矩陣，而它的轉置等于它的逆

。所以我們尋找W的過程，就是尋找

的特征向量的過程，而方差最大化的過程，也就是尋找

最大特征值的過程。

所以，我們隻需要對

做特征值分解，将其特征值排序，取到前面的d個特征向量，彼此正交，構成了投影矩陣W，而它們所張成的低維空間，就是使得投影點方差最大的低維空間。

如圖，這是對一個二元高斯分布用PCA進行降維後的結果，這個平面就是由兩個最大的特征值對應的特征向量所張成，可以看出，特征向量彼此正交，且首先找到的是最大的特征值對應的特征向量，逐步尋找第二個，第三個.....如果我們的目标空間是n維，就會取到前n個。

線性判别分析（LDA）

數學準備：

1.均值向量：由多組随機變量組成的向量，對每一組随機變量取均值所構成的向量。

2.厄米矩陣（Hermitan ）：轉置等于其本身的矩陣，

。

3.廣義瑞利熵（Rayleigh quotient ）：若x為非零向量，則

為A,B的廣義瑞利熵，它的最大值是

的最大特征值。

4.矩陣的奇異值分解：任何實矩陣M都可以被分解成為

這三個矩陣的乘積。U和V均為正交矩陣。U的列向量是

的特征向量，V的列向量是

的特征向量，同時奇異值的大小

是的特征值的平方根。

LDA（Linear Discriminant Analysis）的基本思想也是将高維空間的樣本投影到低維空間，使信息損失最少。

與PCA不同在于，PCA隻針對樣本矩陣，希望投影到低維空間之後，樣本投影點的方差最大；但LDA不僅針對樣本矩陣，還使用了類别信息，它希望投影到低維空間後，相同樣本的方差最小（相同樣本的集中化），不同樣本的距離最大（不同樣本離散化）。

如圖所示，将二維空間投影到一維空間，即一條直線上。圖2相比圖1，類間樣本距離更大，類内樣本方差更小。

以二分類問題為例，我們用

表示兩類樣本，用

表示兩類樣本的均值向量，用

來表示兩類樣本的協方差矩陣，與PCA一樣，我們假設存在一個投影矩陣W，這些量會在低維空間變成：

其中

分别為低維空間的樣本，均值向量和協方差矩陣。在投影空間的相同樣本的方差最小，意味着

最小；而不同樣本的距離最大，意味着

最大。

我們定義原始空間的樣本協方差矩陣之和為

,類内散度矩陣（whithin-class scatter matrix），用來刻畫原始空間上相同樣本的方差：

同時定義類間散度矩陣（between-class scatter matrix）

,用來刻畫原始空間上不同樣本的距離:

将以上的原則結合起來，我們的目的就變成了：

根據廣義瑞利熵的形式，我們尋求最大值就變成了對

進行奇異值分解，然後選取最大的奇異值和相應的特征向量。這些特征向量所張成的低維空間，就是我們的目标空間。

讀芯君開扒

課堂TIPS

• 降維在表示論中屬于低維表示，本質是将原本空間壓縮到更小的空間，在這個過程中保證信息損失的最小化。與之相對的是稀疏表示，它是将原本的空間嵌入到更大的空間，在這過程中保證信息損失的最小化。

• PCA有多種理解方式，除了在低維空間使得樣本方差最大化，也可以理解為最小重構均方誤差，将問題轉化為所選低維空間重構的數據與實際數據的差。引入貝葉斯視角，還可以将PCA理解為最小化高斯先驗誤差。如果從流形的角度看，就是把數據看作一個拓撲空間的點集，在高斯概率空間内找到一個對應的線性流形。

• PCA和LDA的優化目标均可以用拉格朗日乘子法解決。PCA同樣也可以通過奇異值分解來解決。奇異值分解方法可以理解為是特征值分解的推廣，因為特征值分解要求矩陣為一個方陣，但奇異值分解并無此要求。

作者：唐僧不用海飛絲

如需轉載，請後台留言，遵守轉載規範
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

圖文喬任梁是怎麼去世
#頭條創作挑戰賽#關注我，每天帶來名人感動的故事！2016年9月16日晚，喬任梁因抑郁症在上海家中去世，年僅28歲。今天是喬任梁去世6周年，父母發文悼念：916，這個世界再也沒有你。即便過去了6年，他們的生活看似和常人無異，但内心的傷痛卻無... 2022-11-11
圖文每日一字30
牛，甲骨文中是一隻牛頭的形狀。牛在十二生肖中排第二，傳說本分的老牛馱着小老鼠去天帝那兒報到，老鼠見快到終點了，從牛背上跳下來搶到了第一。中華民族的始祖炎帝神農氏，在五六千年前就是以牛為圖騰的部落首領，這足以說明牛和人類的關系密切已經是曆史悠... 2022-11-10
圖文人才就業補貼山東
人才就業補貼山東?編者按：黨的十八大以來，山東深入學習貫徹重要指示精神，踔厲奮發新時代，不斷築牢高質量發展基石，奮力開創社會主義現代化強省建設新局面即日起，齊魯晚報·齊魯壹點将推出“喜迎二十大·非凡十年看山東”系列策劃，對我省各重要領域、重... 2022-10-07
圖文 dnf最漂亮的女角色技能
dnf最漂亮的女角色技能?DNF擁有數量衆多的女NPC角色，不同風格的NPC滿足了大家各自的口味，那麼這些年地下城是否有哪個女NPC曾經驚豔到你呢？你心中哪個最美的女NPC角色是哪個？，今天小編就來說說關于dnf最漂亮的女角色技能?下面更多... 2022-10-07
圖文 dnf光劍哪個值得買
“沒有這把武器，就算你穿上導師套，也不會像GSD”，這句話在遊戲中很流行！不過，究竟是何種武器，如此的讓阿修羅癡迷？前幾天旭旭寶寶，在直播時讨論過，已成為熱門話題。然而，有位水友不淡定了，發帖曬出這把武器，但因紅字而出現貓膩！玩家曬出GSD... 2022-11-18
圖文 318川藏線最适合時間
今天周末，電腦前看着以前拍攝的照片，看着網友們的旅遊攻略，心也随着飛到那遙遠的地方，入藏的線路很多，攻略也很多，每個人進藏的側重點也不同，所以攻略也不盡相同，但至少可以參考參考大抵的路線。各地海拔高地圖第一天：各地抵達成都成都市川藏線首選的... 2022-11-04
圖文餡餅怎麼才能多包餡
很多喜歡在家裡做面食，尤其是北方的朋友，面食的種類更是豐富，各種花樣的蒸、煮，最近發現了一個問題，很多朋友在家裡做餡餅的時候總是包不好，在烙餅時候很容易破，當然每人的方法可能不一樣，原因自然各不相同，有人可能面比較稀，有人可能包的不勻等等，... 2023-03-03
圖文饸饹面的簡易做法
（央視财經《回家吃飯》）今天有兩位歌唱家來到咱《回家吃飯》的廚房，著名男高音演唱家閻維文老師和他的學生青年歌唱家龔爽~舞台上的歌唱家，評委席上的導師，著名男高音歌唱家，國家一級演員閻維文，在生活中，竈台前是怎樣的？小二先帶您看一看，沒想到愛... 2022-10-23
圖文怎麼快速關閉窗口
怎麼快速關閉窗口?不可否認，最常用的方法就是點右上角的紅叉了，但是，還有其他一些技巧可以快速關閉程序，今天小編就來說說關于怎麼快速關閉窗口?下面更多詳細答案一起來看看吧!怎麼快速關閉窗口不可否認，最常用的方法就是點右上角的紅叉了，但是，還有... 2022-10-13
圖文海莉比伯穿搭
海莉比伯穿搭?自從成為了比伯的妻子，海莉在媒體中的曝光率也是越來越高，身為模特的海莉本來就是一個天生的衣架子平時出街海莉就以休閑寬松的運動裝扮為主，尤其是酷愛oversize的西裝外套，總感覺穿着男朋友的外衣，但也正是因為這些獨特的穿衣風格... 2022-10-13
圖文個性簽名簡短又精辟
一、色彩，淡淡的就好，深了會褪色；生活，簡單就好，複雜了會變質。二、怕什麼路途遙遠。走一步有一步的風景，進一步有一步的歡喜。幸福，在路上。三、有些問題沒有答案就不要再追問，你要明白不是所有的事都會如願以償，來日方長，不如沒心沒肺笑一場。四、... 2022-10-24
圖文早晨空腹喝茶行不行
不能一概而論，這其實是因人而異。對于喜歡茶的人來說，白開水淡且無味，那自然是不喝咯？他們更喜歡的是喝一杯茶，我也是這樣哈。在空腹的狀态下，早上起來能空腹喝茶麼？一般來說早起後空腹飲濃茶，不僅會引起胃腸不适，食欲減退，還可能損害神經系統的正常... 2023-01-15
圖文聯通話費預存送蘋果
一年一度的雙十一剛過去，但總覺的差了一點，似乎沒有那麼多亮點可循。沒有了當初的搶購的熱情，話說，網購不是為了省錢麼？現如今怎麼變成了剁手。很多電商平台的活動似乎還并沒有結束，紛紛都在做返場活動。而湊巧抓到了聯通會員活動還沒有結束，不妨我們來... 2022-11-07
圖文轉轉交易平台的手機怎麼樣
屬于iPod的時代，即将落幕。5月10日，蘋果官方宣布iPodtouch停産，官網也顯示iPodtouch庫存有限、售完即止。作為一款劃時代的産品，iPod為我們留下了什麼？從iPodmini、iPodclassic到iPodshuffle... 2022-12-17
圖文小學三年級守株待兔文言文翻譯
下面這篇文言文是三年級下冊語文第5課的内容：參考答案：1、用“|”給上文斷句。宋人有耕者|田中有株|兔走觸株|折頸而死|因釋其耒而守株|冀複得兔|兔不可複得而身為宋國笑|2、你知道下面的字在文中的正确讀音嗎？請在正确的讀音上打“√”。耕（g... 2022-11-08
圖文三亞鳳凰機場有淩晨的航班嗎
三亞鳳凰機場有淩晨的航班嗎?來源：中新經緯【突發#三亞鳳凰機場進出港航班大面積取消#】6日中午，中新經緯注意到，據飛常準、飛豬等平台，三亞鳳凰機場飛機大面積取消，包括從三亞到北京、上海、杭州、蘭州等多地已無直飛方案據飛常準APP，當前三亞鳳... 2022-10-12
圖文盤點臉上不同部位長痘的原因
臉上長痘真的是太影響顔值和心情了，尤其是大面積爆痘的時候，簡直苦不堪言，但是想要解決這個問題，首先就要了解原因，這樣才能對症下藥。不同部位長痘，原因不同額頭痘原因：說明肝髒積累過多毒素。長期生活不規律、晝夜颠倒、熬夜、暴飲暴食會使肝髒不能再... 2022-12-09
圖文得了腦炎後續恢複注意事項
得了腦炎後續恢複注意事項?點擊右上角立即關注，更多健康内容不再錯過，不定期驚喜送給你，下面我們就來聊聊關于得了腦炎後續恢複注意事項?接下來我們就一起去了解一下吧!得了腦炎後續恢複注意事項點擊右上角立即關注，更多健康内容不再錯過，不定期驚喜送... 2022-10-08
圖文端午節重慶周邊清涼遊
端午節重慶周邊清涼遊?端午小長假，重慶氣溫逐漸升高趁着難得的假期，很多水上樂園成了市民避暑納涼的好地方，今天小編就來聊一聊關于端午節重慶周邊清涼遊?接下來我們就一起去研究一下吧!端午節重慶周邊清涼遊端午小長假，重慶氣溫逐漸升高。趁着難得的假... 2022-10-08
圖文薛之謙蒙面唱将
今晚，江蘇衛視播出的《蒙面唱将猜猜猜》，一位名叫“刺”的黑衣男子深情演唱《遺憾》，摘下面具後竟是薛之謙。這位黑衣男子手拿仙人掌上台，演唱的唱腔雖有僞裝，但獨特的聲線還是能聽出就是薛之謙的聲音，猜評團裡的巫啟賢也說道：“今天這首歌曲完全把我給... 2022-11-11
圖文堅守崗位忙生産穩崗留工暖人心
堅守崗位忙生産穩崗留工暖人心?新華社福州4月11日電題：“招工不難、生産有序”——福州助力企業穩崗穩生産，今天小編就來說說關于堅守崗位忙生産穩崗留工暖人心?下面更多詳細答案一起來看看吧!堅守崗位忙生産穩崗留工暖人心新華社福州4月11日電題：... 2022-10-08
圖文歐洲哪些國家留學比較好
歐洲哪些國家留學比較好?在國外接受高等教育是一項偉大的成就和改變生活的經曆，但大多數時候它也涉及高昂的成本，下面我們就來說一說關于歐洲哪些國家留學比較好?我們一起去了解并探讨一下這個問題吧!歐洲哪些國家留學比較好在國外接受高等教育是一項偉大... 2022-10-05
圖文農村十大實用緻富項目
現在我們的國家都是在大力開展新農村的建設當中，很多的有志青年都回到了自己的家鄉當中進行創業，但是回到了自己的家裡以後，又不知道幹些什麼比較的好，其實呢，我們想要在農村進行創業，那麼一定要結合農村的實際情況來進行決定，那麼農村千元緻富小項目都... 2022-11-26
圖文肺癌早期有6個早期信号
肺癌，目前仍然是我國發病率、死亡率雙雙高居榜首的癌症。衆所周知，低劑量螺旋CT是發現早期肺癌較為有效的一種檢查手段，但是一般情況下很少有人會主動想要去做這個檢查，以至于疾病發展趨勢愈來愈難以控制去就診時，才在醫生的要求下做這項檢查。肺癌的很... 2022-12-08
圖文麥卡倫威士忌1991
在最近的一次拍賣中，一桶罕見的麥卡倫1991蘇格蘭威士忌以230萬美元（約合人民币1472萬元）的價格成交，創下了世界上最昂貴的桶裝威士忌的新紀錄，這個麥卡倫1991桶裝威士忌通過加密貨币錢包Metacask與NFT(非同質化代币)一起出售... 2022-11-30
圖文怎麼知道全民k歌好友在線
全民k歌是一款十分強大的手機唱歌軟件，在這裡用戶們可以享受到十分逼真的歌唱環境以及專業的評分。那全民k歌如何看對方是否在線呢？如果你還不是很清楚就快來看看下面小編帶來的詳細教程吧！全民K歌好友在線情況查看方法介紹1、打開全民K歌，點擊【歌房... 2022-11-18
圖文疏肝解郁能緩解失眠嗎
情緒抑郁，失眠焦慮，臉上爆痘，滿身結節，很多時候我們都會想，我們到底怎麼了？物質生活的富足不應該是讓人覺得開心的嗎？為什麼現在會覺得這麼不如意呢？其實，我們可以将導緻我們精神焦慮，身體長結節的原因分成三部分。分别是社會因素、心理因素、身體因... 2022-11-24
圖文錯誤派送物品金額多大立案
中央紀委國家監委網站韓亞棟針對通過快遞違規收送禮品禮金問題，浙江省東陽市紀委監委緊盯關鍵節點，聯合郵政管理等職能部門組成監督檢查組，對土特産店、商超等發出的快遞信息開展監督檢查，篩查寄往企事業單位、重點小區、重點人員的快遞信息。圖為近日，監... 2022-11-13
圖文計算機英語詞彙練習
計算機英語詞彙練習?在遠程辦公成為日常的今天，電腦已經成為我們工作學習當中使用頻率很高的工作用品，今天小編就來聊一聊關于計算機英語詞彙練習?接下來我們就一起去研究一下吧!計算機英語詞彙練習在遠程辦公成為日常的今天，電腦已經成為我們工作學習當... 2022-11-10
圖文冬天發面怎麼才能發得更好
導讀：氣溫越來越低，冬天越來越近，這冬天一到很多朋友要開始愁了，這想吃個饅頭發面怎麼都發不起來，不用擔心朋友們，今天我們跟着老師一起來學習冬天發面技巧，讓你在冬天輕松發面，那一起來學習吧!金黃的銀杏還沒完全的投入大地的懷抱，冬天的寒冷就猝不... 2022-11-30

tft每日頭條

> 圖文

> 機器學習降維圖解

機器學習降維圖解

相关圖文资讯推荐

热门圖文资讯推荐

网友关注