pca主成分分析總得分-tft每日頭條

pca主成分分析總得分

生活更新时间:2026-03-06 08:17:23

在本文中，我們将讨論主成分分析(PCA)，它是什麼?它是如何工作的?在哪裡使用?首先，我們将研究PCA背後的技術細節，并将其應用于衆所周知的iris數據集并讨論結果。但是，讀者應該具備線性代數和統計分析的知識;至少了解矩陣運算和方差/協方差。

主成分分析是什麼?

PCA是一種在數據集中提取模式的統計技術，是降維方法，但實際上不止這些。PCA隻是轉換您的數據集以識别隐藏的關系，相似性或差異，然後您可以在其輸出上進行降維，數據壓縮或特征提取。然而，PCA是最着名的并且用于減少數據集的維度，這就是我們将在本文中做的事情：使用PCA降低維數。

您應該在這裡提出這個問題:為什麼我們需要減少數據集中的維度?那不是失去信息嗎?是的，當我們丢棄數據中的一些維度時，我們就會丢失信息。然而，在某些情況下，我們的數據可以有許多特征或變量來應用機器學習技術進行分類或聚類。想想亞馬遜視頻、Youtube或Netflix的用戶數據集，每個視頻内容都是一個變量或特性，當您需要提取用戶或視頻之間的相似性并生成推薦時，它們可能是百萬維的。

簡單地說，數據的維度越多，處理起來就越困難。采用PCA、LDA等降維技術，是從數據中提取新的強大的特征，使用這些新的特征或組件代替原始的特征。

主成分分析是如何運作的嗎?

為了分析和建立新的數據集(減少了維度)從原始的數據集由PCA，一般采用以下步驟:

獲取數據集
計算數據的協方差矩陣
計算特征值和特征向量除以協方差矩陣
選擇主成分
從選定的組件構造新的特征數據集

讓我們讨論并将每個步驟逐個應用到iris數據集。

1.獲取數據集

正如我們所說，iris數據集是本文中的目标數據集。數據有4個特征或變量; 或矩陣代數中的4維。并且，1個目标向量顯示依賴于4個特征的花的類型。所以，問題在于四維。4D并不多，但我們會嘗試将其縮小為2D以說明PCA。讓我們開始加載數據：

# sklearn has built-in iris dataset

iris數據集的協方差矩陣
3.計算特征值和特征向量
特征值和特征向量是PCA的核心; 不僅在PCA中，而且在其他如SVD，LDA中也是如此。但為什麼他們如此重要？特征值和特征向量相關聯構成了矩陣方程的根特征。我将把這個解釋留給這個來源，并繼續使用PCA的特征向量和特征值的重要特征。

我們需要了解它們的3個簡單特征：首先，我們隻能計算方陣的特征值/特征向量（nxn，矩陣的協方差）。其次，特征向量彼此垂直/正交。如果我們有n維矩陣，那麼我們在n空間中有n個特征向量，并且它們都是垂直的。這是有道理的，因為它們都構成了它們所代表的數據。最後，特征向量的長度恰好為1，并且每個特征向量具有相應的特征值，其表示向量的幂。

由于我們正在尋找新的特征來減少數據的維數，因此計算數據協方差矩陣的特征向量來尋找具有顯著性(特征值)的patterns (特征向量)。協方差矩陣的特征向量将代表新的特征，我們将根據它們的特征值幂或影響來選擇其中的一些特征。我們在iris示例中做這個。我們已經有了協方差矩陣它是一個方陣!

# numpy linear algebra module eig() api

# Compute the eigenvalues and eigenvectors of a square array

eig_values, eig_vectors = np.linalg.eig(R_cov)

# print values and corresponding vectors

eig_values

eig_vectors

iris數據集協方差矩陣的特征值

iris數據集協方差矩陣的特征向量
4、選擇主成分
從第一個結果中，我們得到了數據中每個維度的特征值，以及相應的特征向量。我們需要知道的是，将特征值從高到低排序。然後，我們選取一些值最高的特征向量來構建我們的新特征。

正如我們前面讨論的，特征值代表一個向量的影響或力量，所以我們必須選擇特征值較高的特征向量。在這種情況下，由于我們希望将虹膜數據的維數減少到2，我們将選擇第一個特征向量，因為它們的特征值是結果中最高的2。所選擇的最高值特征向量将是我們構建新特征和簡化數據集的主要組成部分。我們把這個矩陣叫做新特征向量。

# pick 2 eigenvectors whose eigenvalues are highest

featureVector = eig_vectors[:,:2]

featureVector

選擇2個特征值最高的特征向量

通過丢棄一些特征值/特征向量，我們将丢失一些信息。但是，由于我們選擇具有最高價值或重要性的組件，因此這種松散是合理的。通過删除，我們将使用較少維度的數據來工作。
5.構建新的簡化數據集
為了建立新的數據集，我們需要将原始矩陣(R)的轉置乘以新特征向量的轉置(選擇的主要成分)。

為什麼我們乘以原始數據集和主成分的轉置是為了獲得我們選擇的特征向量的新數據。我知道它似乎很複雜但你可以找到迄今為止采取的這些步驟的視覺解釋。

使用矩陣可視化在PCA中應用的步驟

這裡是為iris數據集生成新2D數據的Python代碼

featureVector_t = np.transpose(featureVector)

# R is the original iris dataset

R_t = np.transpose(R)

newDataset_t = np.matmul(featureVector_t, R_t)

newDataset = np.transpose(newDataset_t)

# check the shape of new reduced 2D dataset

newDataset.shape

最後，我們得到了二維簡化的新數據集。當然，它已經丢失了一些信息，但是由于我們選擇了兩個主要的特征向量，我們從選定的分量中構建的新特征應該足夠更進一步。

現在，我們來想象一下。首先，我們的數據集有4個維度，不可能繪制，但這是一個2D數據，很容易繪制。

import seaborn as sns

import pandas as pd

%matplotlib inline

# create new DataFrame

df = pd.DataFrame(data=newDataset, columns=['PC1', 'PC2'])

y = pd.Series(iris.target)

y = y.replace(0, 'setosa')

y = y.replace(1, 'versicolor')

y = y.replace(2, 'virginica')

df['Target'] = y

# plot 2D data

sns.lmplot(x='PC1', y='PC2', data=df, hue='Target', fit_reg=False, legend=True)

二維簡化數據圖

從上面的圖中，現在可以很容易地對兩個主成分的樣本進行分類或聚類。雖然由于删除了其他次要組件而丢失了一些信息，但是現在我們手裡有了更多可解釋的數據。最好的是它仍然非常接近原始數據。
結論
我們将原始虹膜數據集中的維度縮減到理想的大小(2D)，并産生了新的特性。現在，在新的數據集中應用進一步的技術将更加有效。對于這個iris示例，我們并沒有獲得太多，可以考慮亞馬遜、Youtube和Netflix等大公司的數據集。

然後我們可以繼續應用我們的分類/聚類技術，在新的數據集或主組件上找到最好的MSE/MAE。如果結果不能滿足我們的要求，我們可以嘗試改變組件數量，或者可以應用其他類似的降維方法，比如SVD或LDA。
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活卡西歐casiog-shockga1...
HwaiYip2015-05-2211:22●開箱曬物我的想象中，有一塊手表。與衆不同最時尚，看時間肯定棒。因為工作和生活的關系，我想要一塊擁有指南針、防水、夜光的手表，于是我一開始看上了Timex天美時的T2N723錯過了黑色星期五，證明... 2022-12-02
生活什麼是廣域網
什麼是廣域網?廣域網（英語：WideAreaNetwork，縮寫為WAN），又稱廣域網、外網、公網是連接不同地區局域網或城域網計算機通信的遠程網通常跨接很大的物理範圍，所覆蓋的範圍從幾十公裡到幾千公裡，它能連接多個地區、城市和國家，或橫跨幾... 2022-08-13
生活七夕節說什麼祝福語
七夕節說什麼祝福語?浪漫美好的七夕佳節就要到來，願你在七夕的月光裡，邂逅愛情，抓住屬于自己的幸福;牽手真情，珍惜已經擁有的緣分;再遇癡情，在愛的甜蜜裡享受人生;深陷濃情，在濃濃家庭的溫馨裡感受快樂!願你擁有千種好心情，萬般妙風情!提前祝你七... 2022-07-19
生活英語歌曲翻唱大神
英語coversong是中文“翻唱歌曲”嗎？如果問你：英語“翻唱”怎麼說？你是不是馬上努力回想學過的英語acoversong?可是，溝通過場中你一時想不起來英語acoversong時怎麼辦？這就涉及我們學英語是必須培養把學成英語的能力問題：... 2022-10-22
生活楊幂近照穿搭
自從楊幂因錄制節目眼角受傷後，引發粉絲心疼與擔憂，生怕她會留下疤痕，影響她的絕世美顔。但本尊卻又是名副其實的拼命女郎，送醫治療後，帶傷進組拍戲。還被拍到眼角包裹紗布，傷沒好就投入工作，惹人心疼。近日，有媒體拍到楊幂最新機場照，瞬間成為關注焦... 2022-12-07
生活頭發拉直太死闆怎麼辦
頭發拉直太死闆怎麼辦?吹風機女性洗完頭發之後，應該再用吹風機給頭發吹幹，這樣能夠使頭發變得蓬松起來，自然也就不會看起來很亂，而且很死闆了，我來為大家科普一下關于頭發拉直太死闆怎麼辦?下面希望有你要的答案，我們一起來看看吧!頭發拉直太死闆怎麼... 2022-06-28
生活怎麼設置微信主題皮膚
怎麼設置微信主題皮膚?首先點擊打開手機上的微信APP點擊頁面底部的我的圖标，接下來我們就來聊聊關于怎麼設置微信主題皮膚?以下内容大家不妨參考一二希望能幫到您!怎麼設置微信主題皮膚首先點擊打開手機上的微信APP。點擊頁面底部的我的圖标。随後點... 2022-07-20
生活下水管有壓力下水慢
衛生間的管道負責排放我們洗澡室的污水、洗衣的髒水和洗澡時身上脫落的髒東西，廚房的管道負責着我們日常洗菜、清洗水果和我們吃飯之後的廚餘垃圾。一開始的時候，我們家裡的管道下水速度都是非常快的，能夠輕松的把髒東西排出去，但是時間久了，家裡的管道下... 2023-01-04
生活香雪蘭澆水的正确方法和技巧
香雪蘭澆水的正确方法和技巧?定植澆水：剛栽種下去的時候，要一次澆透，淋水後擺放在陰涼處等待出苗，出苗前保持香雪蘭盆土濕潤即可，一般十五天就能出苗了，今天小編就來說說關于香雪蘭澆水的正确方法和技巧?下面更多詳細答案一起來看看吧!香雪蘭澆水的正... 2022-06-17
生活吃餃子會血糖升高嗎
吃餃子會血糖升高嗎?吃餃子後血糖會升高糖尿病人應該嚴格注意自己的飲食，每餐吃得量一定要控制，還有就是少吃白面，餃子裡面當然是白面了，而且願意吃，就不自覺吃多了吧我建議糖尿病人一定要按照醫生的指導，嚴格要求自己，在量上，食物種類上控制好，注意... 2022-06-05
生活南懷瑾關于如何治療白發
南懷瑾關于如何治療白發?聊今天的話題之前我先一起來看看染發的曆史，今天小編就來聊一聊關于南懷瑾關于如何治療白發?接下來我們就一起去研究一下吧!南懷瑾關于如何治療白發聊今天的話題之前我先一起來看看染發的曆史古埃及的法老陵墓出土的最古老的文獻和... 2022-10-18
生活清炖鲢魚怎麼做
清炖鲢魚怎麼做?食材：鲢魚（花鲢）、蔥、姜、蒜、香菜、料酒、醋、鹽、花椒，下面我們就來說一說關于清炖鲢魚怎麼做?我們一起去了解并探讨一下這個問題吧!清炖鲢魚怎麼做食材：鲢魚（花鲢）、蔥、姜、蒜、香菜、料酒、醋、鹽、花椒。做法：鲢魚清洗幹淨，... 2022-06-13
生活李誕最想活的樣子
“結婚為什麼要放爆竹啊？”“想必是給自己壯膽吧。”這是李誕寫的其中一個段子。大衆熟悉李誕大概是因為2013年一檔叫《今晚80後脫口秀》的節目。作為節目策劃、常駐嘉賓以及王自健口中“沒有眼睛的好友”蛋蛋，李誕經常被吐槽頭發比人紅。然而随着20... 2022-10-22
生活 christmasday你是如何過聖...
HowDoYouCelebrateChristmas?你是怎樣慶祝聖誕節的？原創内容不易，我還有很多不足之處，請您多多鼓勵支持。也歡迎您微信關注有聲英文公衆号WendyEnglishTimes,免費收聽往期新聞，體育及娛樂内容。原文鍊接：H... 2022-11-08
生活别克君越藍牙連接後沒聲怎麼辦?
别克君越藍牙連接後沒聲怎麼辦?第一種情況：手機的通話音量沒有打開，解決辦法是：試撥一個電話号碼，在撥号或通話狀态下，按機身側邊的音量上鍵，即可調大聲音，今天小編就來聊一聊關于别克君越藍牙連接後沒聲怎麼辦?接下來我們就一起去研究一下吧!别克君... 2022-07-06
生活神舟筆記本是不是獨顯
雖然六月才剛剛到來，各大廠商早已按耐不住一顆激動的心，因為六月不但将要迎來“618”狂歡購物節，也正是暑假、畢業季的到來之日。尤其對于筆電廠商來說就是天賜良機，所以各種降價、特價搶購、好評返現等促銷活動鋪天蓋地的襲來，一場筆電消費者争奪戰已... 2023-01-19
生活台風暹芭或将登陸華南
今年第3号台風“暹芭”步步逼近，7月2日将登陸華南，将成為今年登陸我國的首個台風。“暹芭”帶雨能力極強，局地可能出現極端降水，為此中國氣象局已啟動台風三級應急響應。“暹芭”風雨影響将持續多久？帶雨能力為何如此強？1中央氣象台繼續發布台風橙色... 2022-11-08
生活手工制作小雞教程圖解
1、微笑咯咯雞新年放一隻微笑咯咯雞在家裡，喜迎親朋好友，開門即有笑臉相迎。準備材料：用黃色、紅色卡紙剪出圖中形狀，備用。制作步驟：1、黃色氣球吹滿氣，再粘上黃色卡紙做的翅膀和雞冠。2、黃色卡紙剪一些長條，用鉛筆卷一卷，做出彎曲的形狀。3、最... 2022-11-05
生活宇宙航天知識網絡圖
【文/觀察者網李麗】9月28日，或成為美史上造成經濟損失第六高的飓風“伊恩”登陸美國佛羅裡達州，風速接近150英裡/小時，“伊恩”所到之處一片狼藉。而在“伊恩”登陸佛羅裡達州之前，已有“飓風獵人”靠近，甚至直接穿過飓風風眼，為美國家飓風中心... 2022-11-18
生活 dnf魔劍阿波菲斯的屬性
dnf魔劍阿波菲斯的屬性?無聊翻出來以前DNF老圖片，有沒有和我一起緬懷過去匆匆歲月裡的遊戲老友，下面我們就來說一說關于dnf魔劍阿波菲斯的屬性?我們一起去了解并探讨一下這個問題吧!dnf魔劍阿波菲斯的屬性無聊翻出來以前DNF老圖片，有沒有... 2022-10-16
生活 10句有關秋思的詩句
秋天是一個思念的季節。夜晚時，擡頭仰望秋月，會思念遠方的親人。白天時，看黃葉片片飛落，感慨聚散，思念愛人。思念是一件極美的事，特别是在秋日。詩詞君分享8首豪邁的秋日詩詞，一是誰的思念，唯美了整個秋。丈夫之思浪淘沙·夜雨做成秋清·納蘭性德夜雨... 2022-11-08
生活兔子可以吃黃心菜嗎?
兔子可以吃黃心菜嗎?兔子可以吃黃心菜，黃心菜營養豐富，很适合食草類動物食用，我來為大家講解一下關于兔子可以吃黃心菜嗎?跟着小編一起來看一看吧!兔子可以吃黃心菜嗎兔子可以吃黃心菜，黃心菜營養豐富，很适合食草類動物食用。卷窩菜，又名黃心菜，在信... 2022-06-10
生活怎麼記住一周中的英語單詞
off-duty美['ɔfdjʊti]下了班的Theoff-dutywatchrelaxedunderalanternafterthesquall.狂風過後，下了班的值夜人員在一盞提燈下憩息。, 2022-11-29
生活圓臉适合燙什麼頭發
圓臉适合燙什麼頭發?蛋卷頭中長卷發對于可愛的圓臉女生們，就是要選擇一款适合自己臉型的卷發，這款蛋卷頭設計的中長卷發，是今年好臉型的發型款式，看起來會讓你變得更時髦，更養眼呢，将你的劉海設計成八二分的比例，會弱化你的圓臉輪廓曲線，視覺上是自然... 2022-06-14
生活房屋入門玄關設計
直入式戶型，也就是我們說的“入戶無玄關”，進門直接是客廳、陽台或衛生間↓↓↓下面4種方法可幫你解決這個問題。1.加隔斷将隔斷設計在門對面，擋住别人的視線，開門時，陌生人就不會直接看到室内景象，保護隐私。考慮到有些房型玄關的采光比較差，建議選... 2022-11-13
生活怎麼去青春痘的痘印
怎麼去青春痘的痘印?痘痘消退或者愈合以後，往往會在皮膚上出現一個印記，也叫痘印痘印表現為局部皮膚的顔色變深，也可以表現為局部紅斑出現痘印以後，處理方法如下：，接下來我們就來聊聊關于怎麼去青春痘的痘印?以下内容大家不妨參考一二希望能幫到您!怎... 2022-07-12
生活滬渝蓉高鐵規劃線路走向
時速400公裡！滬渝蓉高鐵重慶至成都段（成渝中線高鐵）環評報批稿公示，詳細建設方案出爐鐵路建設規劃消息：8月9日，《新建成渝中線鐵路（含十陵南站）拟報批的環境影響報告書全文和公衆參與說明公開》在沿線各地政府網站發布。項目初步設計已基本完成，... 2023-01-03
生活包紅薯肉粽的方法
包紅薯肉粽的方法?準備糯米360g、紅豆120g、紅薯600g、白糖120g、粽葉30片、棉繩若幹紅豆提前一晚泡發，我來為大家科普一下關于包紅薯肉粽的方法?以下内容希望對你有幫助!包紅薯肉粽的方法準備糯米360g、紅豆120g、紅薯600g... 2022-05-31
生活城南舊事驢打滾兒的主要内容
城南舊事驢打滾兒的主要内容?主要内容：宋媽的丈夫，一個好吃懶做的賭徒，宋媽生下一雙兒女後，就去了林英子家做奶媽了，他丈夫把她的女兒給送人了，兒子據說是掉到河裡淹死了過了好幾年，宋媽才知道，之前宋媽還在一直給她的兒子——小栓子做新衣服，新鞋子... 2022-06-21
生活三原色與三間色是什麼顔色
撰文|矩陣菌◈配圖|柯雪妹今天下午，柯雪妹的美術老師和我的物理老師在學校操場上打起來了，原因是物理老師說三原色是紅綠藍，美術老師則堅持認為三原色是紅黃藍。兩人争得不可開交，直到兩支畫筆"咻咻"兩下插進了物理老師的鼻孔之後，他... 2022-11-13

tft每日頭條

> 生活

> pca主成分分析總得分

pca主成分分析總得分

相关生活资讯推荐

热门生活资讯推荐

网友关注