pca算法進行降維的過程是什麼-tft每日頭條

pca算法進行降維的過程是什麼

科技更新时间:2025-08-22 03:51:28

在科研、工程應用、生活中，我們所獲取的數據往往包含着很多冗餘信息，這些冗餘信息往往對數據分析造成幹擾，增加數據分析的複雜度。此時我們則需要對這些數據進行預處理，預處理的原則是：既能抓住其主要特征，又能剔除冗餘信息，從而減少數據量。PCA降維就是這樣的一種數據預處理算法。

本文首先講解PCA降維的計算原理，再使用C 與Opencv來實現該算法，并與Opencv現有的PCA函數接口進行降維結果的對比。看到這裡，可能有人會問，Opencv都有現成的函數可以調用了，為什麼還要自己去寫呢？我想說的是，對于學習者來說，重複造輪子并不是壞事，它可以讓我們更加深刻地理解造輪子的過程，從而才有改進和創新的機會，相反，如果隻是使用别人造好的輪子，不深刻理解其構造原理，壓根就沒有改進創新的空間了。

1. 計算原理

假設有m行n列的數據，計為矩陣X0，其每一行數據看作一個一維行向量，那麼該數據本來有m個一維行向量，我們要使用PCA降維算法把其降為k個一維行向量(k < m)，計算過程如下：

(1) 求出每行數據的平均值。

(2) 去平均處理，把每行數據都減去本行數據的平均值。

(3) 去平均處理之後，同樣得到m行n列的數據，計為矩陣X1。

(4) 按以下公式計算X0的協方差矩陣，其中“*”表示矩陣乘法，得到的協方差矩陣Cov為m行m列矩陣：

pca算法進行降維的過程是什麼（PCA降維的計算原理與應用）1

(5) 計算協方差矩陣Cov的特征值與對應的特征向量。得到m個特征值，對應m個特征向量，其中每個特征向量的長度又為m，也即所有特征向量組成m行m列的矩陣。

(6) 将特征值按照從大到小排列，并根據排列後特征值的順序來按行從上到下排列特征向量(每個特征向量為一行)，使特征值與特征向量仍保持對應。

比如本來特征值依次為a1，a2，a3，a4，a5，對應的特征向量為：

排序之後，a3>a1>a4>a5>a2，那麼特征向量的順序也作對應的調整：

此時計特征向量組成的矩陣為V。

(7) 取矩陣V的前k行數據，得到k行m列的矩陣P，計算Y=P*X1，Y矩陣即為最終得到的k行n列的降維數據，從而實現把數據從m維降為n維。

上代碼：

voiddo_PCA(Matsrc,Mat&pca,intk) { if (src.rows <= 1 || src.cols <= 1) { return; } k = k > src.rows ? src.rows : k; Mat src_float; src.convertTo(src_float,CV_32F); //求每行的平均值 Mat col_mean = Mat::zeros(1, src.rows, CV_32FC1); float *col_mean_p = col_mean.ptr<float>(0); for (int i = 0; i < src_float.rows; i ) { float *p = src_float.ptr<float>(i); for (int j = 0; j < src_float.cols; j ) { col_mean_p[i] = p[j]; } } col_mean /= src_float.cols; //去平均值 for (int i = 0; i < src_float.rows; i ) { float *p = src_float.ptr<float>(i); for (int j = 0; j < src_float.cols; j ) { p[j] = p[j] - col_mean_p[i]; } } //計算協方差矩陣 Mat X = src_float*src_float.t(); X = X / src_float.cols; Mat eValuesMat, eVectorsMat; //調用opencv接口計算特征值與特征向量 eigen(X,eValuesMat,eVectorsMat);//這裡得到的特征值已經按照從大到小排序了，特征向量也與特征值相對應 Mat Vectors_k; eVectorsMat(Rect(0,0,eVectorsMat.cols,k)).copyTo(Vectors_k);//取特征向量的前k行,k*r pca=Vectors_k*src_float;//k*r*r*c=k*c pca=pca.clone();//确保矩陣連續，拷貝一份 printf("pca.rows=%d,pca.cols=%d\n",pca.rows,pca.cols); }

測試代碼：

void pca_test(void) { Matimg=imread("lena.jpg",CV_LOAD_IMAGE_GRAYSCALE); intk=100;//從圖像原有的m行降為100行，列不變 Matpca_m; do_PCA(img,pca_m,k); imshow("原圖", img); imshow("本文實現算法 PCA降維後", pca_m); //使用Opencv的PCA函數接口 PCApca(img,Mat(),CV_PCA_DATA_AS_COL,k); Matdst=pca.project(img);//dst則為最終降維數據 imshow("Opencv PCA降維後",dst); waitKey(0); }

運行上述代碼，得到的結果如下。可以看到，本文實現的算法與Opencv函數的計算結果是一緻的，說明我們的計算過程沒錯，鼓掌~再接再厲~

pca算法進行降維的過程是什麼（PCA降維的計算原理與應用）2

原圖

pca算法進行降維的過程是什麼（PCA降維的計算原理與應用）3

本文實現的PCA算法的降維結果

pca算法進行降維的過程是什麼（PCA降維的計算原理與應用）4

Opencv現有的PCA算法的降維結果

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技微信狀态視頻怎麼設置
微信狀态視頻怎麼設置?首先打開微信的“我”界面，點擊“狀态”，現在小編就來說說關于微信狀态視頻怎麼設置?下面内容希望能幫助到你，我們來一起看看吧!微信狀态視頻怎麼設置首先打開微信的“我”界面，點擊“狀态”。選擇一個你現在的狀态。點擊界面左下... 2022-07-11
科技 win7設置關閉程序時的聲音
很多用戶都有一邊聽音樂一邊上網的習慣，這樣有聲音的網頁就會幹擾到用戶聽音樂，下面我們就來看看win7系統關閉網頁聲音步驟。1、點擊音量圖标，選擇“合成器”，進入後将網頁聲音調整到無聲，如圖所示：2、點擊“開始菜單-控制面闆-網絡和Inter... 2023-01-20
科技霍尼韋爾空氣淨化器新款
生活在大都市中的我們，不單單是要承受着來自工作，學習上的壓力，同時還要忍受周邊越來越差的環境污染。特别是在北上廣的奮鬥一族，無論做一份什麼的樣的工作，無論事業上取得多麼大的成就，都要面臨一個非常嚴峻的問題，那就是來自霧霾的困擾。好在現在的科... 2023-01-25
科技 6g運存能用幾年
6g運存能用幾年?6G運存的手機三年起沒問題，不玩遊戲的話更沒問題了當然要抛開手機本身硬件的損壞來說，下面我們就來說一說關于6g運存能用幾年?我們一起去了解并探讨一下這個問題吧!6g運存能用幾年6G運存的手機三年起沒問題，不玩遊戲的話更沒問... 2022-06-11
科技 Surface如何進行系統恢複
2015-01-2905:53:00作者：周博林Windows系統運行時間久了，由于安裝和卸載各種軟件程序不徹底，多多少少都會遇到一些不兼容或者系統異常問題，有時候我們強行重新啟動後，大部分問題操作系統可以完成自動修複。但有時候我們也會遇到... 2022-11-24
科技 foxmail郵箱哪家公司用
現在很多外企或者國企都比較喜歡通過郵件來往确認重要的事情，那麼選擇一款自己喜歡并且功能強大的郵箱客戶端軟件是多麼重要的一件事情。國内常用的主要是Foxmail和DreamMail,那麼他們的性能和功能到底如何呢？？？收藏并關注，就請接着看下... 2023-01-25
科技樂視手機無線投屏
上次給大家分享了樂視手機用MHL轉HDMI線連接電視看樂次元影視的竅門，但是，此方法不足之外，一是要求手機電量充足，二是每次觀看都要插拔線纜，時間久了會出現手機插口接觸不良，電視無顯示的現象。為此，經過實踐摸索，終于找到一個不用任何轉換線，... 2022-12-31
科技暖通空調系統設置
制冷原理吸收式制冷原理圖渦旋式制冷系統原理圖逆卡諾循環跨臨界循環三個單級壓縮循環組成的複疊式制冷循環系統一級節流、中間不完全冷卻的兩級壓縮機循環氦氣制冷的氫液化系統再冷卻蒸汽壓縮式暖通空調系統冷水機組系統風冷系統熱泵式壁挂空調機地（水）源熱... 2023-01-11
科技手機開啟私密空間
生活中我們總是會有一些東西，不想給别人看但又沒有很好的保護辦法今天來就大家一招小米手機開啟私密空間，完美解決1首先打開手機文件管理2長按屏幕下滑三秒3進入私密文件夾(設置密碼)這樣我們就可以添加私密文件你們都學會了嗎？歡迎大家點贊評論加轉發... 2022-12-13
科技暴汗服可以幫助減肥嗎
辟謠|“暴汗服”是新型減肥黑科技？當心受騙！來源：光明網, 2023-01-04
科技當天辦理進京證都需要準備啥
之前我們說進京證就可以手機線上辦理！很多人都問小編如何下載使用APP呢？那今天，北京交管部門正式推出了一個叫“北京交警”APP（首期）上線試運行，小編就給您介紹介紹！今後，大家可通過“北京交警”APP（首期）實現事故e處理、交通違法查詢、交... 2022-11-05
科技營銷型網站建設建站模闆
對于每一家企業來說，企業網站都很重要，網站能把企業的産品和服務與網絡社區緊密連接起來，展示給潛在的用戶，讓更多的用戶了解。現在許多企業都在建站，那麼提前了解企業網站建設的基本流程會讓建站過程更加順利，今天小編就給大家介紹一下企業網站建設的基... 2022-10-26
科技工業産品價格變化
我們身邊整體的物價水平一直處在一個波動上漲的趨勢中。曾經的5毛錢可以花好幾天，買好多好吃的，現在一個大白饅頭都要5毛錢！我們國家統計局也一直在跟蹤統計物價的變動情況，我從國家統計局的數據庫中提取了近20年的數據，可以明顯地看到物價一直處于上... 2022-10-27
科技 iqooneo 3技巧
随着移動互聯網的不斷發展和5G的全面普及，在手機上看視頻已經成為了人們日常手機娛樂的一部分。雖說現在高清視頻資源已經日漸普及，但是還是有一些視頻因為傳播或者是年代的原因導緻其清晰度比較低。最高分辨率隻有480P的在線視頻因此，我們在使用手機... 2023-02-13
科技榮耀脫離華為你還會買嗎
自去年11月，榮耀脫離華為後，這半年的時間榮耀的路并不好走。因為離開了華為這座靠山，網友們紛紛不看好其後面發展。尤其是在脫離後不久，發布了榮耀V40系列，更是讓網友大失所望。因為某些原因，榮耀脫離後無法使用麒麟芯片，于是在推出的榮耀V40系... 2023-01-18
科技外賣員未來發展趨勢
11月企業用人需求報告：外賣小哥需求量最大，計算機軟件業就業競争壓力最大聲明：轉載此文是出于傳遞更多信息之目的。若有來源标注錯誤或侵犯了您的合法權益，請作者持權屬證明與本網聯系，我們将及時更正、删除，謝謝。來源：電商報, 2023-03-26
科技團購達人怎麼開通才算成功
一、視頻号怎麼開通團購？視頻号開通團購是需要到創作者服務中心操作的，隻要點擊頁面進入後台當中就能點擊開通團購這個功能來進行操作，按照頁面當中給出的要求來綁定手機号、提交相關資質就能等待審核結果，但要注意特殊類目想要開通團購沒有解決報白問題是... 2023-02-13
科技安卓新的操作系統
10月18日消息，據phonearena報道,微軟在解釋為什麼SurfaceDuo使用的是安卓時說道：安卓是目前最好的移動操作系統。在微軟舉行的2019年度秋季新品發布會中，其傳聞已久的新品“SurfaceDuo”沒有運行新的Windows... 2023-01-03
科技紅米手機最新技巧
紅米手機在國内的知名度是比較高的，這就說明紅米手機是比較好用的，下面給大家分享6個隐藏極深的紅米手機技巧，竟然這麼實用。1、隐藏關鍵應用手機上多少都有一些不想讓别人看到的應用，這時你就可以打開隐藏應用功能，在設置裡面搜索隐藏應用，就可以了。... 2023-01-02
科技固态硬盤各種接口怎麼區分
固态硬盤買什麼接口比較好？這個問題要回答的一清二楚還頗費周折。不過為了讓大家在選擇接口時都能做到胸有成竹，今天決定認真科普一下。市場上的固态硬盤簡單來說共有SATA、PCIE、M.2和U.2四種接口類型。具體到協議上來說又能分為上層協議和傳... 2023-01-11
科技電腦異常關機藍屏原因
你是否曾遇到無法正常關閉計算機的情況，并且在計算機關閉時出現藍屏。小白也有這種問題。在小白不斷尋找信息并在長期患病後成為醫生之後，逐漸了解了問題所在。有些朋友和小白有同樣的問題。小白将在此處整理信息并将解決方案分享給所有人。1.可以考慮最近... 2022-11-29
科技迷你膠帶評測
每次想在牆上貼上自己喜歡的海報和裝飾品都糾結再三既不想破壞牆面又不希望釘子破壞裝飾品還有的一些粘鈎貼上去一時爽，揭下來的時候……牆上像是多了一塊“狗皮膏藥”分分鐘逼死強迫症為了擺脫以上種種問題澳大利亞一家公司在美國Kickstarter衆籌... 2022-11-08
科技累的不想打遊戲怎麼辦
每天什麼都不想做，隻想躺着呆着耍手機，打遊戲，該怎麼辦？耐心看完接下來我說的這些可能會戳中你内心比較隐秘柔軟的地方，可能會引起适度不适，但堅持聽完相信你會有巨大收獲，為什麼現在這麼多人時間都被手機綁架？甚至感覺精力都被掏空了，我花了很久去琢... 2022-12-05
科技電腦i5和i7有什麼區别
電腦i5和i7有什麼區别?超線程超線程意味着每個處理器核心可以處理兩個線程而不是一個，在運行Windows系統及一些兼容軟件時擁有更出色的性能表現通常來說，i5處理器不具備超線程功能，而i7則基本支持，在進行照片、視頻編輯操作時擁有更好的效... 2022-07-16
科技數據圖表分析圖解
編輯導語：在進行數據分析之前，需要先進行一些階段性的準備工作，先拆解好指标，再進行後續做功能與打點取數。作者從怎麼分析數據結果、怎麼作出直觀的圖表和指标的持續監控分享如何設計打點和實驗。上半部分文章主要圍繞指标，包括選定關鍵指标（主要指标V... 2023-02-06
科技脫糖電飯煲哪個牌子最靠譜
越來越多的人已經意識到糖對身體的危害，以“抗糖”“低糖”“無糖”為噱頭的産品也層出不窮。火爆一時的無糖飲料剛被證實并非完全無糖，脫糖電飯煲又以低糖、低卡、低碳水吸引了一衆減肥人士“入坑”。脫糖電飯煲真的是“黑科技”嗎？食用它蒸出來的米飯真能... 2022-12-28
科技榮耀最新發布手機
2022年的5月第三周（5.16-5.22），榮耀拿下中國智能手機市場19%的市場份額，創曆史新高，從最低谷的3%，到現階段最高的19%，榮耀用了近一年半的時間。榮耀的市場在回升，并攀爬最高峰，消費者對新榮耀的信心也在回歸。其中居功至偉的是... 2023-01-08
科技數據和信息的區别聯系
大數據時代已來臨，你還在傻傻分不清數據和信息嗎？在當前的大數據時代下,抓住有利信息至關重要,而數據就是信息的來源,有時候數據本身就是信息。人們常常将數據信息作為決策的重要依據,“大數據”的“大”就是在信息處理過程中,數據來源非常廣泛,數據信... 2023-02-08
科技 64位系統下安裝教程
南方CASS8.0是一款基于AutoCAD二次開發的測量繪測軟件，同時也是這一系列軟件中最為經典的版本，但很多初次接觸cass8.0的人都不知道怎麼才能安裝破解這款軟件，尤其是現在的電腦多為win764位操作系統。接下來就和大家說一下怎麼在... 2022-12-16
科技王者榮耀新賽季人臉識别系統
王者榮耀中，小學生的數量還是很多的，并且許多小學生的時間都比較充足，作業量也不是很多，所以會有很多的玩耍時間！尤其是一些家長不在家裡的，隻有爺爺奶奶管的小學生，更是嚴重，畢竟許多爺爺奶奶都關心的是孫子/孫女餓不餓，身體好不好罷了，對于手機的... 2023-01-14

tft每日頭條

> 科技

> pca算法進行降維的過程是什麼

pca算法進行降維的過程是什麼

相关科技资讯推荐

热门科技资讯推荐

网友关注