如何看懂降維打擊-tft每日頭條

如何看懂降維打擊

科技更新时间:2026-03-07 20:13:30

1.優化失敗的原因

如何看懂降維打擊（升維的降維打擊）1

圖1 訓練參數的常見情況

在上一節(“山外有山比山高”-為什麼叫深度學習？)中，讨論了如何通過梯度下降方法訓練深度學習模型。随着參數訓練更新次數的增加，可能會遇到兩種常見的失敗情況：第一種，損失函數随着更新次數的增加呈現出平穩的狀态，并沒有非常明顯的下降趨勢；第二種，損失函數的數值雖然在下降，但是在某次更新後不再繼續下降，且損失函數數值并沒有很小。

這兩種情況發生的原因通常是梯度為0或很小，導緻參數不再更新或變化不大。在高等數學中，将這種梯度為0的情況稱為駐點（Critical Point）。根據損失函數的不同，又可以将駐點細分為局部極小點（Local Minima）、局部極大點（Local Maxima）和鞍點（Saddle Point）。

局部極小點意為在一定範圍内，所有的函數值都比該點的函數值大；局部極大點意為在一定範圍内，所有函數值都比該點函數值小。從二維函數的角度來看，鞍點一個方向的截面呈現出局部極小點的情況，另一個方向的截面呈現出局部極大點的情況，形狀如同“馬鞍”狀。

如何看懂降維打擊（升維的降維打擊）2

圖2 鞍點示例

深度學習模型在參數優化的過程中使用的是梯度下降方法，所以當遇到梯度為0的情況下，可以排除局部極大點的情況。當訓練時遇到局部極小點的情況，便無法判斷下一步的更新方向；但遇到鞍點的情況，或許可以判斷下一步的更新方向。因此，區分當前駐點是局部極小點和鞍點對深度學習模型的參數優化具有極大的參考價值。

2.區分局部極小點和鞍點2.1理論分析

根據局部極小點和鞍點的定義，假設在處梯度為0，需要考慮在向量附近的情況。依據泰勒定理可知，在處附近，可以近似将損失函數進行二階展開。

在式中表示為梯度，是一個向量，有,;是一個矩陣，存儲的是二階導數，被稱為Hessian矩陣，因此有。由損失函數的二階泰勒展開式可知，損失函數在附近的值和梯度的Hessian矩陣有關。

由于為駐點，因此為0，原式轉化為公式（2）。

因此的駐點類型是局部極小點還是鞍點取決于帶有Hessian矩陣的最後一項。

将記為,最後一項則記為。假設對于任意的向量，有大于0，此時大于，因此的類型為局部極小點；假設對于任意的向量，有小于0，此時小于，因此的類型為局部極大點；若對于任意的向量，有正有負，此時的類型為鞍點。

依據線性代數的矩陣理論對于任意的向量，大于0，可認為為正定矩陣（Positive Definite），此時矩陣的所有特征值（Eigen Value）均大于0；對于任意的向量，小于0，可認為為負定矩陣（Negative Definite），此時矩陣的所有特征值（Eigen Value）均小于0;對于任意的向量，有正有負，此時矩陣的所有特征值（Eigen Value）也有正有負。綜上，駐點類型的判斷取決于Hessian矩陣，如果Hessian矩陣為正定矩陣，其所有的特征值均大于0，駐點類型為局部極小值；如果Hessian矩陣為負定矩陣，其所有的特征值均小于0，駐點類型為局部極大值；如果Hessian矩陣有正有負，其所有的特征值也有正有負，駐點類型為鞍點。

2.2實例分析

通過一個案例來分析判斷駐點是局部極小點、局部極大點和鞍點的哪一種。假定，機器學習模型為,隻有一筆訓練數據x=1，y=1。該圖繪制出了損失函數随兩個參數和變化的曲面圖。最中間黑色點、左下方一排黑色點和右上方一排黑色點是梯度為0的駐點。圖中由藍至紅的顔色變化，表示損失函數數值逐漸增大，因此易知中心黑色點為鞍點，左下方一排黑色點和右上方一排黑色點是局部極小點。

如何看懂降維打擊（升維的降維打擊）3

圖3 駐點研判分析

可以從數學理論的角度來分析這些駐點的類型。計算該模型的損失函數可得公式（3）

根據上面的理論分析，首先需要求其駐點，分别求損失函數關于w_{1}和w_{2}的偏導數可得公式（4）。

可得駐點為,或。,對應的點即為圖中中心黑色點；對應的點即為左下方一排黑色點和右上方一排黑色點。接下來計算二階偏導數，可得Hessian矩陣見公式（5）。

分别将,和代入Hessian矩陣可得矩陣見公式（6）和公式（7）。

計算式（6）對應的特征值可求得，，因此中間黑色的點為鞍點；計算式（7）對應的特征值可求得公式（8）

由公式（8）可知，和必有一值為0，且和之和大于等于0，因此，左上和右下黑色的點為局部極小點。

3.鞍點的更新方法

在訓練深度模型的過程中，如果參數更新停留在鞍點，從理論上來說，可以找到下一步的更新方向。對公式（2）進一步分析，假設是的特征向量，是特征值且小于0，且和的差距為特征向量。因此，公式（2）的後半部分可寫成。由線性代數理論可得（9）式

由于小于0，因此公式（9）表示，當和的差距為特征向量時即\，。因此，隻需要沿着的方向更新參數，便可以使損失函數下降。

如何看懂降維打擊（升維的降維打擊）4

圖4 鞍點更新的示例

仍以模型為例，取的特征值，易知其中一個特征向量為

因此，如圖所示的黑色箭頭部分即為特征向量的方向，隻需要沿着右上方更新參數，參數會更新至局部極小點。

4.升維的“降維打擊”

如何看懂降維打擊（升維的降維打擊）5

圖5 鞍點和局部極小點比較

在實際訓練的過程中，參數更新遇到鞍點的情況比局部極小點的情況多。以上圖為例，左上方是一個二維參數的損失函數曲線；左下方是一個三維參數的損失函數曲面。左上方的曲線可以看成左下方曲面的二維投影，在二維的時候紅色的駐點為局部極小點，在三維的時候紅色的駐點就成了鞍點。駐點為鞍點仍然有可能是損失函數下降，而駐點為極小點，參數的更新就遇到了瓶頸，無法進一步優化更新。

這表明，當模型維度上升時，駐點為鞍點的概率随着增加了，對比低維度的模型實際上起到了“降維打擊”的作用。登高望遠，站的高度越高，視野就更加開闊了，可選擇的道路和方向就多了。這和荀子“登高而招，臂非加長也，而見者遠；順風而呼，聲非加疾也，而聞者彰。假輿馬者，非利足也，而緻千裡；假舟楫者，非能水也，而絕江河。君子生非異也，善假于物也。”的思維是一緻的。

如何看懂降維打擊（升維的降維打擊）6

圖6 實際訓練的情況

圖中藍色的點表示，訓練一個神經網絡參數更新至駐點時的情況，縱軸表示損失函數的數值，橫軸表示正的正的特征值在所有特征值的比值。如圖所示，由于基本上無法找到一個比值為1的點，因此在實際進行深度學習模型訓練的過程中，遇到的大部分駐點都是鞍點（特征值都有正有負），局部極小點基本上不會出現。

更多學習資料請關注我的微信公衆号白澤圖鑒獲取!!!

如何看懂降維打擊（升維的降維打擊）7

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技 oppo手機的coloros模式
過年回家，是中國的老傳統，無論身在何處，有多忙，過年總是要回家的，随之也帶來一個問題，那就是如何才能為父母購置一份像樣的禮物。OPPOReno3系列就是很好的選擇，強大的視頻超級防抖加上輕薄的機身，更有ColorOS7系統加持，不僅美觀也更... 2023-02-03
科技合并表格如何統一格式
1.文件夾内有多個工作簿，現在我們想要将這些工作簿合并為一個表格。2.打開這三個工作簿3.點擊下圖選項4.單擊【彙總拆分】、【合并多簿】5.勾選全部工作簿6.單擊【确定】7.設置完成，結果如下, 2023-01-17
科技電腦鎖屏休眠怎麼設置
該篇記錄的是關于“電腦怎麼設置鎖屏與休眠時間”的相關内容，歡迎查閱！我們在不使用電腦後一段時間，電腦會自動關閉顯示器以及進入休眠狀态，也就是電腦關閉屏幕停止工作的狀态，這樣的休眠狀态下下載等任務是不工作的，需要人為移動鼠标或者按一下鍵盤才能... 2022-11-14
科技可視化數據分析什麼時候起步的
在廣泛的數據應用社區的日常用語中，數據分析和數據可視化這兩個術語似乎已成為同義詞。許多招聘廣告關注的是數據可視化技能，而不一定具體說明數據分析技能的重要性。其實整個行業的職稱已經顯示了這一趨勢，「數據藝術家」、「數據可視化專家」和「數據說書... 2022-12-05
科技哪些導航軟件帶hud
以高德地圖為例：打開地圖，輸入目的地，→點擊導航→點擊右下角更多向下劃動，AR導航功能再向下劃動，HUD，預警導航點擊HUD，點擊右下角投影。打開預警功能，各種障礙有提示。用法不知是不是疊加，自己才知道這個功能。點擊導航。分享給大家。, 2022-12-26
科技複制粘貼快捷鍵ctrl加c不能複制
在使用電腦的過程中複制粘貼是經常用到的。很多人都知道CtrlC複制，CtrlV粘貼。速度很快。但是其實對文件或是文件夾還有一種更快的複制粘貼方法。那就是按住Ctrl鍵，拖動文件再松開松标，就可以快速複制了。看圖中，按住Ctrl鍵然後拖動te... 2022-12-21
科技可以修複視力的軟件
愛護眼睛，預防近視，從今天開始，從點滴做起，讓人人享有看見的權利。全國愛眼日就要到了，你還在用電子産品折磨你的眼睛嗎？電腦傷害了我們的眼，就讓軟件來彌補吧！小知識：全國愛眼日的由來全國愛眼日是在1992年9月25日，由天津醫科大學眼科教授王... 2023-01-13
科技恢複抖音删除的
抖音發布的視頻可以通過作品中的删除功能來删除，删除的渠道有兩種：1、手機端；2、網頁。怎麼删除1、手機端使用手機抖音删除發布的視頻是最常用的方式，具體的操作步驟如下：①在抖音首頁，點擊右下角我選項。②在我頁面的作品選項下，打開要删除的視頻。... 2023-02-27
科技蘋果手機有錄屏功能嗎怎麼用
蘋果每次的系統升級都有些更人性化的小功能，今天我們主要說的是錄屏！ios11新增的錄屏功能使得根本不用額外下載App即可實現錄屏。我們先看下蘋果手機自帶的錄屏效果如何？那麼要如何設置呢？其中操作非常簡單，三步就能搞定！1、首先需要到設置中将... 2022-11-24
科技電腦小白自己組裝電腦真的好嗎
現在估計自己攢電腦的人已經很少了吧，不是一部智能手機搞定上網需求，就是買一個筆記本或平闆電腦就好了，不像十幾年前大家也沒什麼好玩的，攢電腦就是一個很不錯的事情，既學習了電腦軟硬件知識，還為自己省了不少錢。我有一部自己十幾年前攢的台式機，還有... 2022-11-24
科技 csgo服務器指令
csgo服務器指令?mp_restartgame1：1秒後刷新遊戲mp_autoteambalance0/1：是否打開自動平衡，現在小編就來說說關于csgo服務器指令?下面内容希望能幫助到你，我們來一起看看吧!csgo服務器指令mp_res... 2022-06-20
科技如何随身攜帶身份證
身份證大家都很熟悉，但公安部的電子身份證可能很多人就不知道了。電子身份證，顧名思義，它是一種公安部發放的電子化的标識用戶身份的證件。公安部給他的定義是，以密碼科技為基礎，以智能安全芯片為載體，由公安部公民網絡身份識别系統。簽發給公民的網絡電... 2022-12-15
科技麥吉麗精華和什麼搭配
都知道抗老的重要性，但不知道該從何入手？麥吉麗針對肌膚松弛下垂，細紋幹紋，暗沉粗糙，脆弱緊繃的肌膚狀态，推出了蘊含雙重黑科技的麥吉麗精華——麥吉麗逆時光精華乳，為肌膚注入至臻抗老能量，卓效緊緻提升，重煥年輕光彩。麥吉麗逆時光精華乳是做成乳液... 2023-02-24
科技 cdr能做哪些内容
cdr能做哪些内容?CDR連夜開閘，企業、投行以及投資者都躍躍欲試但是，CDR是一個創新産品，且目前尚有許多細則沒有明确，投資者還需謹慎看待，下面我們就來說一說關于cdr能做哪些内容?我們一起去了解并探讨一下這個問題吧!cdr能做哪些内容C... 2022-11-30
科技怎麼批量提取文件夾的文件名
1.在文件夾裡新建一個文本文檔2.打開文本文檔，輸入代碼DIR*.*/B>LIST.TXT後保存退出。3.更改文件擴展名為.bat4.雙擊該文檔運行後，文件夾裡會出現另一個文檔。打開文檔，所有的文件夾名稱都被提取了。, 2023-03-15
科技怎麼查看文件的後綴名
在平時工作中，我們經常會使用到文件。比如在工作中，會使用到各種文件，這些都是以文件後綴名顯示出來的。但是在平時需要查閱文件時，我們就會發現并沒有顯示出文件後綴名，那麼怎麼顯示文件後綴名？今天就給大家分享幾個快速有效的方法，可以很好的幫助我們... 2023-01-07
科技手機被細菌污染有什麼好的辦法
其實我們每天接觸的手機表面藏有大量細菌，這些細菌可能會讓你或别人生病。你可以用肥皂和水迅速給手機消毒。如果特别擔心感染細菌或病毒，可以使用酒精來殺毒，酒精是最有效的殺菌劑。但是酒精會逐漸損壞手機屏幕，所以不能經常使用。今天就教大家用兩種方式... 2023-02-04
科技谷歌服務中斷事件
中新經緯客戶端12月15日電據華爾街日報中文網15日消息，當地時間周一，谷歌發言人回應谷歌宕機問題稱，工程師們追蹤到問題出在内部服務器上。當地時間周一包括Gmail和YouTube在内的十多項谷歌服務周一離線大約一個小時。再次凸顯出人們在新... 2022-10-21
科技電腦怎麼下載拼多多
電腦怎麼下載拼多多?自帶軟件商店中下載：桌面找到軟件商店；在軟件商店首頁，可以直接搜索框搜索下載軟件，或者點擊屏幕的軟件或者遊戲分類，查找下載，下面我們就來說一說關于電腦怎麼下載拼多多?我們一起去了解并探讨一下這個問題吧!電腦怎麼下載拼多多... 2022-06-07
科技小學生上網查分
随着在線開放教育的發展,各類網絡教育平台湧現,在促進教育資源共享的同時,一些教育APP同質化嚴重,并且慢慢浸入到中小學考試的查分、試卷分析等領域。當學校購買該類教育平台的網絡閱卷功能時,學生的相關數據會留存,一些平台借助一定的技術手段對學生... 2023-02-06
科技大型辦公碎紙機工廠
在公司辦公的時候，經常會有一些重要的文件，如果不及時處理，很容易造成公司的損失。因此，為了避免這樣的情況發生，很多人都會選擇購置一台碎紙機，它擁有強勁的碎紙效果，能夠快速的粉碎各種紙張，為你營造一個安全的辦公環境。随着社會的發展，碎紙機已經... 2022-11-29
科技酷比魔方二合一平闆評測
“這個月流量用不完”，随着移動網絡不斷的普及，現在手機卡的流量已不再是平闆用戶糾結的問題了。因此雙卡雙待平闆電腦開始慢慢成為大家消耗流量的主要娛樂設備，無論是上網吃雞，還是下載追劇，平闆電腦在很多場景下無疑都是最佳的選擇。主打性價比的國産平... 2023-03-15
科技樓宇自控系統工作原理
衆所周知，樓宇自控是一套将暖通空調、給排水、供配電、電梯、供熱、照明等衆多分散設備的運行、安全狀況、能源使用狀況及節能管理實行集中監視、管理和分散控制的控制系統。可見，樓宇自控BA系統包括了衆多分散的子系統。樓宇自控系統使各個智能建築子系統... 2022-10-25
科技電腦藍屏所有代碼的解決方法
所謂“藍屏”故障，是指計算機執行的指令代碼發生錯誤或計算機程序發生紊亂引起了災難性的錯誤、或者由于計算機的内部條件阻止了系統繼續運行、或者計算機無法從一個系統錯誤中恢複過來時，為保護系統和數據文件不被進一步破壞，操作系統強行終止系統運行的一... 2022-11-13
科技蘋果電腦使用移動硬盤技巧
在工作學習中，我們都繞不開用移動硬盤來拷貝存儲一些文件。但在使用過程中，有的朋友會遇到“Mac找不到移動硬盤”“蘋果電腦怎麼打開移動硬盤？”等問題。例如下面兩種情況：别着急，赤友軟件就将從這兩種情形出發，為大家介紹“Mac電腦怎麼打開移動硬... 2022-11-11
科技 dnf手遊一直顯示檢查服務器
DNF可以說是承載了我們許多90後的青春與回憶，這次上線的DNf手遊版一定可玩性更高，如果玩家們更喜歡電腦端操作的話，也可以嘗試一下同時上線的DNF手遊PC版。如果你在遊玩的過程中出現DNF手遊服務器進不去\服務器崩潰的現象，可以嘗試這幾個... 2022-12-11
科技華為mate30pro和紅米k40比...
華為mate30pro和紅米k40比較?今天小編為大家帶來最新的紅米k30pro和華為mate40的參數對比，那麼這兩款手機在參數上有什麼區别？不同之處在哪？哪款手機更值得入手？小編為大家帶來最新的手機測評，快來看看吧，今天小編就來聊一聊關... 2022-10-04
科技 thinkplus65w二代充電頭評...
紅色物品為thinkplus随身充50W筆記本移動電源在去年年末的時候，thinkplus終于上架了自家的大容量筆記本移動電源，thinkplus随身充50W,代号NB45.在大容量筆記本移動電源中，thinkplus随身充擁有較小的體積和... 2023-02-16
科技什麼手機有紅外線功能可以開空調
什麼手機有紅外線功能可以開空調?手機上的紅外線，有些手機上是沒有紅外線的；最簡單的方法是查看手機頂端沒有像攝像頭一樣的發射器，具體如下：，接下來我們就來聊聊關于什麼手機有紅外線功能可以開空調?以下内容大家不妨參考一二希望能幫到您!什麼手機有... 2022-10-16
科技外貿企業郵箱注冊
如今，越來越多的外貿公司都會注冊一個TOM企業郵箱用來和國外客戶溝通，為什麼個人郵箱用的越來越少了呢？做外貿企業郵箱重要嗎？事實上，企業郵箱對于外貿公司來說，确實非常重要，除了和國外客戶交流溝通、傳遞公司資料、辦理業務等等，都離不開企業郵箱... 2022-10-27

tft每日頭條

> 科技

> 如何看懂降維打擊

如何看懂降維打擊

相关科技资讯推荐

热门科技资讯推荐

网友关注