正則化和泛化區别-tft每日頭條

正則化和泛化區别

圖文更新时间:2026-07-21 22:31:43

前言

說到正則化大家應該都不陌生，這個在機器學習和深度學習中都是非常常見的，常用的正則化有L1正則化和L2正則化。提到正則化大家就會想到是它會将權重添加到損失函數計算中來降低模型過拟合的程度。了解更多一點的同學還會說，L1正則化會讓模型的權重參數稀疏化(部分權重的值為0)，L2正則化會讓模型的權重有趨于0的偏好(部分權重趨于0)。

不知道大家有沒有想過為什麼L1正則化會讓部分權重的值為0？為什麼L2正則化會讓權重會有偏向于0？為什麼正則化可以防止過拟合？正則化是究竟是怎麼來的？帶着這些問題，我們來看這片文章，會幫助大家一一解答。

正則化的由來

在介紹正則化之前，我們先來看一張圖

正則化和泛化區别（深入理解正則化）1

正則化效果圖

在上圖中我們繪制了三條不同的曲線y1、y2、y3，從曲線函數值的變化不難看出，y1的函數值變化最大，y2和y3的函數值變化相對來說要平緩一些。通過函數的表達式可以看出，y2相對于y1來說自變量的系數值變小了，y3相對y1來說自變量少了一個，我們可以理解為少的那個自變量的系數為0。

通常如果函數的取值變化的幅度更大，我們會認為函數更複雜，函數的方差更大。所以，上面的三個函數中，函數y1的複雜度最高。通過函數圖像可以發現，降低自變量的系數值，或者減少函數自變量的個數(自變量的系數為0)是可以降低函數複雜度的。

在構建模型之前，我們是不知道數據的分布，如果模型過于簡單就會導緻欠拟合，如果模型過于複雜就會過拟合。通常我們為了模型能夠更好的拟合數據都是使得模型處于過拟合，為了降低模型的過拟合就需要使得模型部分權重為0或者降低模型的權重，所以我們會為損失函數添加一個懲罰項，數學表達式如下

正則化和泛化區别（深入理解正則化）2

帶正則化的目标函數

上式中的J(θ;X,y)表示原目标函數(沒有添加正則化)，Ω(θ)表示模型參數的懲罰項，懲罰項系數α∈[0,∞)，α越大表示正則化懲罰越大。

需要注意：我們在對模型的參數做懲罰的時候，其實隻是添加了模型的權重參數并不包括偏置參數，因為模型的偏置參數數量相對于權重參數數量來說要少的多，而且每個權重參數會指定兩個變量如何相互作用，而偏置隻是控制一個單一的變量，所以我們不對偏置做正則化也不會導緻太大的方差。而且，如果對偏置進行正則化可能會導緻明顯的欠拟合。

上式中的參數θ包含了權重和偏置，而我們隻需要對權重做正則化。所以，L1正則化和L2正則化可以改成如下表達式

正則化和泛化區别（深入理解正則化）3

L1正則化和L2正則化

正則化的影響

在正則化的由來中，我們直觀的介紹了為什麼需要加入正則化？接下來我們來介紹一下為什麼L1正則化會使得模型的部分參數為0，L2正則化會使得模型的參數趨于0。為了更好幫助大家理解和證明，首先通過圖解來進行解釋，然後再通過公式推導證明

直觀理解

為了幫助大家從直觀上理解正則化的效果，接下來我們将通過畫圖來觀察L1正則化和L2正則化的效果
前面我們介紹了正則化其實就是在原目标函數的基礎上多增加了一項參數的懲罰項，目的就是為了不讓網絡的參數過大而導緻模型過拟合，所以我們其實可以将正則化後的目标函數理解為在最小化原目标函數的基礎上多增加了一個參數的約束函數，對于約束函數的要求就是它需要小于某個常數C

正則化和泛化區别（深入理解正則化）4

帶約束的目标函數

L1正則化

我們将L1正則化效果等價于求原目标函數的最小值和對權重參數的約束函數，這裡為了便于作圖我們隻考慮二維情況

正則化和泛化區别（深入理解正則化）5

二維的L1正則化

根據上兩個式子，我們可以繪制出線性規劃圖如下

正則化和泛化區别（深入理解正則化）6

L1正則化

上圖中的藍色橢圓表示的是原目标函數的等高線，紅色矩形表示的是權重的約束函數，圖中的紅色箭頭表示的是約束函數的法向量，其中藍色箭頭表示的是原目标函數在該點的梯度方向(等高線的梯度方向與它的法向量方向一緻)

由于約束函數的限制導緻ω隻能在紅色矩形的邊上進行移動來尋找最佳的ω∗。當ω處于上圖中的位置時，将原目标函數的梯度分解為沿約束函數的切線方向(即矩形的邊)和法線方向，為了使得原目标函數取得最小值此時需要沿着梯度在約束函數的切線方向(左上方)移動。當ω移動到ω′時，通過分解原代價函數的梯度可以發現，為了使得取得原代價函數的最小值應該沿着右上方移動，所以最終最優的ω∗應該為矩形的頂點位置。

通過觀察可以發現此時ω∗在坐标軸ω1方向的取值為0，最優點會落在某些軸上導緻部分權重為0，這也就是為什麼L1正則化會使得部分權重參數稀疏的原因。

L2正則化

同樣，我們按照分析L1正則化的思路進行分析

正則化和泛化區别（深入理解正則化）7

二維的L2正則化

正則化和泛化區别（深入理解正則化）8

L2正則化

上圖中藍色橢圓表示是原目标函數的等高線，紅色圓表示的是權重的約束函數它的半徑是√C，其中藍色箭頭表示的是原目标函數在該點的梯度方向，紅色箭頭表示的是約束函數在該點的法向量，綠色箭頭表示的是約束函數在該點的切線方向。

還是按照上面的思想我們将梯度按切線方向和法線方向進行分解，為了使得原代價函數取得最小值，我們需要将ω按切線方向進行移動，當移動到ω∗時，梯度方向與切線方向垂直時梯度沿切線方向的分量為0，此時原代價函數取得最小值，所以ω∗為最優點。

通過觀察上圖可以發現，此時ω1的取值接近于0，因為最優點會靠近某些軸，導緻部分權重取值接近于0，這也就是為什麼L2正則化會使得部分權重趨于0的原因。

2.公式推導證明

L2正則化

L2正則化也被稱為權重衰減或嶺回歸，在神經網絡中也被經常用到，因為它會使得部分權重向零點靠近(使得部分權重的取值趨于0)。為了更好的觀察L2正則化的影響，接下來我們觀察一下在添加罰項之後，權重參數是如何更新的

正則化和泛化區别（深入理解正則化）9

帶L2正則化目标函數的梯度

使用單步梯度下降更新權重，更新公式如下：

正則化和泛化區别（深入理解正則化）10

L2正則化單步權重更新過程

上式中的，ϵ指的是學習率，α指的是權重衰減系數，這兩個參數通常都是小于1的。
通過單步的權重的梯度更新公式可以發現，權重每次在更新之前都需要乘以一個小于1的系數，相當于每次更新權重的時候都對它做了衰減，在經過多次權重更新之後會，權重的系數會接近于0，最終會導緻權重也接近0，假設權重的系數為0.9，經過100次權重的叠代更新，最終權重系數會變為0.9^100≈2.7∗10−5(注：這裡沒有考慮梯度的大小，隻是簡單表明這種趨勢)。
上面隻是一個單步的權重更新過程，接下來我們推導一下在整個訓練過程中，權重的更新過程，為了簡化分析我們假設ω∗為J(ω)取得最小值時的權重向量，根據泰勒公式

正則化和泛化區别（深入理解正則化）11

泰勒公式

假設J(ω)二階可導，我們對其進行二次近似的泰勒展開則有

正則化和泛化區别（深入理解正則化）12

原目标函數的泰勒展開

為了讓J^(ω)取得最小值，我們令其導數為0，因為J(ω∗)為常數，所以它的導數為0，我們就直接省略了

正則化和泛化區别（深入理解正則化）13

編輯器不支持部分公式就用圖片代替了

上式中的I表示的是單位矩陣，通過上式不難發現，當正則化的懲罰項系數α為0時，此時ω˜的最優解就等于ω∗，接下來我們讨論一下當懲罰項系數不為0的時。因為H是J在ω∗的Hessian矩陣，所以H是一個對稱矩陣，我們可以對其做特征分解，可得H=QΛQT(後面是Q的轉置)，其中Λ為對角矩陣，Q為一組特征向量的标準正交基，代入上式可得

正則化和泛化區别（深入理解正則化）14

L2正則化權重最優解推導

通過上面的式子可以發現，L2正則化的效果就是沿着H矩陣特征向量所定義的軸縮放未正則化J(ω)的解ω∗。因為I是單位矩陣，我們可以将縮放的系數改成這種形式

正則化和泛化區别（深入理解正則化）15

，其中λi指的是矩陣H的特征向量每個軸值的大小，也就是特征分解之後特征值的大小。
通過修改後的衰減系數不難發現，當特征值λi≫α時，此時α的影響可以忽略不計，正則化的縮放系數會趨于1，正則化基本沒有影響。當特征值λi≪α時，可以将縮放系數改為

正則化和泛化區别（深入理解正則化）16

，因為α≫λi所以α/λi≫1，所以縮放系數λi/α≪1，縮放系數趨于0使得權重也會趨于0。

L1正則化

上面我們推導了添加了L2正則化之後對權重的影響，通過最後推導得到式子可以解釋為什麼l2正則化會讓權重趨于0。接下來，我們以類似的方式來推導L1正則化對于權重的影響

正則化和泛化區别（深入理解正則化）17

上式中的sign函數為符号函數，函數圖像如下

正則化和泛化區别（深入理解正則化）18

符号函數(sign)

當函數輸入值x<0時輸出值恒等于-1，輸入值為0時輸出值也等于0，輸入值x>1時輸出值恒等于1，sign函數經常被用來表示階躍函數

我們将J(ω;X,y)使用二階的泰勒展開式來代替，可以将L1正則化後的代價函數轉換為如下形式

正則化和泛化區别（深入理解正則化）19

接下來我們看看如何求解ωi，上式中的J(ω∗)是常數我們不用考慮，主要考慮求和式中的二次項式和絕對值式來使得整個目标函數取得最小值，為了求得後兩項和的最小值，我們對其求導并令求導後的結果等于0來求ωi

正則化和泛化區别（深入理解正則化）20

我們可以将上式中ωi分為兩種情況，第一種是ωi和ω∗同号即sign(ωi)=sign(ωi∗)，第二種是ωi和ω∗異号即sign(ωi)≠sign(ω∗i)，我們先讨論第一種情況，為了幫助大家理解我們可以看看下圖

正則化和泛化區别（深入理解正則化）21

通過上圖可以發現，當ωi與ω∗異号時，無論是哪種情況為了使得損失函數最小，其最優值都是ωi=0此時能保證代價函數的二次項式和絕對值式都取得最小值。
當ωi和ω∗同号時，可以将上式進行化簡可得

正則化和泛化區别（深入理解正則化）22

所以，我們可以合并上式的結果得到最終的ωi的表達式為

正則化和泛化區别（深入理解正則化）23

ωi解析解

總結

我們通過畫圖和使用公式推導證明了L1正則化和L2正則化産生不同效果的原因，需要注意的是它們的共同點其實都是在衰減對于代價函數的值變化影響相對較小的權重，也就是特征值小的權重，而L1正則化的效果是會使得這部分權重為0，L2正則化會使得它們趨于0。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

圖文聚酯纖維
聚酯纖維?我們一直知道T400是滌綸中一種非常獨特的紡織纖維絲，它之所以有這個地位，那是因為它是一種彈力絲，也是除氨綸外，我們面料中最常用的彈力絲了在我們生活中彈力絲是一種不可或缺的紡織面料原料，如果沒有彈力絲，那麼我們就會損失服裝的大半江... 2022-10-03
圖文十大聰明血型排名
十大聰明血型排名?注意啦注意啦告訴大家一個秘密：，今天小編就來說說關于十大聰明血型排名?下面更多詳細答案一起來看看吧!十大聰明血型排名注意啦！注意啦！告訴大家一個秘密：你！很可能是一名隐藏的貴族！日前，有科學表明實際上血型确實掌握了每個人的... 2022-10-02
圖文微信怎麼限制青少年支付
近日，微信正式推出青少年模式支付限額功能。更新到微信安卓版本8.0.23後，父母或監護人可在青少年模式中設置微信支付的限額，包括每日消費限額和單次消費限額。完成設置後，青少年使用微信支付時，将會受到已設置的額度限制。通過微信青少年模式支付限... 2022-10-26
圖文唐代最偉大的浪漫主義詩人李白
大唐是璀璨的，是繁華的，是包容的，是天馬行空的，于是就有了大唐最浪詩人李白。如果在其他朝代，估計很難出一個李白。餘光中《尋李白》寫到：“酒放豪腸，七分釀成了月光，餘下的三分嘯成劍氣，繡口一吐，就半個盛唐。”下面讓我們感受詩仙的劍氣，俠氣，豪... 2022-10-20
圖文為什麼香蕉有很多斑點
我們都知道，香蕉富含多種維生素和營養物質，是相當好的營養食品。并且一年四季可收獲，還有很多人靠吃香蕉減肥。是非常受歡迎的水果之一。但是，香蕉在放久了之後總是會長出一些難看密集的斑點，讓人覺得這根香蕉好像“發黴”了一樣，不敢吃。到底是為什麼香... 2022-11-12
圖文收快遞的正确姿勢你get了嗎
鑒于我市當前的疫情形勢，哈爾濱市疾病預防控制中心提示您——為防止疫情通過郵政快遞渠道傳播擴散，有效控制和降低疫情傳播風險，廣大市民近期非必須不從新冠疫情中高風險地區采購物資商品，如通過快遞購買果蔬時更應當提高防範意識，加強個人防護。那麼如何... 2022-12-03
圖文威海旅遊海邊好玩的地方
齊魯網12月28日訊12月28日晚，《飛閱齊魯》威海篇開播。在威海篇中，我們将一覽國際海水浴場，這條威海人心目中的“金沙灘”總長2800多米，30多萬平方米的天然海灘，坡度平緩，可同時容納10萬人在此親海避暑……更多精彩戳視頻觀看↑↑↑, 2022-11-14
圖文如何讀懂老祖宗的話
孔子教育自己的兒子孔鯉時曾說過：“不學禮，無以立”。中國自古以來就是禮儀之邦，尤其在古代，有着十分繁雜的禮儀規範，見面時不會向我們今天這樣說”你好“，必須要說一句“客套話”，同時這些客套話還十分有詩意，讓人們聽了這些話就不自覺的覺得自己“雅... 2022-09-29
圖文控油美白不刺激的平價洗面奶
清爽控油的洗面奶推薦：深層卸妝，令肌膚煥發前所未有的新生光澤！資生堂悅薇潔面膏很久之前用的一款潔面膏，200多軟妹币一瓶，感慨自己以前還真是舍得花錢啊！現在基本上不會買200以上的洗面奶了，有錢會砸在精華面霜上，可能幾年後有錢會砸在醫美上吧... 2022-11-13
圖文強直适合吃什麼
對于強直患友來說，除了要每天按時按量服用藥物外，日常的飲食問題對病情的恢複，也是有重要意義的。合理的飲食不僅能改善營養缺乏，而且可減輕炎症過程，延緩疾病複發，反之，不合理的飲食也可能誘發疾病。然而很多強友往往容易忽視這一點。特别是小長假來了... 2022-11-19
圖文 yy十大最慘神豪
YY年度盛典在今天淩晨已經結束，今年在衆多土豪的支持下競争激烈程度創造了曆史新高，在為期半個月的活動中，超級神豪哦哦哦更是憑借着一己之力刷出了超過3800萬元，成為年度第一神豪，而排名前五十的土豪最低消費達到120萬元。在娛樂大人物榜單上，... 2022-10-31
圖文森歌集成竈蒸烤一體使用手冊
如果問一問年輕人愛不愛下廚做飯，可能多數人都給否定答案。大概在年輕人的思維裡，那些油煙、泥濘、麻煩至極且十分緩慢的料理程序天生和自己沒有交集，因為這很難和時髦、酷、高質量聯系起來，所以讓他們下廚房其實就是一件比“看天氣”還随機的事兒。有沒有... 2022-11-12
圖文 100句歇後語大全
大家好，我是君君，每日一篇老人言。帶你領悟老祖宗的智慧，品味不一樣的人生，傳承中華傳統文化，每天帶你長知識。1、打腫臉充胖子————外強中幹。2、烘爐烤的大餅————翻來覆去。3、水龍車遇紅燈————暢通無阻。4、一手拿針，一手拿線————... 2022-11-02
圖文合肥的公交卡在哪裡充值
合肥的公交卡可以通過網上下載APP在自己手機充值了；首先需要你的手機要具備NFC（支持全功能的，可以網上查詢一下自己手機是否支持），然後再百度搜索下載一個合肥通的APP,如圖：打開你可以看見幾個功能展示：如果沒有打開NFC功能會提醒你打開然... 2022-11-14
圖文魔獸世界9.0暗影國度情節
《暗影國度》新的升級路線-新區域：流放之途，以及選擇你喜歡的資料片在《暗影國度》資料片中，練級體驗将再一次的改頭換面：随着等級壓縮後最高級變為60級，在暗影國度之前的練級體驗将完全不同，新增了一個全新的練級區域，并且你可以選擇自己喜歡的資料... 2023-01-26
圖文人教版八年級上冊英語同步檢測題
人教版八年級上冊英語同步檢測題?2021年11月1日每日一練按照要求寫出下列詞的第三人稱單數；現在分詞；過去式，現在小編就來說說關于人教版八年級上冊英語同步檢測題?下面内容希望能幫助到你，我們來一起看看吧!人教版八年級上冊英語同步檢測題20... 2022-11-11
圖文大唐飛仙陣容推薦
經過一個漫長的暑期等待，我們的《大唐好徒弟》開發團隊終于正式宣布将在10月份金秋時節發布該遊戲的第二個版本大神仙歸來資料片了。相信這會讓很多忠實玩家興奮不已，那麼就先讓我們簡單回顧一下這款以西遊記為背景遊戲的第一個版本吧！大唐在七月份上線後... 2022-12-05
圖文平台型電商商家治理
編輯導語：網購是當今社會人們購物的主要渠道之一，因此也誕生了很多電商平台。本文從電商平台商家管理和治理要點出發，主要對商家的規模、價值、管理治理、痛點以及如何解決展開了分析，希望能給您帶來幫助。說幹貨，講邏輯，促成長，本文主要内容包括：平台... 2022-11-17
圖文男人對你一往情深的征兆
男人對你一往情深的征兆?愛情是什麼？當一個人對你一往情深時，他會向你發出怎樣的求愛信号？面對這兩個問題，很多女人心中會充滿疑慮，下面我們就來聊聊關于男人對你一往情深的征兆?接下來我們就一起去了解一下吧!男人對你一往情深的征兆愛情是什麼？當一... 2022-10-11
圖文職工養老保險退休需要什麼手續
退休作為許多“打工人”一直想做的事情，當自己的年紀真的到了法定退休年齡，在申請辦理退休和每月領取養老金的手續時，卻不知道自己要準備哪些資料、申請條件是什麼等，就會使自己在申請退休時因為資料沒有準備齊全，無法很快的享受養老待遇。因此駿寶收集了... 2023-01-01
圖文普洱茶屬于什麼茶的類型
你好，這是“約茶記”第123篇原創文章，我是茶小菓。導語：衆所周知，中國茶據陳椽茶學系統劃分可分為綠茶、黃茶、黑茶、白茶、紅茶和青茶六類。原本，按照分類，茶品是可以一一歸類進去的！但作為茶界“特殊存在”——普洱茶，有人覺得該劃分為綠茶，而有... 2022-11-25
圖文初級會計23年什麼時候報考
姐妹們，初級會計報名時間确定了，截止目前已經有26個地區發布了2022年初級會計報名時間和考試時間喲。這26個地區報名時間已經放在上圖了，各位需要的可以碼住喲，還有要注意一點，看看你所在的地區需不需要信息采集。一定不能馬虎。報完名，就要真正... 2022-11-10
圖文喝水過量有哪些危害
喝水過量有哪些危害?【原标題】西媒：當心喝水過多也危險，今天小編就來說說關于喝水過量有哪些危害?下面更多詳細答案一起來看看吧!喝水過量有哪些危害【原标題】西媒：當心！喝水過多也危險據西班牙《國家報》網站7月10日文章稱，當“因為對身體好”而... 2022-10-07
圖文國内碳化矽半導體元器件廠家
碳化矽半導體碳化矽（SiC）又叫金剛砂，它是用石英砂、石油焦、木屑、食鹽等原料通過電阻爐高溫冶煉而成，其實碳化矽很久以前就被發現了，它的特點是：化學性能穩定、導熱系數高、熱膨脹系數小、耐磨性能好，硬度大（莫氏硬度為9.5級，僅次于世界上最硬... 2023-03-08
圖文古墓麗影發布時間表
《古墓麗影》25周年紀念頁面公開，重點内容如下：·1995年初代《古墓麗影》的設計文稿·《古墓麗影官方食譜和旅遊指南》今日開售·SE将和LittleLionEntertainment合作，在倫敦打造《古墓麗影》沉浸式現場體驗·「勞拉·克勞馥... 2022-11-08
圖文獅子女和誰有緣
獅子座女生最配的星座是誰?獅子座女生有着極強的自信心和戰勝困難的韌性，有令家道興旺的才能。你善于排除困難，但有可能在順境中遭受失敗，或遭到陰險小敵的陷害。你擁有吸引大家的獨到的魅力，那獅子座女生與哪個星座會是最配星座呢?星座網為您解答。獅子... 2022-10-24
圖文簡單美味烤箱烤蝦
小夥伴們又來家裡吃飯了，過年家裡很多海鮮，不如做一道醬烤大蝦用烤箱烤的無油版本，健康又美味，而且十分簡單！By愛吃甜食的小土豆用料大蝦兩隻香其醬适量生抽1勺味極鮮1勺糖2勺鹽少許姜2片蔥少許白胡椒粉少許做法步驟1、大蝦切成四段。2、加入少許... 2022-11-16
圖文梅豔芳最後一場演唱會似是故人來
香港歌壇曆來是華語流行歌壇的一座重鎮，幾十年時間留下諸多經典，不論是香港還是内地的歌迷，提及八、九十年代肯定會想起張國榮、譚詠麟、梅豔芳等人。直到今天，他們的歌仍舊是大家心目中無法複刻的經典。梅豔芳有一首《女人花》，曾唱出女性心目中無限的酸... 2022-12-26
圖文頂級家具創意效果圖
每年房價都在上漲，然而這種增漲的趨勢依舊阻擋不了現代人買房結婚的願望，随着來自生活的各種車貸，房貸等壓力，如今小戶型房子則是越來越受歡迎。然而小戶型雖然減小了現代年輕人還貸的壓力，但是在裝修方面，也是讓人各種操碎了心，房子空間有限，買的家具... 2022-11-24
圖文 cba球賽什麼時候恢複
cba球賽什麼時候恢複?一、男籃兩場世預賽赢得幹脆且霸氣，但是在勝利的背後也能“折射”出客觀存在的一些問題，今天小編就來說說關于cba球賽什麼時候恢複?下面更多詳細答案一起來看看吧!cba球賽什麼時候恢複一、男籃兩場世預賽赢得幹脆且霸氣，但... 2022-10-15

tft每日頭條

> 圖文

> 正則化和泛化區别

正則化和泛化區别

相关圖文资讯推荐

热门圖文资讯推荐

网友关注