深度學習中梯度是怎麼計算得到的-tft每日頭條

深度學習中梯度是怎麼計算得到的

生活更新时间:2025-08-01 02:03:04

深度學習中梯度是怎麼計算得到的（深度學習技巧之Early）1

一、早停法簡介（Early Stopping）

當我們訓練深度學習神經網絡的時候通常希望能獲得最好的泛化性能（generalization performance，即可以很好地拟合數據）。但是所有的标準深度學習神經網絡結構如全連接多層感知機都很容易過拟合：當網絡在訓練集上表現越來越好，錯誤率越來越低的時候，實際上在某一刻，它在測試集的表現已經開始變差。

深度學習中梯度是怎麼計算得到的（深度學習技巧之Early）2

圖1、理想中的訓練集誤差和驗證集的誤差

模型的泛化能力通常使用模型在驗證數據集（validation set）上的表現來評估。随着網絡的優化，我們期望的理想中的泛化錯誤如圖1所示。即當模型在訓練集上的誤差降低的時候，其在驗證集上的誤差表現不會變差。反之，當模型在訓練集上表現很好，在驗證集上表現很差的時候，我們認為模型出現了過拟合（overfitting）的情況。

解決過拟合問題有兩個方向：降低參數空間的維度或者降低每個維度上的有效規模（effective size）。降低參數數量的方法包括greedy constructive learning、剪枝和權重共享等。降低每個參數維度的有效規模的方法主要是正則化，如權重衰變（weight decay）和早停法（early stopping）等。

早停法是一種被廣泛使用的方法，在很多案例上都比正則化的方法要好。圖1是我們經常看到論文中出現的圖，也是使用早停法出現的一個結果。其基本含義是在訓練中計算模型在驗證集上的表現，當模型在驗證集上的表現開始下降的時候，停止訓練，這樣就能避免繼續訓練導緻過拟合的問題。其主要步驟如下：

1. 将原始的訓練數據集劃分成訓練集和驗證集

2. 隻在訓練集上進行訓練，并每個一個周期計算模型在驗證集上的誤差，例如，每15次epoch（mini batch訓練中的一個周期）

3. 當模型在驗證集上的誤差比上一次訓練結果差的時候停止訓練

4. 使用上一次叠代結果中的參數作為模型的最終參數

然而，在現實中，模型在驗證集上的誤差不會像上圖那樣平滑，而是像下圖一樣：

深度學習中梯度是怎麼計算得到的（深度學習技巧之Early）3

圖2、真實的驗證集誤差變化曲線

也就是說，模型在驗證集上的表現可能咱短暫的變差之後有可能繼續變好。上圖在訓練集叠代到400次的時候出現了16個局部最低。其中有4個最低值是它們所在位置出現的時候的最低點。其中全局最優大約出現在第205次叠代中。首次出現最低點是第45次叠代。相比較第45次叠代停止，到第400次叠代停止的時候找出的最低誤差比第45次提高了1.1%，但是訓練時間大約是前者的7倍。

但是，并不是所有的誤差曲線都像上圖一樣，有可能在出現第一次最低點之後，後面再也沒有比當前最低點更低的情況了。所以我們看到，早停法主要是訓練時間和泛化錯誤之間的權衡。盡管如此，也有某些停止标準也可以幫助我們尋找更好的權衡。

二、如何使用早停法

我們需要一個停止的标準來實施早停法，因此，我們希望它可以産生最低的繁華錯誤，同時也可以有最好的性價比，即給定泛化錯誤下的最小訓練時間

2.1、停止标準簡介

停止标準有很多，也很靈活，大約有三種。在給出早停法的具體标準之前，我們先确定一下符号。假設我們使用E

E作為訓練算法的誤差函數，那麼Etr(t)是訓練數據上的誤差，Ete(t)是測試集上的誤差。實際情況下我們并不能知道泛化誤差，因此我們使用驗證集誤差來估計它。

第一類停止标準

假設Eopt(t)是在叠代次數t時取得最好的驗證集誤差：

深度學習中梯度是怎麼計算得到的（深度學習技巧之Early）4

我們定義一個新變量叫泛化損失（generalization loss），它描述的是在當前叠代周期t中，泛化誤差相比較目前的最低的誤差的一個增長率

深度學習中梯度是怎麼計算得到的（深度學習技巧之Early）5

較高的泛化損失顯然是停止訓練的一個候選标準，因為它直接表明了過拟合。這就是第一類的停止标準，即當泛化損失超過一定阈值的時候，停止訓練。我們用GLα來定義，即當GLα大于一定值α的時候，停止訓練。

第二類停止标準

然而，當訓練的速度很快的時候，我們可能希望模型繼續訓練。因為如果訓練錯誤依然下降很快，那麼泛化損失有很大概率被修複。我們通常會假設過拟合隻會在訓練錯誤降低很慢的時候出現。在這裡，我們定義一個k

k周期，以及基于周期的一個新變量度量進展（measure progress）：

深度學習中梯度是怎麼計算得到的（深度學習技巧之Early）6

它表達的含義是，當前的指定叠代周期内的平均訓練錯誤比該期間最小的訓練錯誤大多少。注意，當訓練過程不穩定的時候，這個measure progress結果可能很大，其中訓練錯誤會變大而不是變小。實際中，很多算法都由于選擇了不适當的較大的步長而導緻這樣的抖動。除非全局都不穩定，否則在較長的訓練之後，measure progress結果趨向于0（其實這個就是度量訓練集錯誤在某段時間内的平均下降情況）。由此，我們引入了第二個停止标準，即泛化損失和進展的商PQα大于指定值的時候停止

第三類停止标準

第三類停止标準則完全依賴于泛化錯誤的變化，即當泛化錯誤在連續s個周期内增長的時候停止（UP）。

當驗證集錯誤在連續s個周期内出現增長的時候，我們假設這樣的現象表明了過拟合，它與錯誤增長了多大獨立。這個停止标準可以度量局部的變化，因此可以用在剪枝算法中，即在訓練階段，允許誤差可以比前面最小值高很多時候保留。

2.2、停止标準選擇規則

一般情況下，“較慢”的标準會相對而言在平均水平上表現略好，可以提高泛化能力。然而，這些标準需要較長的訓練時間。其實，總體而言，這些标準在系統性的區别很小。主要選擇規則包括：

除非較小的提升也有很大價值，負責選擇較快的停止标準
為了最大可能找到一個好的方案，使用GL标準
為了最大化平均解決方案的質量，如果網絡隻是過拟合了一點點，可以使用PQ标準，否則使用UP标準

注意，目前并沒有理論上可以證明那種停止标準較好，所以都是實驗的數據。後續我們再介紹一下實驗結果。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活 pu皮包包的清洗小妙招
1、單純的清潔的話，可以用濕布擦。也可以用橡皮或牙膏清理，清理效果都不錯的，你不妨試試。牙刷也可以，... 2023-07-12
生活知乎怎麼開啟私信保護
1、首先打開軟件，我們在界面右下角找到“我的”選項，點擊這個選項就可以進入到我的頁面。2、接着在我的... 2023-07-12
生活海南怎樣開通快手直播權限
1、首先打開快手主頁，點擊左上角進入設置界面。2、在設置頁面下方找到實驗室，點擊并進入。3、在快手實... 2023-07-12
生活索立信平闆電腦卡槽在哪
1、在側面，SIM卡有大小之分，原卡(即剛到手時)的尺寸為54mm×85mm(銀行卡标準尺寸)，标準... 2023-07-12
生活美國叫停強生新冠疫苗接種
1、美國疾病控制和預防中心、美國食品和藥物管理局13日發表聯合聲明說，鑒于美國已報告6例因接種強生新... 2023-07-12
生活草莓種植季節是幾月份
1、草莓種植季節通常是在當年的七月份到八月份之間，這個時候有利于草莓種子進行出苗。草莓種植的時候需要... 2023-07-12
生活尼羅河屬于哪個國家
1、屬于隆迪、盧旺達、坦桑尼亞、烏幹達、蘇丹和埃及等國。大部分在埃及。2、世界第一長河——尼羅河(N... 2023-07-12
生活白酒收藏的方法
1、要選用優質的醬香酒，市面上的打着純糧釀造的口号，價位在幾十元左右的醬香酒就沒有收藏的價值了。隻有... 2023-07-12
生活擦地磚的小妙招
1、瓷磚日常清洗可選用洗潔精、肥皂等清洗。2、用肥皂加少許氨水與松節油的混合液，清洗瓷磚可使瓷磚更有... 2023-07-12
生活鐵木砧闆怎麼挑選
1、看表面。選來制成鐵木砧闆的鐵木樹齡的比較長,木質纖維細密而且堅硬,這樣的木材制成的砧闆就很少見到... 2023-07-12
生活車内怎麼添加本地音樂
1、首先，我們可以看到在我們車裡的多媒體中有SD卡這個功能；我們将SD卡通過讀卡器在電腦中下載好我們... 2023-07-12
生活如何做高質量的公衆号
1、确定定位公衆号的定位要結合個人和企業的角度去出發進行定位，結合企業的産品，個人提供什麼樣的類型，... 2023-07-12
生活明蝦怎麼養才不會死
1、水溫偏高，紅綠燈，25度水溫就行，魚狀态不好的時候沒有升溫的餘地。建議使用水族專用的風扇，可以有... 2023-07-12
生活佳能單反相機電池怎麼取出
1、一般機器底部有個按鈕，彈出來就可以取出電池。2、照像機是一種精密儀器，結構複雜，在使用、攜帶和保... 2023-07-12
生活紅燒雞爪怎麼做好吃
1、收汁時留少量濃汁，這樣味道更美。步驟：雞爪剪去指甲洗淨，入鍋中穿燙一下，瀝出備用。姜片、蒜瓣、八... 2023-07-12
生活産後吃木瓜能豐胸嗎
1、産後吃木瓜是不可以豐胸的，因為木瓜是沒有起到豐胸的作用。木瓜成分裡含有着大量的分解脂肪的大細胞縮... 2023-07-12
生活紫薇培養技巧
1、紫薇是很喜歡在陽光的照射下來成長的，環境也需要幹燥，而且紫薇它是很耐旱跟耐寒的，适應成長環境的能... 2023-07-12
生活體溫計測量體溫的方法
1、體溫計測量體溫要将水銀溫度計的水銀刻度甩到35度以下，要用水銀劑的探頭放到腋窩頂部夾緊大概測量5... 2023-07-12
生活怎麼洗雞爪
1、在煮之前，就要把雞腳好好的處理一下，減去雞爪的指甲，處理好之後用清水充分的沖洗各個縫隙，然後用手... 2023-07-12
生活辣椒如何養
1、首選要挑選适宜的種子，在春暖溫度穩定在18度以上之後就可以播種，種子可以放在清水中浸泡一個晚上，... 2023-07-12
生活什麼是輕質循環油
1、輕質循環油是一種輕質油類，即LCO，輕質油一般泛指沸點範圍約50～350℃的烴類混合物，但含義并... 2023-07-12
生活工商局企業年檢需要哪些手續
1、進入網站（原中國工商注冊網）。2、進入後選擇您企業所屬地區。3、進入工商企業年報系統。4、進入後... 2023-07-12
生活小米清洗小妙招
1、把小米放在适合的容器裡加清水反複的清洗3-5遍，直到淘米水清亮後，再另取一容器。2、在淘洗好的小... 2023-07-12
生活新飛冰箱冷藏室旋鈕是怎麼回事
1、機械溫控電冰箱的冷藏室内有檔位設置，這其實是溫度控制器。這電冰箱溫度控制旋鈕上标有0-7數字，這... 2023-07-12
生活數伏是哪一天怎麼算
1、每年數伏的日期不盡相同，但數伏日期總是在7月11日至7月20日之間。2、數伏是按農曆計算的，大約... 2023-07-12
生活蒼蠅太多怎麼辦
1、風油精，它是驅除蒼蠅非常不錯的幫手，隻需要把風油精的瓶蓋擰開，放在房間裡面的角落，這樣就能輕松驅... 2023-07-12
生活鹽水煮大閘蟹的方法
1、水中放鹽，直接煮大閘蟹就可以了。2、一般蒸大閘蟹，需要在水開之後再蒸10-15分鐘，具體的時間要... 2023-07-12
生活臘八節的風俗
1、祭祀。臘月本就源于祭祀，精神供佛，祈求和慶祝豐收，主旋律自然不會變。2、吃冰。臘八的前一天人們會... 2023-07-12
生活衛生間瓷磚空鼓處理
1、首先在先确定牆面磁磚空鼓到那一種程度上，需要按不同的程度進行處理。2、可先将瓷磚之間縫隙用鏟子鏟... 2023-07-12
生活華為手機微信視頻對方聽不到聲音
1、重啟手機。軟件因為手機程序開得太多而引起的停滞狀态經會經常發生，所以建議最快速解決的辦法則是重啟... 2023-07-12

tft每日頭條

> 生活

> 深度學習中梯度是怎麼計算得到的

深度學習中梯度是怎麼計算得到的

相关生活资讯推荐

热门生活资讯推荐

网友关注