神經網絡反向傳播算法-tft每日頭條

神經網絡反向傳播算法

生活更新时间:2025-11-09 06:44:52

清華大數據軟件團隊官方微信公衆号

來源：Deephub Imba

本文約3500字，建議閱讀5分鐘

如何計算隐藏層中的誤差?微積分和這些有什麼關系?

反向傳播是神經網絡通過調整神經元的權重和偏差來最小化其預測輸出誤差的過程。但是這些變化是如何發生的呢?如何計算隐藏層中的誤差?微積分和這些有什麼關系?在本文中，你将得到所有問題的回答。讓我們開始吧。

在了解反向傳播的細節之前，讓我們先浏覽一下整個神經網絡學習過程：

神經網絡是如何進行學習的？

神經網絡中的學習過程分為三個步驟。

第 1 步：将數據輸入神經網絡。該輸入數據順序通過神經網絡的不同層，并在最終輸出層産生輸出或預測。數據從輸入層流向輸出層的整個過程稱為前向傳播。我們将在下面看到前向傳播的細節。

第 2 步：現在有了輸出，我們計算輸出中的損失。我們有很多計算損失的選項，例如均方誤差、二元交叉熵等，如何計算損失是根據不同的目标來定義的。

第 3 步：計算損失後，我們必須告訴神經網絡如何改變它的參數（權重和偏差）以最小化損失。這個過程稱為反向傳播。

神經網絡中的前向傳播

NN 基本上由三種類型的層組成。輸入層、隐藏層和輸出層。通過 NN 的數據流是這樣的：

數據第一次在網絡中向前流動時，将需要訓練神經網絡的輸入或特征輸入到輸入層的神經元中。
然後這些輸入值通過隐藏層的神經元，首先乘以神經元中的權重，然後加上一個偏差。我們可以稱之為預激活函數。
預激活函數之後就是激活函數。有很多激活函數，例如 sigmoid、tanh、relu 等，激活函數的作用是加入非線性的因素。
最後一層是輸出層，其中顯示了神經網絡的計算輸出。

損失函數

當輸入通過向前傳播産生輸出後，我們可以在輸出中找出誤差。誤差是預測輸出和期望的真實值之間的差異。但在神經網絡中通常不計算輸出中的誤差，而是使用特定的損失函數來計算損失，并随後在優化算法中使用該函數來将損失降低到最小值。

計算損失的方法有很多，如均方誤差、二元交叉熵等。這些使用那個損失是根據我們要解決的問題來選擇的。

梯度下降算法

反向傳播的全部思想是最小化損失。我們有很多優化算法來做到這一點。但為了簡單起見，讓我們從一個基本但強大的優化算法開始，梯度下降算法。

這裡的想法是計算相對于每個參數的損失變化率，并在減少損失的方向上修改每個參數。任何參數的變化都會導緻損失發生改變。如果變化為負，那麼我們需要增加權重以減少損失，而如果變化為正，我們需要減少權重。我們可以用數學方式将其寫為，

其中梯度是損失函數相對于權重的偏導數。學習率隻是一個縮放因子，用于放大或縮小梯度。在接下來的文本中更詳細地解釋了它。相同的公式适用于偏差：

new_bias = old_bias - learning_rate * gradient

其中梯度是損失函數相對于偏差的偏導數。

看看下面的圖表。我們繪制了神經網絡的損失與單個神經元權重變化的關系圖。

神經網絡反向傳播算法（神經網絡背後的數學原理）1

現在我們可以看到曲線中有很多局部最小值（所有下凹曲線），但我們感興趣的是将損失降低到全局最小值（最大的下凹曲線）。假設我們的權重值現在接近示例圖中的原點（假設為 1，因此我們的損失接近 4）。

神經網絡反向傳播算法（神經網絡背後的數學原理）2

在上圖中權重值約為3的時候損失最小。

所以我們的算法必須能夠找到這個權重值（3），來使得損失最小。所以權重的改變應該與損失成某個比例。這就是為什麼梯度是由損失相對于權重的偏導數給出的。所以梯度下降算法的步驟是：

計算梯度(損失函數相對于權重/偏差的偏導數)
梯度乘以學習速率。
然後從權重/偏差中減去梯度乘以學習速率。

對以上操作進行叠代，直到損失收斂到全局最小值。

神經網絡反向傳播算法（神經網絡背後的數學原理）3

關于梯度的更多信息

由于直線的斜率可以使用通用斜率公式計算：

神經網絡反向傳播算法（神經網絡背後的數學原理）4

取直線上相距一定距離的兩點，計算斜率。當圖形是一條直線時，這種計算梯度的方法給出了精确的計算。但是當我們有不均勻的曲線時，使用這種方式計算梯度一個好主意。因為這些圖中的每個點的損失都在不斷變化，尤其是當曲線不規則時，如果我們可以使我們計算斜率的鄰域或距離無限小呢？這樣不就可以計算最準确的梯度值了嗎？

對，這正是通過計算 y 相對于 x 的導數所做的。這為我們提供了 y 相對于 x 的瞬時變化率。瞬時變化率為我們提供了比我們之前的運行遞增法方更精确的梯度，因為這個梯度是瞬時的。在計算相對于權重或偏差的損失變化率時，應遵循相同的方法。損失函數相對于權重的導數為我們提供了損失相對于權重的瞬時變化率。

學習率

在計算完梯度之後需要一些東西來縮放梯度。因為有時候神經網絡試圖朝着損耗曲線的最低點前進時，它可能會在每次調整其權重時采取很大的調整，調整過大可能永遠不會真正收斂到全局最小值。你可以在下面的圖表中看到：

神經網絡反向傳播算法（神經網絡背後的數學原理）5

正如你所看到的，損失會持續朝任何方向移動，并且永遠不會真正收斂到最小值。如果學習速度太小，損失可能需要數年的時間才能收斂到最小。因此最佳學習率對于任何神經網絡的學習都是至關重要的。

因此，每次參數更新時，我們使用學習速率來控制梯度的大小。讓我重申一下上面看到的更新參數的公式。

new_weight = old_weight - learning_rate * gradient

所以學習速率決定了每一步的大小同時收斂到最小值。

計算梯度

計算的損失是由于網絡中所有神經元的權重和偏差造成的。有些權重可能比其他權重對輸出的影響更大，而有些權重可能根本沒有影響輸出。

前面已經說了我們訓練的目标是減少輸出中的誤差。要做到這一點必須計算每個神經元的梯度。然後将這個梯度與學習速率相乘，并從當前的權重(或偏差)中減去這個值。這種調整發生在網絡中的每一個神經元中。現在讓我們考慮隻有一個神經元的神經網絡。

神經網絡反向傳播算法（神經網絡背後的數學原理）6

L-層數
w-權重
z- 預激活函數
a- 激活函數
y-輸出

預激活 z 可以寫為，

神經網絡反向傳播算法（神經網絡背後的數學原理）7

為了簡單起見，讓我們暫時忽略偏差b。

然後 z 的值由激活函數激活。這個例子中我們使用 sigmoid 激活函數。sigmoid 激活函數由符号 σ 表示。

神經網絡反向傳播算法（神經網絡背後的數學原理）8

這個網絡的輸出是 y-hat。通過使用可用的各種損失函數之一來完成計算損失。讓我們用字母 C 表示損失函數。現在該進行反向傳播了，計算損失函數的梯度：

神經網絡反向傳播算法（神經網絡背後的數學原理）9

這個值告訴我們權重的任何變化如何影響損失。

為了計算梯度，我們使用鍊式法則來尋找導數。我們使用鍊式法則是因為誤差不受權重的直接影響，權重影響預激活函數，進而影響激活函數，進而影響輸出，最後影響損失。下面的樹顯示了每個術語如何依賴于上面網絡中的另一個術語。

神經網絡反向傳播算法（神經網絡背後的數學原理）10

預激活函數取決于輸入、權重和偏差、激活函數依賴于預激活函數、損失取決于激活函數

圖像右上角的 y 是與預測輸出進行比較并計算損失的真實值。

所以當我們應用鍊式法則時，我們得到：

神經網絡反向傳播算法（神經網絡背後的數學原理）11

我們有另一個詞來指代這個梯度，即損失相對于權重的瞬時變化率。将這些從單個神經元網絡的梯度計算中獲得的知識外推到具有四層的真正神經網絡：一個輸入層、兩個隐藏層和一個輸出層。

神經網絡反向傳播算法（神經網絡背後的數學原理）12

每個神經元的預激活函數由下式給出

神經網絡反向傳播算法（神經網絡背後的數學原理）13

L-層數
j- 計算預激活函數的神經元的索引
z- 預激活函數
w-神經元的權重
a- 前一個神經元的激活輸出

除了我們沒有激活函數的輸入層之外的所有神經元都是如此。因為在輸入層中z 隻是輸入與其權重相乘的總和（不是前一個神經元的激活輸出）。

這裡的梯度由下式給出，

神經網絡反向傳播算法（神經網絡背後的數學原理）14

其中 w 是分别連接 L-1 層和 L 層節點 k 和 j 的權重。k 是前一個節點，j 是後繼節點。但是這可能會引發一個新的問題：為什麼是wjk而不是wkj呢？這隻是在使用矩陣将權重與輸入相乘時要遵循的命名約定。（所以暫時先不管他）

下面的樹可以看到它們之間相互依賴

神經網絡反向傳播算法（神經網絡背後的數學原理）15

可以看到，前一層節點的激活函數的輸出作為後一層節點的輸入。如果知道以下項的值，就可以輕松計算輸出節點中的梯度：

誤差對激活函數的導數
激活函數相對于預激活函數的導數
預激活函數相對于權重的導數。

但是當我們在隐藏層計算梯度時，我們必須單獨計算損失函數相對于激活函數的導數，然後才能在上面的公式中使用它。

神經網絡反向傳播算法（神經網絡背後的數學原理）16

這個方程與第一個方程幾乎相同（損失函數相對于權重的推導）。但在這裡有一個總結。這是因為與權重不同，一個神經元的激活函數可以影響它所連接的下一層中所有神經元的結果。

需要說明的是：這裡沒有編寫用于推導與輸出層中的激活函數相關的損失函數的鍊式法則的單獨方程。那是因為輸出層的激活函數直接影響誤差。但隐藏層和輸入層的激活函數并非如此。它們通過網絡中的不同路徑間接影響最終輸出。

通過以上的計算，在計算網絡中所有節點的梯度後，乘以學習率并從相應的權重中減去。

這就是反向傳播和權重調整的方式。經過多次叠代這個過程，将損失減少到全局最小值，最終訓練結束。

還差一個偏差

偏差也以與重量相同的方式經曆一切！

與權重一樣，偏差也會影響網絡的輸出。因此在每次訓練叠代中，當針對權重的損失計算梯度時，同時計算相對于偏差的損失的梯度。

神經網絡反向傳播算法（神經網絡背後的數學原理）17

對于隐藏層，損失函數相對于前一層激活函數的推導也将使用鍊式法則單獨計算。因此梯度被反向傳播并且每個節點的偏差被調整。

總結

當損失被反向傳播和最小化時，這就是在每個訓練循環期間發生的所有事情。我希望這篇文章已經消除了數學中的晦澀難懂的概念，并使用了一種簡單的方式将整個反向傳播的過程描述清楚了。如果你有什麼建議，歡迎留言。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活打疫苗後多久可以喝酒
打疫苗後多久可以喝酒?建議一周内不要喝酒雖然目前并沒有規定打新冠疫苗後不能喝酒，但酒精畢竟屬于刺激性的食物，接種完疫苗後以防對疫苗效果産生不良影響，接下來我們就來聊聊關于打疫苗後多久可以喝酒?以下内容大家不妨參考一二希望能幫到您!打疫苗後多... 2022-06-05
生活馬桶購買注意事項
馬桶怎麼選？别聽銷售員說得天花亂墜，隻認準這四點就夠了害怕新屋買回來的馬桶，沒用多久就堵了？厭煩衛生間馬桶時不時散發不可描述的臭味？要知道，馬桶堵了臭了，隻有0次和無數次的區别！賣場的馬桶看得眼花缭亂？不知道該怎麼選？作為銷售馬桶的“資深”... 2022-11-18
生活 2022關于立冬的心情短語說說
2022關于立冬的心情短語說說?因為有你，這個冬天有了浪漫，一切都很溫暖我要讓你懂我全部的心思，一個微笑，一個眼神，都是默契我願意走入你的心田，成為另一個你在愛情的國度裡，總會有一個主角一個配角，累的永遠是主角，傷的永遠是配角人生可以重複着... 2022-07-18
生活推波助瀾的意思是
推波助瀾的意思是?推波助瀾，漢語成語，讀音為tuībōzhùlán，比喻從旁鼓動、助長事物（多指壞的事物）的聲勢和發展，擴大影響，我來為大家科普一下關于推波助瀾的意思是?以下内容希望對你有幫助!推波助瀾的意思是推波助瀾，漢語成語，讀音為tu... 2022-08-09
生活免洗手凝膠怎麼用
免洗手凝膠怎麼用?内部清潔：首先擠适量的免洗手凝膠放在掌心，然後掌心相對，互相揉搓5-10次，我來為大家科普一下關于免洗手凝膠怎麼用?下面希望有你要的答案，我們一起來看看吧!免洗手凝膠怎麼用内部清潔：首先擠适量的免洗手凝膠放在掌心，然後掌心... 2022-07-14
生活禮儀培訓内容有哪些
禮儀培訓師生活交往中需要基本的禮儀來互相尊重，保持适當距離。下面是由環球禮儀商學堂小編為大家整理的“禮儀培訓師之日常禮儀知識簡單彙總”，僅供參考，歡迎大家閱讀。日常禮儀知識簡單彙總1.個人儀容有哪些基本要求？（1）發型得體。男性頭發前不蓋眉... 2022-11-23
生活如何開通網上銀行
如何開通網上銀行?開通網上銀行，必須要在銀行開設賬戶，可以申請辦理一張銀行卡，接下來我們就來聊聊關于如何開通網上銀行?以下内容大家不妨參考一二希望能幫到您!如何開通網上銀行開通網上銀行，必須要在銀行開設賬戶，可以申請辦理一張銀行卡。可以直接... 2022-06-14
生活家裡自制香腸配方
家裡自制香腸配方?配方：豬前腿肉10斤，辣椒面100克，花椒面30克，鹽125克，高度白酒50克，白糖20克，胡椒粉10克，小茴香10克，腸衣1卷，接下來我們就來聊聊關于家裡自制香腸配方?以下内容大家不妨參考一二希望能幫到您!家裡自制香腸配... 2022-07-08
生活新手怎麼複原魔方
新手怎麼複原魔方?對好第一面十字，對好第一面加上四個側面的T字形，我來為大家科普一下關于新手怎麼複原魔方?下面希望有你要的答案，我們一起來看看吧!新手怎麼複原魔方對好第一面十字，對好第一面加上四個側面的T字形。處理第二層的四個棱色塊，對好前... 2022-06-07
生活怎麼避免高碳水飲食
現如今，朋克養生逐漸深入人心，雖然還在沒有辦法的熬夜加班，但卻懂得了應該去養生。還比如在養生界中流行的“低碳水飲食”，可這種方式真的好嗎？低碳水飲食是什麼？“低碳生活”本來是說減少碳排放，是一個積極的環保理念。但有些人做了進一步引申，變成了... 2022-11-29
生活判斷洗面奶是不是氨基酸
每個人都要洗臉吧，臉就是咱們的門面啊，不洗不行啊但是洗臉使用的洗面奶大部分人是不知道怎麼選擇的？什麼皂基、氨基酸的，能洗臉不就行了嗎？洗臉這是門學問好嗎，選用一個好用的洗面奶不僅可以保護皮膚還能清潔我們的皮膚呢。不要和隔壁老王一樣摸到一個洗... 2022-11-04
生活繼承父母房子需要交土地轉讓金嗎
繼承父母房子需要交土地轉讓金嗎?繼承人繼承房屋的時候，可供繼承的房屋是要有完整所有權的，所以繼承房屋後一般是不需要交納土地出讓金的，但繼承的土地使用權到期除外個人繼承房産涉稅問題：個人所得稅：《關于個人無償受贈房屋有關個人所得稅問題的通知》... 2022-06-01
生活蘭花隻長苗不開花是什麼原因
蘭花隻長苗不開花是什麼原因?缺少光照很多人都知道它是喜陰的，但是也不能長期不見陽光，要是讓它在黑暗沒有光照的環境裡生長，它就會不開花平時可以讓它接受溫和的陽光，但在夏季不要被暴曬，春秋冬季能多見下陽光，現在小編就來說說關于蘭花隻長苗不開花是... 2022-07-02
生活貴州省大型國企有哪些
貴州是我國今年來經濟發展突飛猛進的省份，是中國經濟體系裡的一顆璀璨的明星。貴州經濟的優秀表現，離不開貴州省政府直屬的超級國有企業的貢獻。你知道貴州省屬的國企有多強大嗎？今天小鵬就給大家盤點一下。1，七冶建設集團有限責任公司七冶建設集團有限責... 2023-02-11
生活英文電子郵件的寫作模闆
英文電子郵件的寫作模闆?電子郵件（email）是國外辦公和正式交流的主要方式英文電子郵件有一些特定的結構和标準，隻要掌握好技巧就可以輕松高效的寫郵件了，接下來我們就來聊聊關于英文電子郵件的寫作模闆?以下内容大家不妨參考一二希望能幫到您!英文... 2022-10-23
生活哆啦a夢時光機的作用
哆啦a夢時光機的作用?時光機（亦稱航時機）是動畫片《哆啦A夢》中的一常用道具是一可以跨越時空，任意穿梭于過去和未來的一種機器，下面我們就來聊聊關于哆啦a夢時光機的作用?接下來我們就一起去了解一下吧!哆啦a夢時光機的作用時光機（亦稱航時機）是... 2022-06-24
生活泡泡糯米酥的做法
泡泡糯米酥的做法?食材：高筋面粉120克、豬油40克、白糖20克、溫水40克、低筋面粉90克、豬油45克、糯米粉(餡料)70克、奶粉10克、椰蓉20克、豬油30克、水120克、芝麻20克、白糖60克，我來為大家科普一下關于泡泡糯米酥的做法?... 2022-06-05
生活通知的六大種類
通知的六大種類?發布性通知：用于發布行政規章制度及黨内規章制度，現在小編就來說說關于通知的六大種類?下面内容希望能幫助到你，我們來一起看看吧!通知的六大種類發布性通知：用于發布行政規章制度及黨内規章制度。批轉性通知：用于上級機關批轉下級機關... 2022-08-09
生活空氣炸鍋用放水嗎
空氣炸鍋用放水嗎?空氣炸鍋不需要放水和傳統的烹調方式不同，空氣炸鍋是用空氣取代油來對食物進行炸制如果加水，會影響空氣炸鍋的工作效率，增加耗電因空氣炸鍋有類似于烤箱的功能，區别在于用空氣炸鍋的時候可以不用放油因此，空氣炸鍋不需要放水，今天小編... 2022-06-05
生活珍珠抛光打磨方法教程
珍珠抛光打磨方法教程?珍珠采收後，先用清水洗滌，然後入放飽和食鹽水中浸泡5分鐘至10分鐘，我來為大家科普一下關于珍珠抛光打磨方法教程?以下内容希望對你有幫助!珍珠抛光打磨方法教程珍珠采收後，先用清水洗滌，然後入放飽和食鹽水中浸泡5分鐘至10... 2022-08-22
生活野釣調漂方法和時間
戶外野釣時調漂，怎樣調？頓和靈之間怎樣輕松調換？野釣調漂個人偏向開竿調靈一點，這樣的好處是能比較準确地知道魚兒進窩的情況和小雜魚的多少。再依據實際魚情做出調整。那麼到底該如何調漂呢？在實際垂釣中如何做出調整呢？我們一起分析一下。首先，陌生水... 2023-02-08
生活兒童體适能訓練都有什麼
體适能的概念源起于美國，它是指個人能力足以勝任日常工作以外還能有餘力享受休閑，及能夠應付突如其來的變化及壓力的身體适應能力。美國運動醫學學會這樣定義體适能：“體适能是機體在不過度疲勞狀态下,能以旺盛的精力愉快地從事日常工作和休閑活動，能從容... 2022-12-29
生活一套七巧闆有幾塊
一套七巧闆有幾塊?七巧闆有7塊，包括5塊等腰直角三角形(2塊小三角形、1塊中三角形和2塊大三角形)、1塊正方形、1塊平行四邊形七巧闆可用7塊闆拼成1600種以上圖形，例如：三角形、平行四邊形、貓、狗、橋、房子等，今天小編就來聊一聊關于一套七... 2022-07-12
生活酌情考慮是什麼意思
酌情考慮是什麼意思?酌情考慮[zhuóqíngkǎolǜ]：按實際情況或發展态勢（來斟酌的合情合法的處理問題）裡面含有同情、理解的成分，也是一種希望，會打破一些常規或者慣例來處理問題，下面我們就來聊聊關于酌情考慮是什麼意思?接下來我們就一起... 2022-06-13
生活霸氣網名男生
霸氣網名男生?暖南傾綠薄荷淺淺，今天小編就來說說關于霸氣網名男生?下面更多詳細答案一起來看看吧!霸氣網名男生暖南傾綠薄荷淺淺此去經年北葵向暖悠然予夏笑挽栀初一挽清愁拈花淺笑紫櫻半夏雨落傾城森陌夏栀心素如簡淺淺笙歌雨落殘花非比晴空萌城少年南鸢... 2022-06-03
生活怎麼讓起泡膠不粘手的方法
怎麼讓起泡膠不粘手的方法?可以加一點剃須泡就不會那麼沾手了，注意加量不可過多，今天小編就來聊一聊關于怎麼讓起泡膠不粘手的方法?接下來我們就一起去研究一下吧!怎麼讓起泡膠不粘手的方法可以加一點剃須泡就不會那麼沾手了，注意加量不可過多。想讓起泡... 2022-06-19
生活池上古詩的翻譯
池上古詩的翻譯?譯文小孩撐着小船，偷偷地從池塘裡采了白蓮回來他卻不懂得藏好自己的行迹，水面的浮萍上留下了一條船兒劃過的痕迹，我來為大家講解一下關于池上古詩的翻譯?跟着小編一起來看一看吧!池上古詩的翻譯譯文小孩撐着小船，偷偷地從池塘裡采了白蓮... 2022-07-05
生活荔枝空運時要怎麼保鮮
荔枝空運時要怎麼保鮮?常溫貯藏荔枝若不加任何防腐劑，一般5—7天就全部褐變目前常溫貯藏一般都要結合藥物的防腐作用來達到貯藏的目的，可推廣的防腐劑有苯來特、苯菌靈、多菌靈、滅菌威、乙磷鋁、特克多、撲海因等等大規模生産性常溫貯運往往得不到應有的... 2022-07-29
生活夏天适合佩戴沉香麼
本文系原創文章，轉載請注明。夏日佩戴沉香好處諸多，可以舒壓解郁，緩解燥熱引起的心裡焦灼不安，還能提神醒腦，清明混沌的神智，消除困乏等等。不過對于沉香來說，夏日可不是個适宜的天氣，超熱的氣候會帶來很多問題，因此佩戴時還需多加注意。防潮：沉香和... 2022-11-14
生活鼓舞士氣的詩詞
鼓舞士氣的詩詞?楚雖三戶,亡秦必楚也!長風破浪會有時,直挂雲帆濟滄海!，下面我們就來說一說關于鼓舞士氣的詩詞?我們一起去了解并探讨一下這個問題吧!鼓舞士氣的詩詞楚雖三戶,亡秦必楚也!長風破浪會有時,直挂雲帆濟滄海!路漫漫其修遠兮，吾将上下而... 2022-08-10

tft每日頭條

> 生活

> 神經網絡反向傳播算法

神經網絡反向傳播算法

相关生活资讯推荐

热门生活资讯推荐

网友关注