神經梯度計算教程-tft每日頭條

神經梯度計算教程

生活更新时间:2025-10-28 07:57:27

第十八節邏輯回歸之交叉熵損失函數梯度求解過程(3)

上一節中，我們講解了交叉熵損失函數的概念，目标是要找到使得損失函數最小的那組θ，也就是l(θ)最大，即預測出來的結果在訓練集上全部正确的概率最大。那我們怎麼樣找到我們的最優解呢？上節中提出用梯度下降法求解，本節的話我們對其具體細節展開。

先來看下我們用梯度下降求解最優解，想要通過梯度下降優化L(θ)到最小值需要幾步？

第一步，随機産生w，随機到0附近會比較好一點，w随機到0附近就意味着不管用L1還是L2正則的時候，可以使w的整體比較小。L1和L2正則同樣可以用到邏輯回歸裡面去，來使得邏輯回歸的損失函數obj相對比較小，然後使得我們模型具有推廣能力和泛化能力。其實任何算法，都可以去使用L1和L2來提高模型的泛化能力，本質上就是減少模型的複雜度。所以以後未來碰到任何的算法，w在随機的過程當中，我們最好用期望為0的正态分布，來随機産生n 1個w。

第二步是求梯度，對于邏輯回歸來說，如果用SGD求梯度，我們得用交叉熵的損失函數來得到它的導函數，然後才可以知道某一個值的時候它的梯度是多少。

它本質是一階泰勒展開近似。第四步是判斷收斂，其實就是第二第三步循環往複來執行。

四步裡面第二步求解交叉熵損失函數的導函數求得其梯度是最關鍵的。我們對其展開來說。我們再來看下我們的目标函數：

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）1

把負号提出來再加上1/m就是：

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）2

至于求導梯度時為什麼要加-1/m，可以參考第六節梯度下降之從單元函數理解梯度下降過程(1)

我們要對損失函數裡每個w求偏導，也就是對每一部分求偏導。w在pi裡面，pi=1/（1 e-w^Tx），也可寫成h(θ)x。上面可拆成左右兩部分求導，先對左半部分yi*log pi求導，我們是對wj即(θj)求偏導，跟yi沒關系，因為(lnx)'=1/x ，并且log pi是複合函數，需要對裡外分别求導，即：

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）3

後半部分同理複合函數求導，

即：

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）4

又因為

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）5

求導結果為

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）6

而p(xi;w) 實際上就是關于θ的函數，可以寫成h(θ)x。所以

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）7

左右兩部分求導結合起來後損失函數表示成：

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）8

hθ(x)=1/（1 e-θ^Tx），是關于θ^Tx的Sigmoid函數.所以可以用g（θTx）表示，所以損失函數推導部分又可以寫成：

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）9

又因為（1/x）'=-1/x2，（ex）'= ex，（-z）'=-1，所以

實際上展開就是：

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）10

好吧看到這是不是很暈眩，實際上耐心下來，跟着我的思路去走，就會很好理解上面的公式。我們繼續吧，很快就結束了，也快大功告成了。我們對

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）11

上面展開後的公式繼續展開，整理即：

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）12

因為z就是θTx,hθ(x)=1/（1 e-θ^Tx）是關于θ^Tx的Sigmoid函數.同樣可以用g（θTx）表示。所以上面

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）11

展開後的公式最後可以表示成：

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）14

所以損失函數可以推導成：

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）15

而θTx就是θ1x1 θ2x2 …… θjxj …… θnxn，如果對θj求偏導，隻剩xj。即

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）16

xij這種表達方式大家應該已經習慣了，因為i代表第i行，j代表第j列，因為損失函數前面有一個加和符号，所以它實際上還是每一行的事。接下來就是把損失函數式子拆開，正負相消即：

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）17

最後一步是把前面的負号放進去得到的。到此我們推導成功，擦擦汗，真不容易!!!。

它就是邏輯回歸的導函數，你會發現它推導之後和mse的導函數是一樣的，都是(hθ(x)-y)*xj這種形式。隻不過在多元線性回歸的時候，hθ(x)是wTx，在邏輯回歸裡面，hθ(x)是1/（1 e-θTx）。hθ(x)不一樣，但是整體形式一樣。所以這也是它叫邏輯回歸的一個很大原因。

有了邏輯回歸損失函數推出來的導函數，我們用梯度下降求解的時候，我們就可以把第三步中的

神經梯度計算教程（大白話5分鐘帶你走進人工智能第18節-邏輯回歸之Loss求梯度）18

這一部分算出來了。隻要給我一組w，或者θ，w0一直到wn。有了θ，x，y，xj，我就可以把導數求出來。有了導數，繼而求得梯度。然後就可以用梯度下降公式去求解了。

下一節中我們講解邏輯回歸的優化。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活内置陽台怎麼裝修好看内置陽台裝修注意...
内置陽台怎麼裝修好看1、妙用地闆對于内置陽台來說，比較大的缺陷就是布局狹窄。如果長期在這樣的氛圍中，很容易導緻心情變得壓抑或者焦慮。所以在裝修的時候，為了延伸和擴大視野，盡量讓這個區域的地闆和卧室或客廳保持一緻，選擇淺色地闆比較好。2、擴展空間為了達到實用的樣式，很多用戶會将其設置為閱讀或休息區，雖... 2023-07-13
生活信用卡不良記錄幾年取消對子女有影響嗎
在現代社會，信用信息是一個人的第二張身份證，随着信用信息的不斷完善，人們越來越重視自己的信用記錄。然而，當他們年輕無知時，許多人在信用上犯了錯誤，如忘記還款信用卡、逾期貸款等信用信息記錄不良。那麼信用卡不良記錄幾年取消？對子女有影響嗎？信用卡不良記錄如果信用卡不良記錄完全消除，需要五年時間，但信用信... 2023-07-13
生活現在流行什麼顔色的門2022年最流行...
現在流行什麼顔色的門?1、白色門白色房門是比較百搭的選擇，适合當下的多種流行裝修風格，所以選擇的人也比較多，不過白色門如果漆面工藝處理不到位的話，後期很容易發黃變色。2、木色門木色的房門一般适合現代人風格的以淺木色為主，搭配風格以簡約、現代、北歐等比較簡潔大方的為主，木色方面會讓空間顯得更加自然清新... 2023-07-13
生活哪種病人不适合飲茶
1、便秘患者：原因是因為茶葉之中含有多酚類物質，對腸胃粘膜具有一定的收斂作用，因為這樣所以如果便秘患... 2023-07-13
生活日本補水保濕面霜排行榜日本補水保濕面...
由于面霜中的營養成分非常豐富，所以它也是我們為肌膚補水的重要護膚品之一，選對了适合自己的面霜，會使膚質得到很好的改善。那麼今天就由小編來為大家列出日本補水保濕面霜排行榜，告訴您日本補水保濕面霜哪個牌子好。日本補水保濕面霜排行榜：1、SK22、奧爾濱3、怡麗絲爾4、城野醫生5、DHC6、ACSEINE... 2023-07-13
生活五一假期高速公路免費幾天2022五一...
導語：根據我國《重大節假日免收小型客車通行費實施方案》，五一勞動節高速實行免費政策，具體免費時間于當年放假時間為準。據今年五一放假安排，五一假期高速公路免費幾天呢？2022五一勞動節高速路免費時間是什麼時候？下面我們一起來了解。五一假期高速公路免費幾天2022五一勞動節高速路免費時間五一高速2022... 2023-07-13
生活為什麼現在都不裝木地闆了木地闆的甲醛...
在裝修中最常見的就是地闆的選擇，而現在很多家庭都沒有選擇裝木地闆了。那麼，木地闆的甲醛多久會散？一起來看看小編帶來的介紹吧！為什麼現在都不裝木地闆了由于木地闆的實用性較差，導緻大部分使用者不選擇安裝木地闆。木地闆的吸水性較差，在長時間的使用情況下木地闆容易受潮從而導緻變形，并且木地闆長期的踩踏，容易... 2023-07-13
生活出花園在幾月幾日出花園當天禁忌有什麼
由于我國地域遼闊，少數民族衆多，所以很多地區都有不同的的風俗習慣，而文中小編講到的出花園在潮汕便是比較隆重的習俗之一，正因為這樣出花園在幾月幾日成了大家愛好奇的，一起看看吧。出花園在幾月幾日出花園在每年農曆正月十五或者七月初七舉行。出花園在潮汕可以說是比較隆重的節日之一，一般來講這一天出花園的孩子會... 2023-07-13
生活安徽省阜陽十大景區排行榜：木一博覽園...
我們之前說過安徽省十大景區，今天我們來說一說這裡其中的一個地級市的景區，這是一個生活節奏比較慢的城市，經濟發展雖然不發達，但是這裡的人們生活的卻是安逸閑适的，這是一個幸福指數高的地方。安徽省阜陽十大景區排行榜1.颍上縣八裡河風景區2.五裡湖生态濕地公園3.颍上明清苑4.颍上尤家花園5.迪溝生态旅遊風... 2023-07-13
生活中國10大留學機構排名國内最好的留學...
現在人民生活水平越來越高，對于教育也越來越重視，留學成為了很多學子的選擇。中國現在的留學中介也是五花八門，讓人挑花了眼。那麼中國留學中介機構哪個最好呢?下面和小編一起來看看吧。中國10大留學機構排名1、澳際留學北京澳際教育咨詢有限公司是首批獲得國家教育部資質認證的國内最大的國際教育集團。而且澳際留學... 2023-07-13
生活寫給女朋友的情書1000字一封讓女朋...
在老一輩那種沒有手機沒有電話的時代，或許隻能通過書信去傳達自己的愛意，其實文字能夠傳遞給人的是一種不可描述的心安，今天要給大家帶來的内容就是寫給女朋友的情書1000字。寫給女朋友的情書1000字曾以為，今生我不會再愛誰，也不會再牽挂思念誰，更不會再為誰流淚。因為，我的愛已經冬眠，我的心已經死去。曾經... 2023-07-13
生活單位體檢一半人都有肺結節嗎10個人有...
現在肺部CT非常的清楚，很容易發現這種小結節，大部分人都沒有問題的，這種情況不用特别處理，你也不用很擔心，過半年到一年再複查一次，如果沒有變化的話不用管他。那麼單位體檢一半人都有肺結節嗎？10個人有9個人有肺結節是真的嗎？下面，就快和小編一起了解相關知識吧！單位體檢一半人都有肺結節嗎？這個每個人體質... 2023-07-13
生活生發排行榜10強生發十大産品排行榜
在如今快節奏高壓力的生活方式下，很多人出現了脫發的問題，選擇植發價格比較昂貴，一般人也承受不了，大部分人都會選擇使用生發産品，下面就盤點了防脫生發品牌排行榜，大家可以看看公認最有效的生發産品有哪些。1、RogaineRogaine是美國強生公司旗下的專業的生發品牌，也是目前唯一所有産品都通過美國食品... 2023-07-13
生活今年倒春寒影響哪裡2022倒春寒每年...
倒春寒是比較特别的一個天氣現象，一般出現在初春時期，這個時候有一段時間會出現大降溫，會有持續低溫的天氣，按着以往倒春寒的情況來看，今年倒春寒影響的地區大概是在東北地區、華北地區、珠江三角洲地區以及長江三角洲地區等。今年倒春寒影響哪裡倒春寒常發生在長江三角洲地區、珠江三角洲地區、華北地區、東北地區等等... 2023-07-13
生活化妝不浮粉的小技巧怎麼化妝才自然不浮...
各位精緻的美眉是否還在為不服帖的妝容而苦惱呢？了解卡粉浮妝的原因，再有針對性地活用小技巧，輕松化妝不浮粉，讓你擁有亮眼一整天的服帖妝容，趕緊來學習一下吧！相信大多數女生化妝都有卡粉或者浮粉的經曆，而造成這種現象無非以下三種情況：皮膚幹燥，導緻妝容起皮卡粉；毛孔粗糙、凹凸不平，皮膚紋路不夠平滑導緻卡粉... 2023-07-13
生活五福塔折法
1、準備:取一張長方(或正方)形紙，以兩邊中心點對折一次.形成一條中折線.再以這條中折線的中點為起點... 2023-07-13
生活 2022年最潮微信名比較潮的微信名
1、僅存一抹笑。2、杯中殘酒3、憂傷的華爾茲4、勞資不是淑女範5、男人必須灑脫6、迷糊小生7、果味季節8、愛過恨過不曾後悔過9、長得帥10、夏羽希11、私欲染上寂寞12、親愛的白小兔13、豆蔻年華承載着往年的虛14、緻命傷15、未婚男人16、敷衍了事17、命有多卑賤18、晴空如妍19、文藝青年20、... 2023-07-13
生活飛機停機信号員抹脖子是什麼意思地勤人...
在飛機進入停機位的時候，會有地勤人員給信号進行引導，其中有一個手勢就是抹脖子的動作，這是什麼意思呢？地勤人員的手勢都是什麼意思？下面小編就帶來介紹。飛機停機信号員抹脖子是什麼意思在飛機停下來“抹脖子”的動作，其實是在示意飛行員可以關閉發動機。由于航空行業的特殊性，确保飛機和飛行航班的安全準點運行，春... 2023-07-13
生活白涼粉危害
1、白涼粉本身對身體無害，但是吃多了不好。2、因為白涼粉本身是屬于涼性的，且不易消化，吃多了容易出現... 2023-07-13
生活骨傳導耳機不會影響聽力是真的嗎骨傳導...
骨傳導耳機如今也是非常火的，是一種聲音的傳導方式，但對于這種耳機，也有人說并不值得購買，那麼，骨傳導耳機不會影響聽力是真的嗎？骨傳導耳機有必要買嗎？下面小編就帶來介紹。骨傳導耳機不會影響聽力是真的嗎作為“黑科技”出現的“骨傳導耳機”，深受很多健身人士和戶外愛好者歡迎。骨傳導是一種聲音傳導方式，即通過... 2023-07-13
生活 2022宿遷疫情什麼時候解封
最近一段時間江蘇多地出現疫情，其中宿遷疫情備受關注，為了疫情防控，當地多個地區進行封閉管理，馬上就要到五一了，那麼2022宿遷疫情什麼時候解封？下面小編為大家帶來2022宿遷疫情解封時間介紹，感興趣的小夥伴一起來看一下吧。2022宿遷疫情什麼時候解封現在宿遷疫情管控政策還是比較嚴格的，具體解封疫情官... 2023-07-13
生活佛山中秋燈會有什麼特别佛山中秋吃什麼
中秋佳節不僅僅隻有月餅和月亮，在古代人們就流行在中秋節辦燈會，猜燈謎，放河燈，使整個中秋節的夜晚還十分的耀眼，并且樂趣十足，讓人影響深刻，而且有些地區的中秋燈會還十分講究，比如廣東的佛山燈會就十分出彩，那麼佛山中秋燈會有什麼特别？佛山中秋吃什麼？下面是小編精心準備的内容希望對大家有所幫助！佛山中秋燈... 2023-07-13
生活 2022年雨水節氣降雨多嗎雨水節氣的...
2022年雨水節氣降雨多嗎是大家最愛問的，畢竟雨水作為春天的第二個節氣大家對于這個還是蠻關注的，畢竟這時的雨水對于即将要忙中的人們尤為的重要，正因為這樣雨水節氣可以種地嗎成了大家最為關注的，一起看看。2022年雨水節氣降雨多嗎2022年裡雨水比較多，但是春季雨水多不多主要看地區，像南方指定比北方多一... 2023-07-13
生活鋸樹的安全技巧
1、用油鋸切割大樹方法是先選擇樹周圍環境，哪個方向适合将樹放倒，選擇好方向後，在樹放倒的根部先用油鋸... 2023-07-13
生活十大高智商手機遊戲絕地求生第4,第一...
感覺生活沒有樂趣?看這裡!專門為你量身定做的十款經典單機解謎遊戲，絕殺你的腦細胞，超級燒腦高智商手機遊戲，想要挑戰的玩家們，趕緊行動下載開始玩起來吧|!十大高智商手機遊戲排行榜：1、第五人格2、我的世界3、逃脫葡萄園4、絕地求生5、王者榮耀6、腦力達人7、最囧挑戰28、夢幻西遊9、部落沖突10、紀念... 2023-07-13
生活抗原檢測多久出結果準确率怎麼樣新冠抗...
為了疫情防控的需求，國家推進“抗原篩查、核酸診斷”的監測模式，抗原檢測能夠幫助及早發現一些感染者，那麼，抗原檢測多久出結果準确率怎麼樣？怎麼自測？下面小編就帶來介紹。抗原檢測多久出結果準确率怎麼樣所謂抗原檢測，也就是通過鼻咽拭子樣本尋找病毒的抗原，操作方式類似于“驗孕棒”，大約15至20分鐘内出結果... 2023-07-13
生活老六是什麼意思網絡用語
現在網上有很多的網絡流行用語花樣百出，不過不少網友遇到這些詞語卻不知道具體的含義。比如最近很火的老六就吸引不少人注意，老六是什麼意思？我是老六這句話火了，不過大家都想要知道這裡的老六具體指的是什麼？下面來看下老六梗的出處及含義介紹。老六是什麼意思在CSGO遊戲裡競技模式中每方隻有五個人，而老六則是戲... 2023-07-13
生活如何看待手機廠商自研芯片為什麼都開始...
目前廠商都在做自研芯片，不過有了芯片的加持确實能對某些需求的配置進行強化，比如目前已經出的影像芯片、電池芯片等。那麼如何看待手機廠商自研芯片?為什麼都開始自研芯片了?下面小編帶來介紹。如何看待手機廠商自研芯片現在各大科技巨頭都紛紛開始布局自研芯片了，包括華為海思自研麒麟芯片，vivo自研芯片專業影像... 2023-07-13
生活過年的習俗都有哪些
1、過年的習俗有：掃塵、辦年貨、團圓飯、守歲、壓歲錢、貼春聯、放鞭炮、拜年等。2、過年不是一天，除了... 2023-07-13
生活十大手機殼品牌排行榜：邦克仕上榜，摩...
手機已經成為了大多數人不可缺少的東西，我們需要手機追劇，看小說，聽歌，我們需要手機和親朋好友聯系，我們還需要手機去購物，手機如此重要，我們需要好好的珍惜我們的手機，給它裝上手機殼，就是一種方法。十大手機殼品牌排行榜1.摩米士2.摩仕3.OTTERBOX4.洛克5.UAG6.卡登仕7.邦克仕8.品勝9... 2023-07-13

tft每日頭條

> 生活

> 神經梯度計算教程

神經梯度計算教程

相关生活资讯推荐

热门生活资讯推荐

网友关注