機器學習loss值對比圖的作用-tft每日頭條

機器學習loss值對比圖的作用

生活更新时间:2025-06-09 16:22:40

今天是概率統計專題的第六篇，我們來看看方差相關的概念。

方差的定義

方差在我們的日常生活當中非常常見，它主要是為了提供樣本離群程度的描述。舉個簡單的例子，我們去買一包薯片，一般來說一袋薯片當中的數量是固定的。我們假設平均每袋當中都有50片薯片好了，即使是機器灌裝，也不可能做到每一袋都剛好是50片，或多或少都會有些誤差。而均值則無法衡量這種誤差。

如果現在有兩個薯片品牌，它們的口味都差不多，平均每袋也都是50片。但是其中A品牌的薯片有一半是80片，還有一半是20片。B品牌呢，99%都在45-55之間。你說你會買哪一個牌子呢？（在不考慮通過稱重的情況下）。

在現代社會，凡是工廠出廠的産品，基本上都離不開方差這個概念。方差越低，說明工廠的生産能力越強，能夠做到每一個産品都很精細，相反如果方差越大，則說明瑕疵很多，不夠精細。也就是說，方差衡量的是樣本距離均值的期望。

它本來應該寫成：E|X - E(X)|。

但是由于式子當中存在絕對值，我們通常會對它平方，從而将絕對值消掉。寫成：

機器學習loss值對比圖的作用（機器學習方差）1

這裡的E表示期望，這是統計學當中的寫法，如果看不明白，我們也可以把式子展開寫成：

機器學習loss值對比圖的作用（機器學習方差）2

這裡的N表示的是樣本數量，X bar 是樣本的均值。Var是英文variance的縮寫，我們也可以寫成D(X)。

由于方差是通過平方計算得到的，我們也可以将它進行開方，得到标準差。根号D(X)，也可以寫成σ(X)。

方差的性質

關于方差有幾個著名的性質，如果X是變量，而C是常數。那麼：

機器學習loss值對比圖的作用（機器學習方差）3

也就是對于每一個變量都乘上一個常數，那麼整體的方差擴大C的平方倍。這個很好理解，因為樣本值擴大了C倍，由于我們在計算方差的時候用到了平方，那麼自然就是擴大了C的平方倍。我們利用上面展開的公式代入可以很容易得到證明。

下一個性質是：

機器學習loss值對比圖的作用（機器學習方差）4

也就是全體樣本加上一個常數，整體的方差不變。如果我們的樣本不是一個值，而是一個向量的話，那麼這個公式可以拓展成樣本加上一個常數向量，樣本的方差保持不變。這個也很好理解，樣本加上一個常數向量，相當于整體朝着向量的方向移動了一個距離，對于整體的分布并不會影響。

如果某個樣本X的方差為0，那麼說明樣本内隻有一個值。

下面一個性質稍微複雜一點：

機器學習loss值對比圖的作用（機器學習方差）5

也就是說方差等于樣本平方的期望減去樣本期望的平方，我們光從定義上很難得出這個結論，需要通過嚴謹的推導：

機器學習loss值對比圖的作用（機器學習方差）6

在有些時候，我們直接求解樣本的方差不太方便，而求解平方的期望很容易，這個時候我們可以考慮使用這個公式進行代換。

方差與協方差

方差我們一般不直接在機器學習當中進行使用，更多的時候是用在特征分析當中，查看特征的方差來感知它的離散情況，決定要不要對特征進行一些處理。因為對于一些模型來說，如果特征的方差過大，那麼模型可能很難收斂，或者是收斂的效果可能會受到影響。這個時候往往需要考慮使用一些方法對特征值進行标準化處理。

除了方差之外，還有一個類似的概念也經常被用到，就是用來衡量兩個變量之間相關性的協方差。

協方差的公式其實和方差也有脫不開的關系，我們先來簡單推導一下。

首先，我們來看一下D(X Y)，這裡X和Y是兩個變量，D(X Y)就表示X Y的方差，我們來看下D(X Y)和D(X)和D(Y)之間的關系。

我們可以來推導一下，根據方差的定義：

機器學習loss值對比圖的作用（機器學習方差）7

這裡的N是一個常量，我們可以忽略，隻用來看分子即可。我們把式子展開：

機器學習loss值對比圖的作用（機器學習方差）8

我們看下上面化簡之後的結果：

機器學習loss值對比圖的作用（機器學習方差）9

在這個式子當中D(X)， D(Y)都是固定的，并不會随XY是否相關而發生變化。但是後面一項不是，它和XY的相關性有關。

我們可以用這一項來反應X和Y之間的相關性，這就是協方差的公式：

機器學習loss值對比圖的作用（機器學習方差）10

所以協方差反應的不是變量的離散和分布情況，而是兩個變量之間的相關性。到這裡，我們可能還不太看得清楚，沒有關系，我們再對它做一個簡單的變形，将它除以兩者的标準差：

機器學習loss值對比圖的作用（機器學習方差）11

這個形式已經非常像是兩個向量夾角的餘弦值，它就是大名鼎鼎的皮爾遜值。皮爾遜值和餘弦值類似，可以反映兩個分布之間的相關性，如果p值大于0，說明兩組變量成正相關，否則則成負相關。我們可以通過計算證明p值是一個位于-1到1之間的數。

如果p值等于0，說明X和Y完全獨立，沒有任何相關性。如果p值等于1，說明可以找到相應的系數W和b使得Y = WX b。

結尾

在機器學習領域當中，計算兩組變量之間的相關性非常重要。因為本質上來機器學習的模型做的就是通過挖掘特征和預測值之間的相關性來完成預測，如果某一組特征和預測值之間是完全獨立的，那麼它對于模型來說就是無用的，無論我們選擇什麼樣的模型都是如此。

所以，我們經常會通過分析特征和label之間的皮爾遜值來衡量特征的重要程度，從而對特征進行取舍和再加工。如果單純隻看皮爾遜值和它的公式，很難完全理解和記住，而我們從方差入手，将整個鍊路梳理了一遍，則要容易得多，即使以後忘記了，也可以根據它們之間的關系重新推導。

今天的文章就到這裡，原創不易，關注我獲取更多文章。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活夢見農村什麼意思
夢見農村什麼意思?夢見海邊或是郊外的農村，預示努力度過短暫的困難時期後，将赢得激動人心的成功，我來為大家講解一下關于夢見農村什麼意思?跟着小編一起來看一看吧!夢見農村什麼意思夢見海邊或是郊外的農村，預示努力度過短暫的困難時期後，将赢得激動人... 2022-06-13
生活神回複各種套路
話說誰還沒有點脾氣呢大哥刷新了我對自行車的認知身價沒有幾十個都不敢用這樣的衛生間吧你倒是喝了再砸啊這不都浪費了嗎小夥子你選商品的方式還真的有點特别啊沒有對比就沒有傷害啊賭三包辣條你身邊應該沒有和我一樣重名的人遇到這樣的情況你會怎麼辦動動腦不... 2022-11-18
生活冰凍酸奶家常做法
冰凍酸奶家常做法?Nilla威化小餅幹，樹脂奶油，6湯匙，低脂酸奶，6湯匙，接下來我們就來聊聊關于冰凍酸奶家常做法?以下内容大家不妨參考一二希望能幫到您!冰凍酸奶家常做法Nilla威化小餅幹，樹脂奶油，6湯匙，低脂酸奶，6湯匙。取3張紙杯蛋... 2022-06-07
生活泡泡糖怎麼吹
泡泡糖怎麼吹?在吹泡泡之前先用牙齒和舌頭配合将泡泡糖在口中弄成餅狀，也就是弄扁平，不要太薄也不要太厚一兩厘米就行，接下來我們就來聊聊關于泡泡糖怎麼吹?以下内容大家不妨參考一二希望能幫到您!泡泡糖怎麼吹在吹泡泡之前先用牙齒和舌頭配合将泡泡糖在... 2022-06-04
生活馬化騰胡潤富豪榜
王健林家族2016年取代李嘉誠成華人首富；今年貝佐斯取代比爾·蓋茨成全球首富，蓋茨此前蟬聯三年2月28日，胡潤研究院發布《2018胡潤全球富豪榜》，共計來自68個國家，2157家企業的2694位十億美金富豪上榜，達曆史最高。上榜富豪的總财富... 2022-12-03
生活孔子所說的君子指什麼
孔子所說的君子指什麼?孔子在論語中多次提到君子，他所說的君子是指有學問有修養、品德高尚的人，今天小編就來聊一聊關于孔子所說的君子指什麼?接下來我們就一起去研究一下吧!孔子所說的君子指什麼孔子在論語中多次提到君子，他所說的君子是指有學問有修養... 2022-07-13
生活富貴樹養殖技巧
富貴樹養殖技巧?土壤要求：養殖富貴樹需要用養分充足、排水透氣的土壤，最好是選擇用黑土黑土的性狀好、肥力高，是一種十分适合富貴樹生長的土壤腐殖土加上河沙也是一種不錯的土壤選擇，其有機物質含量很高，并且其透氣性也較好，現在小編就來說說關于富貴樹... 2022-06-07
生活和楊幂一屆的四小花旦
要說現在娛樂圈裡最火的女明星是誰？那麼非楊幂莫屬。為什麼要這樣說呢？因為楊幂曾不止一次被評選為四小花旦，楊幂分别在2009年和2013年兩次被評為四小花旦，這真的是絕無僅有的。2009年騰訊網聯合業内百家主流媒體，由百萬民衆參與，近百名娛樂... 2023-01-03
生活 coloros13正式版和公開版
今天下午兩點，OPPO開發者大會正式開始，此次會議以“豐沛心靈一路同行”為主題，提出OPPO對未來生态的新思考。同時，本次的大會的第一款産品ColorOS13正式發布。ColorOS13系統變化比較大，首先介紹的是視覺動效。色彩上：從海平面... 2022-11-04
生活西瓜和枸杞能一起吃嗎
西瓜和枸杞能一起吃嗎?吃西瓜能和枸杞一起吃，兩者食物沒有相克，我來為大家講解一下關于西瓜和枸杞能一起吃嗎?跟着小編一起來看一看吧!西瓜和枸杞能一起吃嗎吃西瓜能和枸杞一起吃，兩者食物沒有相克。西瓜的功效和作用：降熱解暑降血壓通便抗衰老潤膚。适... 2022-08-14
生活傑森伯恩的電影叫什麼
傑克·吉倫哈爾将出演伯恩斯坦的傳記片1905電影網訊作為著名指揮家，倫納德·伯恩斯坦已經成為了美國古典音樂的象征，今年又恰逢這位音樂家一百周年的誕辰，因此關于他的傳記片接二連三地立項、籌備也就不足為奇了。據外媒報道，《真探》的導演凱瑞·福永... 2022-11-12
生活長大式追星是什麼意思
長大式追星是什麼意思?長大式追星，網絡流行語，指真的是長大了吧，現在看到漂亮妹妹、可愛弟弟想的都不是嫁給對方，而是能生個一樣的崽人生就圓滿了，可能知道，這輩子确實嫁不到了，接下來我們就來聊聊關于長大式追星是什麼意思?以下内容大家不妨參考一二... 2022-07-19
生活光遇滑冰場冥想位置怎麼去
光遇滑冰場冥想位置怎麼去?工具/原料：oppoAAndroid光遇0.7.4打開光遇遊戲，點擊進入霞谷，今天小編就來說說關于光遇滑冰場冥想位置怎麼去?下面更多詳細答案一起來看看吧!光遇滑冰場冥想位置怎麼去工具/原料：oppoAAndroid... 2022-06-29
生活俗語殃及池魚的前一句是什麼
俗語殃及池魚的前一句是什麼?“殃及池魚”的前一句是“城門失火”釋義：城門失火，大家都到護城河取水，水用完了，魚也死了比喻因受連累而遭到損失或禍害，我來為大家講解一下關于俗語殃及池魚的前一句是什麼?跟着小編一起來看一看吧!俗語殃及池魚的前一句... 2022-06-21
生活長江師範學院是所什麼樣的院校
哈喽哈喽大家好，很開心又跟大家見面了，我是你們的老朋友油墨，今天繼續跟大家探讨江蘇省的高校—三江學院！校徽三江學院于1992年始建，位于江蘇省南京市，是經教育部批準的全日制普通本科高校。校門三江學院是由東南大學、南京大學等高校的四位退休和即... 2023-03-27
生活緬甸孔雀龜飼養方法
緬甸孔雀龜飼養方法?養殖水質水質問題老調重彈，但是對于孔雀龜來說，水質的控制需要有一點微妙的技巧首先，水體要适中，一隻體中能夠約800克的孔雀龜需要大約8-10升的水體其次，投喂量要少，産生的微量代謝物要讓水的自淨能力能夠消化，并形成透明的... 2022-07-01
生活親密關系一直是探讨的話題
作者：懷左小穎來源:懷左同學前段時間，我送了朋友一套《毛選》，結果朋友順手給了我一本《被讨厭的勇氣》。其實我以前看過那本書，還能清楚記得裡面的一個重要觀點：人的大多數煩惱，都來源于人際關系。記得當時我看的時候，就這個觀點，還反複琢磨了很多天... 2022-12-04
生活侬的意思
侬的意思?古吳語：“侬”是“我”的意思，多見于舊詩文，古吳語（南朝以前）以“我侬”或“阿侬”表示“我”“人”字讀作“侬”，李白“人道橫江好，侬道橫江惡”的“侬”表示人，下面我們就來說一說關于侬的意思?我們一起去了解并探讨一下這個問題吧!侬的... 2022-06-03
生活耳屎怎麼清理
耳屎怎麼清理?對于耳屎的清理，要區别兩種不同的情況一種的是散在的點片狀或者是顆粒狀的耳屎這種耳屎不論它是潮濕，或者是幹燥的，一般不需要清理隻有對那些團塊狀、硬質狀、堵塞外耳道的耳屎，需要進行清理，下面我們就來聊聊關于耳屎怎麼清理?接下來我們... 2022-06-03
生活釣鯉魚口訣學會你也是高手
釣鯉魚口訣學會你也是高手?不可否認，釣鯉魚确實比釣鲫魚難得多，不光這個夏季，在春季秋季也一樣可不少釣魚人都覺得，越難釣的魚種就越有挑戰性，因為野生鯉魚勁大，其實不管誰說鯉魚很難釣，隻要想到遛魚時的場景，再難釣也得釣這個夏天隻要擁有牢記這二十... 2022-10-17
生活蒜香鹧鸪腿
蒜香鹧鸪腿?鹧鸪腿12隻，秘制蒜香粉适量，姜、蔥、鹽、味精、糖、酒、錫紙12小張，今天小編就來說說關于蒜香鹧鸪腿?下面更多詳細答案一起來看看吧!蒜香鹧鸪腿鹧鸪腿12隻，秘制蒜香粉适量，姜、蔥、鹽、味精、糖、酒、錫紙12小張。将鹧鸪腿下料腌制... 2022-05-31
生活漯河市中考成績表
漯河市中考成績表?來源：【漯河日報-漯河名城網】，我來為大家科普一下關于漯河市中考成績表?以下内容希望對你有幫助!漯河市中考成績表來源：【漯河日報-漯河名城網】6月29日，我市召開市區普通高中招生評卷新聞發布會，通報2022年我市市區中招評... 2023-02-28
生活出伏下雨意味着什麼
導讀：16日入伏，為何說今年是“母伏”，入伏下雨好不好？看諺語咋說的之前還在網上聽到一些專家說今年是“無夏之年”，如今卻還沒有入伏就已經熱得受不了了。正所謂“夏至三更數頭伏”，如今終于要迎來“三伏天”了，在7月16日就正式“入伏”了。那為何... 2022-12-23
生活芝士莓莓的家常做法
芝士莓莓的家常做法?用礦泉水煮開泡茉莉綠茶茶包泡5-10分鐘即可将茶包拿出，放入冰箱冷藏，我來為大家講解一下關于芝士莓莓的家常做法?跟着小編一起來看一看吧!芝士莓莓的家常做法用礦泉水煮開泡茉莉綠茶茶包。泡5-10分鐘即可将茶包拿出，放入冰箱... 2022-08-20
生活鐵路暑運發送旅客7.35億人次
鐵路暑運發送旅客7.35億人次?來源：人民網原創稿人民網北京8月31日電(記者王連香)據中國鐵路北京局集團有限公司(以下簡稱中國鐵路北京局)的消息，自7月1日起至8月31日止，為期62天的2022年鐵路暑期運輸圓滿收官暑運期間，中國鐵路北京... 2022-10-30
生活怎麼樣處理木頭蛀蟲
怎麼樣處理木頭蛀蟲?用火水和微量殺蟲水調勻，滴入蛀孔中，也能殺滅蛀蟲，下面我們就來聊聊關于怎麼樣處理木頭蛀蟲?接下來我們就一起去了解一下吧!怎麼樣處理木頭蛀蟲用火水和微量殺蟲水調勻，滴入蛀孔中，也能殺滅蛀蟲。用尖辣椒或花椒适量，搗碎成末，塞... 2022-06-18
生活退稅金額多久能到賬
退稅金額多久能到賬?個人所得稅的退稅時間通常情況下是10天左右，但最遲也有可能等一個月才能收到退款，下面我們就來聊聊關于退稅金額多久能到賬?接下來我們就一起去了解一下吧!退稅金額多久能到賬個人所得稅的退稅時間通常情況下是10天左右，但最遲也... 2022-07-16
生活自制肉丸子怎麼做
自制肉丸子怎麼做?食材：碎肉适量、雞蛋1個、鹽、姜粉、醬油、辣椒面、面粉适量，現在小編就來說說關于自制肉丸子怎麼做?下面内容希望能幫助到你，我們來一起看看吧!自制肉丸子怎麼做食材：碎肉适量、雞蛋1個、鹽、姜粉、醬油、辣椒面、面粉适量。鮮肉剁... 2022-05-31
生活這是一個被豬給拱過的白菜
一哥們說，他初中老師總是給他安排漂亮女生做同桌，他内心還挺感謝老師的，結果畢業的時候，老師才告訴他原因，說是那樣能防止漂亮女生早戀。。。這是一般的豬在拱白菜班上老師在訓話：沒人笑你們笨，都是笑你們懶，要知道笨鳥先飛。。。這時一女同學插話：老... 2022-11-30
生活鐵皮石斛什麼人不能吃
鐵皮石斛什麼人不能吃?兒童、孕婦應在醫師指導下服用感冒發熱的病人不宜使用對鐵皮石斛過敏者禁用,過敏體質者慎用，接下來我們就來聊聊關于鐵皮石斛什麼人不能吃?以下内容大家不妨參考一二希望能幫到您!鐵皮石斛什麼人不能吃兒童、孕婦應在醫師指導下服用... 2022-06-18

tft每日頭條

> 生活

> 機器學習loss值對比圖的作用

機器學習loss值對比圖的作用

相关生活资讯推荐

热门生活资讯推荐

网友关注