數據偏離真值的離散程度-tft每日頭條

數據偏離真值的離散程度

生活更新时间:2025-07-27 18:39:03

本文是吳恩達《機器學習》視頻筆記第68篇，對應第6周第10個視頻。

“Machine Learning System Design:——Error metrics for skewed classes”

數據偏離真值的離散程度（偏斜類的誤差度量）1

前面兩個小節講了怎樣快速用簡單算法将流程跑通，給出了基本的誤差分析方法。這一節講偏斜類問題。

偏斜類

所謂的偏斜類（Skewed Class）的問題，對于二元分類來說，其實就是一種分類的數據量遠遠大于另外一種分類。

以是否惡性腫瘤（癌症）的分類為例，我們希望能根據病人的一些特征判斷病人是否患有癌症（y=1表示有癌症，y=0表示沒有癌症）。

我們用邏輯回歸算法來解決問題，發現在測試集有99%的正确率，這個結果看上去很完美。但是，你要知道患有癌症的畢竟是少數，可能在我們的測試集中隻有0.5%的人真的患有癌症。

數據偏離真值的離散程度（偏斜類的誤差度量）2

這樣的話，你就知道我們的算法有多離譜了。因為，如果我們不管三七二十一全部給預測為y=0（沒有癌症），那也隻有0.5%的錯誤。

數據偏離真值的離散程度（偏斜類的誤差度量）3

像上面這種某一種分類占比特别大的情況，被稱為偏斜類。很明顯，對于偏斜類的誤差度量需要優化。

偏斜類的誤差度量

前面癌症判斷那個例子中，假如我們采用了一些辦法将算法從99.2%的準确率提升到99.5%的準确率，那我們對算法的這些改進是否有效呢？這是比較難判斷的。

當我們遇到偏斜類時，經常使用查準率（Precision）和召回率（recall）的概念。這兩個概念适用于二分類問題。

對于一個二分類問題，預測結果和實際結果有四種組合。

實際為1，預測為1；True positive, TP
實際為0，預測為1；False positive, FP
實際為1，預測為0；False negative, FN
實際為0，預測為0；True negative, TN

T開頭表示預測正确（本來為真、預測為真TP；本來為假、預測為假TN），F開頭表示預測錯誤（本來為假，預測為真FP，本例為真，預測為假FN）。

數據偏離真值的離散程度（偏斜類的誤差度量）4

查準率Precision的意思是，TP/(TP FP)。就是你所有預測為真那些樣本中，預測正确的樣本的占比。癌症那個例子就是，算法認為的所有癌症患者中真正的癌症患者占比是多少。查準率越高越好。

召回率Recall的意思是，TP/(TP FN)。這個意思是，你預測為真并且正确的數量在實際為真的數量中的占比。癌症的那個例子就是，實際患有癌症的患者被算法成功篩查出來的比例。召回率當然是越高越好。

回到前面的例子再來看看，如果我們不管三七二十一，都認為患者沒有癌症，準确率99.5%。那這樣做的召回率就是0，當然這個算法就毫無意義了。

這樣，如果一個算法同時有較好的查準率和召回率，那這個算法就還是不錯的。注意：使用查準率和召回率的時候，我們讓那個出現比較少的情況為1（y=1出現較少）。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活預防酒醉傷肝髒，小小妙招先行
解酒的最快方法是什麼？告訴你，吃下面的這些水果就能夠解酒。當我們在酒店用餐接近尾聲時，通常會遇到這樣的情境：服務員會給就餐者端上一碟水果，那就是讓客人用來解酒醒酒的。這可是解酒的最快方法哦！預防酒醉傷肝髒，小小妙招先行酒精一般在胃裡就會被血液帶進循環系統，當肝髒解酒速度弱于酒精攝入速度的時候，血液酒... 2024-01-06
生活不能用舊衣服擦家具
擦拭家具時，不要用粗布或者不再穿的舊衣服當抹布。最好用毛巾、棉布、棉織品或者法蘭絨布等吸水性好的布料來擦家具。粗布、有線頭的布或有縫線、鈕扣等會引起家具表面刮傷的舊衣服，就應盡量避免使用。不要用幹抹布擦拭家具表面的灰塵。灰塵是由纖維、砂土和矽土構成的，很多人習慣用幹的抹布來清潔擦拭家具表面。其實這些... 2024-01-06
生活吸盤挂鈎總是掉怎麼辦？生活妙招教給你
吸盤挂鈎總是掉怎麼辦？生活妙招教給你吸盤挂鈎總是掉怎麼辦？1、水：最常用的方法是在吸盤挂鈎粘牆面之前先沾點水在挂鈎背面上，然後迅速粘到牆面上。這種方式雖然會比沒有沾水好一點，但效果仍然不是很理想。2、肥皂水：需要效果更好的可以用肥皂水，同樣也是把肥皂水塗抹在吸盤挂鈎背面，然後迅速粘到牆面上，待幹透了... 2024-01-06
生活有機蔬菜标準
現在随着生活的質量越來越好，很多人對于生活的追求是越來越高的。現在很多人都希望可以吃到有機蔬菜，以為内有機蔬菜的營養更高，而且更加有營養價值，更加健康。說了有機蔬菜那麼多的好處，那麼有機蔬菜的一個标準是什麼呢，估計這個是沒有多少人知道的，隻是知道有機蔬菜好。有機蔬菜好在哪裡這個大家要知道，有機蔬菜的... 2024-01-06
生活馬桶清理養護需留意莫讓其成為疾病之源
馬桶可以說是人類最親密的家居夥伴之一，人們幾乎每天都要使用，但正因為如此親密的關系，使用稍不留意，它也可能成為疾病之源。清理養護需留意，莫讓馬桶成為疾病之源馬桶圈細菌多要重點清潔調查發現，32%的馬桶上有痢疾杆菌，其中一種名為'宋内'的痢疾杆菌在馬桶圈上存活的時間長達17天；另一份實... 2024-01-06
生活白色絲綢泛黃怎麼辦？白絲綢泛黃的去除
1、局部的黃色汗漬，可用鮮冬瓜片抹拭污處，冬瓜汁液可将黃漬除去，然後用清水漂淨。2、大面積泛黃的衣物，可浸在淘洗大米的淘米水中，每天換一次淘米水，大約3天後，黃漬即可脫淨，最後用清水漂洗幹淨即可。注意不能帶色的淘米水浸泡，防止着色。3、泛黃的絲綢衣物還可以用檸檬汁漂洗，或用淡檸檬酸漂洗，都可将黃漬去... 2024-01-06
生活海南特色水果
水果是很多人最愛，水果的種類比較好多，在對水果選擇上，都是可以根據自己的喜愛進行，常見的水果就是蘋果，這類水果對人體各方面，都是有着很好的幫助，而且它對減肥上，效果也是非常不錯，那海南特色水果都有什麼呢，海南在水果上，也是有着很多不錯之選。那在吃海南水果的時候，也是要适量選擇，這樣對水果的營養元素，... 2024-01-06
生活怎樣正确清洗内衣内褲？
有時候花了不少錢買的文胸、内褲。但洗過以後出現變形，或出現别的問題。再穿起來就不舒服了。花的錢是不是很心痛呢？下面作文庫知識百科整理的怎麼洗内衣和内褲，以供大家參考。1、盡量用手洗内衣内褲、不用洗衣機、甩幹機盡量用手洗，不用洗衣機，甩幹機，否則文胸肩帶或其他細部分易受拉扯，而且内衣上細緻的蕾絲也容易... 2024-01-06
生活室内套裝門的保養小常識
套裝門是現代家居裝飾中的一種新型潮流裝飾室内門，其相對于其他的室内門而言最突出的優勢特點便是其一般都是将門套、門框、門扇等等各個部件進行成套的銷售，這樣給消費者們也帶來了相當方便的安裝。然而對于室内的套裝門産品，使用較頻繁，也容易被損壞，消費者在使用過程中如何對其進行保養？平時若能多動一些腦筋，家居... 2024-01-06
生活布藝沙發清洗方法詳解
布藝沙發清洗方法詳解布藝沙發清洗方法詳解1、一般清洗流程：可以選用專用的布藝清潔劑。首先用幹淨的白布蘸上少量清潔劑，在弄髒了的地方反複擦拭，直到污漬去掉。為免留下印迹，最好是從污漬的外圍抹起。切忌大量用水擦洗，以免水滲入沙發的内層，造成沙發裡邊框受潮、變形、沙發布縮水，影響沙發的整體外觀造型。2、有... 2024-01-06
生活三伏天用什麼排濕氣寒氣最好？
01伏天去濕氣寒氣的辦法：1、少吃甜、膩的食物。如果你身體有濕氣少吃甜膩食物，因為甜膩容易轉化為濕氣。2、别吃生冷食物。3、别喝酒。4、可以多吃姜去寒濕。5、可以多吃綠豆、西瓜、扁豆來去濕寒氣。三伏天是一年中最熱的時候,這段時間也是冬病夏治的好時候,非常适合排除體内的寒濕，伏天去濕氣寒氣的辦法：1、... 2024-01-06
生活圍棋怎麼下
圍棋現在比較流行的一種棋牌類型，主要是取決于中國，格狀的棋盤以及黑白二子去進行對弈，同時進行以為地的大小來決定勝負，中國的時候對于圍棋是非常講究的，是一樣樣精通的這樣的說法，是目前世界上最複雜的遊戲，不僅動腦，需要很多講究很多的戰術，而且需要非常透徹地理解圍棋，那麼很多人那堆圍棋怎麼進行下的也是不清... 2024-01-06
生活貼金家具保養
對于金箔，隻能談及護理，它不像地闆、瓷磚或其它的給予打蠟進行保養工作，所以隻能在日常生活中盡量減少磕碰或間接的人為破壞。貼金部分是由厚度為0.1微米左右的24K金和一種特殊的5種成份合成的溶液，經人工塗描于實木雕刻而成的飾花上，整個過程需6小時，貼好金箔48小時後方可達到滿意的硬度，其貼金表層平整光... 2024-01-06
生活日常床墊保養好優質睡眠不打折
睡眠是人健康的保證，而睡眠質量的好壞直接體現出身體的好壞，對此很多家庭不惜耗費大量資金選購很好的床墊、床單等床具，希望得到一個優質的睡眠環境，提高睡眠質量。但是花了大價錢購買來的床墊卻不經常打理，這樣的方式不但不會得到優質的睡眠還會對睡眠質量産生負面影響。下面就和小編一起來看看日常床墊保養的方法吧。... 2024-01-06
生活養護小訣竅巧妙保養各種廚房台面
家居生活中，櫥櫃的使用頻率比家具還要高。購買定制櫥櫃的消費者經常反映，櫥櫃台面容易接觸污漬油漬，且部分櫥櫃台面的材質在遇熱或碰撞中容易變形或破裂。對于這種必不可少的廚房家具，日常生活中需要恰當地使用和保養。養護小訣竅巧妙保養各種廚房台面那麼，各種廚房台面要如何保養呢？人造石台面：避免受力不均優點：人... 2024-01-06
生活新媒體運營是做什麼？
新媒體運營，是通過現代化移動互聯網手段，通過利用各短視頻平台及内容平台進行産品宣傳、推廣、産品營銷的一系列手段。通過策劃品牌相關的優質、高度傳播性的内容和線上活動，向客戶廣泛或者精準推送消息，提高參與度、知名度，從而充分利用粉絲經濟，達到相應營銷目的。不管是創業做個人自媒體還是到企業内就職，新媒體運... 2024-01-06
生活菠菜水使黑色針織衣物增黑
黑色的針織衣物可是很多朋友衣櫃中最常見的。可是穿久後，顔色就沒那麼深了，這裡告訴你一個讓黑色針織衣物增黑的竅門。試試它吧——菠菜水！就是燙過菠菜剩下的水。用一條黑色針織褲做個實驗。先将黑褲子放入盆中，然後将菠菜水倒入盆中，浸泡三分鐘，然後用手将褲子揉洗一會，再浸泡三分鐘，然後... 2024-01-06
生活地漏反味怎麼辦？地漏如何防臭
地漏反味怎麼辦？1、及時的往地漏中灌水，使地漏中的水封保持，并時常更換;2、盡管自封地漏是地漏未來必然的發展趨勢，可是就目前實際情況而言，其防臭效果還不如水封地漏穩定，因此還是盡量選擇水封地漏。3、用塑料袋裝水。可以拿一個密封好的方便袋，袋子裡裝上清水把口系好，然後把裝水的方便袋放到地漏口上面，用的... 2024-01-06
生活内褲正面曬還是反面曬好
内褲者，又稱底褲，遮羞護私之衣片。無論三角、四角、镂空、線式……不過為輕薄一布也。然，這小小“布片”衛生與否卻與健康有大關系！據統計，六成以上的婦科炎症就是這内褲“惹”來的！那麼，健康用内褲有什麼講究呢？本期寡人就以“如何曬内褲更健康”來糾結一哈子……曬内褲最好是做“日光浴”所謂“曬内褲”，就是要讓... 2024-01-06
生活實用家居清潔技巧：蘸牛奶擦木制家具
實用家居清潔技巧：蘸牛奶擦木制家具實用家居清潔技巧1、用鹽去地毯上的湯汁有小孩的家庭，地毯上常常滴有湯汁，千萬不能用濕布去擦。應先後用潔淨的幹布或手巾吸幹水分，然後在污漬處撒些食鹽，待鹽面滲入吸收後，用吸塵器将鹽吸走，再用刷子整平地毯即可。2、蘸牛奶擦木制家具取一塊幹淨的抹布在過期不能飲用的牛奶裡浸... 2024-01-06
生活大型床罩與被套洗滌方法
大型床罩與被套洗滌方法：如果并不肯定床罩與被套可用洗衣機洗，最好的方法是幹洗，以免縮水。但必須先行過水及脫水，這樣便能清除大部分塵垢。清洗後，保持微濕，待晾幹後，便可恢複原狀。 2024-01-06
生活田螺吃什麼
田螺含有蛋白質和鈣，而且做成麻辣田螺的話，口味也是非常棒的，因此很多朋友都非常喜歡吃田螺。但是有一些報道說田螺都是在污水中長大的，如果是食用之後會給身體帶來一定的危害，因此很多朋友都想要好好的了解一下田螺吃什麼，看看它是否真的是不能吃的食物。想要知道田螺吃什麼，就要知道它的生活環境，一般田螺都是生存... 2024-01-06
生活二月二的風俗有哪些？
南方部分地區有祭社習俗，即慶祝土地公生日；北方則有吃豬頭肉、理發（剪“龍頭”）的習俗。根據民間傳說，此為主管雲雨的龍王擡頭之日，意味着在此之後雨水會漸多；民間亦有“二月二，龍擡頭”的諺語，表示春季來臨，萬物複蘇，蟄龍開始活動，預示一年的農事活動即将開始。龍擡頭（農曆二月二），又稱“春耕節”“農事節”... 2024-01-06
生活衛生潔具選購與保養常識
衛生潔具是現代建築中室内配套不可缺少的組成部分。既要滿足功能要求，又要考慮節能、節水的新階段。衛生器具的材質，使用最多的是陶瓷、搪瓷生鐵、搪瓷鋼闆，還有水磨石等。随着建材技術的發展，國内外已相繼推出玻璃鋼、人造大理石、人造瑪瑙、不鏽鋼等新材料。衛生潔具五金配件的加工技術，也由一般的鍍鉻處理，發展到用... 2024-01-06
生活開關、插座、燈罩清潔
電燈開關上留下手印痕迹，用橡皮一擦，即可幹淨如新。插座上如果沾染了污垢，可先拔下電源，然後用軟布蘸少許去污粉擦拭。清潔帶有皺紋的布制燈罩時，用一種毛頭較軟的牙刷做工具，不易傷燈罩。清潔用丙烯制的燈罩，可抹上洗滌劑，再用水洗去洗滌劑，然後擦幹。普通燈泡用鹽水擦拭即可。 2024-01-06
生活各種清潔技巧與你分享
各種清潔技巧與你分享各種清潔技巧與你分享1、柚木地闆一旦被水浸，會出現膨脹開裂及彎曲現象，清潔時候，隻需用較濕的抹布擦一下，然後即可用布抹幹就行了，如要保持地闆光亮，可定期打蠟。2、水泥及磨石地闆，可用尼龍刷子沾上清潔劑或肥皂水刷一遍即可。3、瓷磚地打蠟便可保持光亮，但用水清潔後要确保地面幹爽，以免... 2024-01-06
生活窗幔洗滌分質地蕩滌建議“對号入座”
窗幔就是窗戶裡面一般用布做的一個幔子，在窗戶或者窗簾上面的一節，窗飾的一種，主要起到裝飾美化窗簾的作用。一般與窗簾一體，可以是固定的褶皺幔，也可以是單獨簡約活動幔，都是常見美化窗簾的附屬品。窗幔洗滌分質地蕩滌建議“對号入座”不同質地的窗幔洗滌方法不同，蕩滌時最好能&ldquo... 2024-01-06
生活什麼是政治條件兵？
政治條件兵就是政治條件較高，現實表現良好，本人及親屬無違法犯罪行為，個人形象較好的兵種。比如到北京衛戍區，在中央，軍隊高層領導身邊和重要部門當警衛人員等，對政治條件要求更高。政治條件兵就是政治條件較高，現實表現良好，本人及親屬無違法犯罪行為，個人形象較好的兵種。政治兵在新兵連的訓練和普通士兵一樣，但... 2024-01-06
生活打麻将有哪些技巧
打麻将是一種娛樂大衆的活動，很多朋友都會，隻是每個地方的方法略有不同，但是規則大緻都是一樣的，很多人都會在休息的時候約上好朋友或者家人一起在家玩玩麻将，不僅能讓家人朋友團聚，親近，也會在相聚的同時多了很多的樂趣。在娛樂時候，很多人就會想動動腦子，了解一下打麻将的技巧，讓這個遊戲更加的豐富一下，還能鍛... 2024-01-06
生活科目二s彎技巧看點位置有哪些？
保持全程一擋行駛，打方向不可過急；進入彎道後盡量走大圈，駛向右彎道時，右輪緊貼着右邊路邊緣線；處于彎道時，通過轉向盤讓汽車内側車蓋頭上的小後視鏡始終處于外側白線邊緣；根據路彎的特點和後輪半徑及時調整方向。曲線行駛的訓練目的是培養機動車駕駛人轉向的運用及對車輪軌迹運行的掌握技能。了解曲線行駛的路線圖是... 2024-01-06

tft每日頭條

> 生活

> 數據偏離真值的離散程度

數據偏離真值的離散程度

相关生活资讯推荐

热门生活资讯推荐

网友关注