不平衡值計算-tft每日頭條

不平衡值計算

生活更新时间:2025-08-16 01:16:36

分類器的好壞取決于用來評價它的度量指标。如果選擇了錯誤的度量來評估模型，那麼很可能選擇了一個表現糟糕的模型，或者更壞的情況下，對模型的預期性能産生了誤導。

在應用機器學習中，選擇一個合适的度量通常具有挑戰性，對于不平衡分類問題尤其困難。首先，因為廣泛使用的大多數指标都假定類分布是均衡的，而不平衡分類，通常不是所有的類(因此也不是所有的預測誤差)都是相等的。

在本教程中，你将學習用于不平衡分類的指标。

教程概述

本教程分為三個部分:

1.評估指标的挑戰
2.分類器評價指标的分類
3.如何選擇評估指标

不平衡值計算（不平衡分類的評估指标）1

評估指标的挑戰

評估指标量化預測模型的性能。這通常涉及到在數據集的訓練集上訓練模型，使用模型對測試數據集進行預測，然後将預測值與測試數據集的實際值進行比較。

對于分類問題，評估指标包括比較實際的類标簽和預測的類标簽，或者解釋類标簽的預測概率。

選擇一個模型，是由評價指标指導的一個搜索問題。用不同的模型進行實驗，每個實驗的結果都用一個度量值來量化。

有一些标準指标被廣泛用于評估分類預測模型，如分類Accuracy或分類error。标準度量在大多數問題上都能很好地工作，這也是它們被廣泛采用的原因。但是所有的度量指标都對問題或者問題中什麼是重要的做出假設。因此，必須選擇一個你認為最能抓住問題重要性的評估指标，這使得選擇模型評估度量指标具有挑戰性。

當類分布出現偏斜時，這一挑戰變得更加困難。因為，當類不平衡或嚴重不平衡時，如少數類與多數類的比例為1:100或1:1000時，許多标準指标就會變得不可靠，甚至具有誤導性。例如，對一個嚴重不平衡的分類問題采用分類準确性作為評估指标可能會産生危險的誤導。

重要的是，當使用不平衡分類時，通常需要不同的評估指标。标準的評價指标一樣假定所有的類同等重要，不平衡分類問題通常認為少數類的分類錯誤比多數類的分類錯誤更重要。這樣的性能指标可能需要關注少數類，這就具有挑戰性，因為少數類，我們缺乏樣本訓練一個有效的模型。

分類器評價指标的分類

在評估分類器模型時，有數十種度量标準可供選擇，如果考慮到學者們提出的所有度量标準的熱門指标，則可能有數百種。

為了掌握可以選擇的度量标準，我們将使用Cesar Ferri等人在他們2008年的論文《分類性能度量的實驗比較》中提出的分類法。2013年出版的《不平衡學習》一書也采用了這種方法，我認為它很有用。

我們可以将評估指标分為三個有用的組:

阈值指标（Threshold Metrics）
排名指标（Ranking Metrics）
概率指标（Probability Metrics）

這種劃分很有用，因為從業人員用于分類器(特别是不平衡分類)的指标非常适合分類法。

1).不平衡分類的阈值指标

阈值指标是量化分類預測誤差的指标。也就是說，它們被設計用來總結在測試數據集中預測标簽與實際标簽不匹配時的占比或比率。

也許最廣泛使用的阈值度量是分類準确度（accuracy）

Accuracy = Correct Predictions / Total Predictions

盡管被廣泛使用，但其Accuracy幾乎普遍不适合用于不平衡分類。原因是，隻有預測多數類的無效模型也能夠獲得較高的準确性(或低誤差)。

對于不平衡分類問題，多數類通常被稱為陰性樣本，少數類通常被稱為陽性樣本。

Majority Class: Negative outcome, class 0.
Minority Class: Positive outcome, class 1.

對于二分類問題，使用混淆矩陣中的術語可以更好地理解大多數阈值指标。但這并不意味着指标隻局限于在二元分類中使用。混淆矩陣不僅提供了對預測模型性能更深入的了解，而且還提供了對哪些類的預測是正确的，哪些是錯誤的，以及發生了哪些類型的錯誤。在這種類型的混淆矩陣中，表中的每個單元格都有一個特定且易于理解的名稱，總結如下:

| Positive Prediction | Negative Prediction

Positive Class | True Positive (TP) | False Negative (FN)

Negative Class | False Positive (FP) | True Negative (TN)

有兩組指标可能對不平衡分類有用，因為它們專注于一個類别。它們是Sensitivity-Specificity和Precision-recall。

Sensitivity-Specificity 指标

Sensitivity是指真陽率，并總結了陽性類的預測效果。

Sensitivity = True Positive / (True Positive False Negative)

特異性是敏感性的補充，或真陰性率，并總結陰性類的預測效果。

Specificity = True Negative / (False Positive True Negative)

對于不平衡分類，敏感性可能比特異性更有趣。敏感性和特異性可以結合成一個單一的分數，平衡這兩個問題，稱為幾何平均數或G-mean。

G-Mean = sqrt(Sensitivity * Specificity)

Precision-Recall指标

precision概括了模型預測陽性（正類）樣本中屬于正類的占比。

Recall是指真陽率，計算同sensitivity。

精确度和召回率可以合并成一個分數，以平衡這兩方面的問題，稱為F Score。

F Score = (2 * Precision * Recall) / (Precision Recall)

F Score是一種常用的不平衡分類指标。

其他的阈值指标

上面介紹的可能是最受歡迎的指标，盡管還存在其他許多其他指标。其他的一些指标包括Kappa、宏觀平均精度、平均類别加權精度、優化精度、調整的幾何平均值、平衡精度等等。

2）不平衡分類的排名指标

排名指标更關注通過分類器分離類的有效性來評估分類器。這些度量标準要求分類器預測一個分數或類别的概率。

基于這個分數，可以使用不同的阈值來測試分類器的有效性。那些在阈值範圍内保持良好得分的模型将具有良好的類分離有效性，并将有更高的排名。

最常用的排名指标是ROC曲線。ROC是一個首字母縮略詞，意思是受試者的工作特征。ROC曲線是一個診斷圖，通過計算模型在不同阈值下的一組預測的假陽率和真陽率來總結模型的行為。

不平衡值計算（不平衡分類的評估指标）2

真陽率是召回率或敏感度。

True Positive Rate= true positive / (true positive false negative)

假陽率為:

False Positive Rate = False Positive / (False Positive True Negative)

每個阈值是圖上的一個點，這些點連接起來形成一條曲線。無效的分類器(例如，在所有阈值下預測為多數類)由左下角到右上角的對角線表示。這條線以下的任何點都無效分類器表現更糟。一個完美的模型是圖上右上角的一個點。

ROC曲線下的面積（ROC-AUC）可以計算出來，并提供一個單一的得分來總結整個圖，可以用來比較不同的模型。無效的分類器ROC-AUC的得分是0.5，而一個完美的分類器AUC得分為1。

ROC曲線和ROC AUC雖然總體上是有效的，但在嚴重的類失衡情況下，特别是當少數類中的樣本數量較少時，ROC曲線和ROC AUC可能有點樂觀。

不平衡值計算（不平衡分類的評估指标）3

ROC曲線的另一種替代是（PR）精确召回曲線，盡管它關注的是分類器在少數類上的性能。

同樣，模型對一組預測使用不同的阈值，在這種情況下，計算精度和召回。這些點形成一條曲線，在一系列不同的阈值下表現更好的分類器的排名将會更高。

無效分類器将是圖上的一條水平線，其精度與數據集中陽性樣本的數量成比例。對于一個平衡的數據集，這将是0.5。一個完美的分類器由右上角的一個點表示。

與ROC曲線一樣，在評估單個分類器時，準确率召回曲線是一個有用的診斷工具，但在比較分類器時具有挑戰性。和ROC AUC一樣，我們可以計算曲線下的面積作為一個分數，并使用這個分數來比較分類器。在這種情況下，對少數類的關注使得精确召回AUC對于不平衡分類問題更有用。

PR AUC =曲線下的精确召回面積。

3）不平衡分類的概率指标

概率指标是專門設計來量化分類器預測中的不确定性。當我們對不正确和正确的标簽預測不太感興趣，而對模型預測的不确定性更感興趣，并懲罰那些非常确定的錯誤預測時，這些方法很有用。根據預測的概率評估模型需要對概率進行校準。

一些分類器使用概率框架進行訓練，例如最大似然估計，這意味着它們的概率已經校準。邏輯回歸就是一個例子。許多非線性分類器不是在概率框架下訓練的，因此在通過概率指标進行評估之前，它們的概率需要根據數據集進行校準。例如支持向量機和k近鄰。

評估預測概率的最常見指标是二分類的對數損失(或負對數似然)，或更普遍地被稱為交叉熵。

對于一個二分類數據集，其期望值為y，預測值為yhat，計算方法如下:

logLoss = -((1 - y) * log(1 - yhat) y * log(yhat))

通過簡單的相加，分數可以推廣到多個類;例如:

log(yhat_c) = -(sum c in yhat_c * log(yhat_c))

該分數總結了兩個概率分布之間的平均差異。完美分類器的對數損失為0.0，較差的值為正，最大可以到無窮。

如何選擇評估指标

有大量的模型評估指标可供選擇。

考慮到選擇一個評估指标是如此重要，并且有幾十個甚至上百個指标可供選擇，你應該怎麼做呢?

也許最好的方法是與項目負責人溝通，并找出一個模型或一組預測最重要的内容。然後選擇一些似乎可以捕獲重要内容的指标，然後用不同的場景測試指标。

另一種方法可能是進行文獻回顧，并發現在處理相同類型問題的其他學者最常用的度量标準。這通常很有見地，但需要注意的是，有些研究領域可能會陷入群體思維，并采用一種可能非常适合大規模比較大量模型的度量标準，但在實踐中卻很難進行模型選擇。

還是不知道?

以下是一些建議:

你在預測概率嗎?
需要類标簽嗎?
正類（positive class）更重要嗎?
使用Precision-Recall AUC
兩個類同樣重要?
使用ROC AUC
是需要類的概率嗎?
使用Bier Score和Bier Skill Score
你在預測類标簽嗎?
正類更重要嗎?
假陰性和假陽性同樣重要嗎?
使用F1-Measure
假陰性更重要嗎?
使用F2-Measure
假陽性更重要嗎?
使用F0.5-Measure
這兩個類同樣重要嗎?
多數類占比小于80%-90%?
使用Accuracy
多數類占比大于等于80%-90%?
使用G-Mean

我們可以把這些建議轉化為有用的圖表。

不平衡值計算（不平衡分類的評估指标）4

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活院子裡怎麼種菜
1、劃出一塊地出來。假如想要在院子裡面種植蔬菜，首先就是要先在院子裡劃一塊地出來，用圍欄将它圍起來，也可以用薄紗圍起來，搭建一個小型的蔬菜棚子，這樣就是防止特殊天氣對蔬菜造成不必要的傷害。2、盆栽式種植。院子裡種菜還可以選擇盆栽式的種植辦法，對于不同品種的蔬菜使用不同的盆栽方式進行種植，這種方法也比... 2023-07-19
生活晾衣架安裝尺寸？晾衣架安裝正确安裝方...
晾衣架對我們來說是一點也不陌生的吧，誰家又沒有晾衣架呢？它是日常晾衣的必要品，随着技術的發展晾衣架的款式種類以及尺寸也不斷發生着變化，如今市面上的晾衣架産品技術也相對成熟了，那麼晾衣架安裝尺寸有哪些呢... 2023-07-19
生活瓷磚的三個環保等級，你知道分别代表什...
瓷磚相信大家都知道，它是裝修房子必不可少缺少的材料。相信大家在選購瓷磚時往往關注的是它的環保性以及性能怎樣，那它的環保等級可能就很少人關注。那麼今天咱就來科普一下瓷磚的環保等級，以方便大家日後的選購瓷... 2023-07-19
生活怎麼安裝抽屜托底滑軌？抽屜滑軌安裝方...
抽屜托底滑軌安裝方法:1、将劃軌中間的小塑料片(一般為黑色)搬向一邊,即可将劃軌分離成兩部分。2、将不帶滾珠的一部分(帶小塑料片的)用木螺絲上在抽屜上(注意方向);3、将帶滾珠的一部分(帶劃軌的)用木... 2023-07-19
生活辦工桌怎麼安裝，辦工桌安裝方法
辦工桌安裝步驟從準備工作再到支架鍊接最後固定，詳細安裝步驟請看以下内容：1.卡座辦公桌安裝-準備（1）當收到卡座辦公桌的包裝，主要核對它的的型号和款式是否正确，然後檢查表面是否有損壞或者其它問題，清點... 2023-07-19
生活車窗簾軌道安裝方法
車窗簾安裝-清潔和量尺寸為了幫助大家解決關于車窗簾軌道和車窗簾安裝的相關問題，那麼現在我們就不妨一起來詳細的了解一下車窗簾安裝的方法吧！首先，在安裝車窗簾之前，大家需要做的兩件準備工作就是清潔車窗裡面... 2023-07-19
生活如何正确安裝淋浴花灑？花灑安裝高度
一般情況下衛生間吊頂高度是2.2-2.4米。固定高度的淋浴柱龍頭進水高度可距地面90-100厘米較合适，高度可調的淋浴柱龍頭進水高度在60-80厘米合适。淋浴、浴缸水龍頭當您購買了淋浴、浴缸、挂牆龍頭... 2023-07-19
生活隔斷門的安裝方法介紹
多多少少有些家庭會有隔斷門，有些家庭沒有安裝隔斷門想自己安裝卻又無從下手，下面介紹了如何安裝隔斷門的簡單方法介紹，有需要可以看看。如何安裝隔斷門-跟蹤系統安裝在安裝之前，檢查軌道上的軌道部件是否按順序... 2023-07-19
生活壁爐在安裝過程中應注意哪些細節？
壁爐在安裝過程中應注意的細節1、壁爐裝置在活動最多房間裡能夠獲得最大的熱效率。假如室内層高較高，運用風機能把熱量慢慢散播到活動區域。2、為了與全自動操作的壁爐配套，在完結終究裝置前要在其裝置方位旁安好... 2023-07-19
生活電磁門吸原理簡介以及安裝方法
電磁門吸原理：簡介電磁門吸是一種用于自動門的電磁鐵，采用電磁原理産生吸力的門體定位裝置，需要提供直流DC24V才能工作，實現現場手控和遠程電控，被廣泛應用于建築智能門控設施中，目前主要用于建築物中的防... 2023-07-19
生活手工制作生日卡片
第一、準備白紙、彩紙、彩筆、剪刀、膠棒。第二、先從彩紙上剪下一個長方形，然後把長方形向右對折。第三、用紅筆在彩紙左邊畫半個桃心，畫成雙線。第四、在桃心的右邊畫兩條飄帶，下面一條飄帶末端畫成剪刀狀。第五、用剪刀沿着右邊的輪廓把桃心和飄帶剪下來。第六、再把桃心中間剪成空的。第七、用剪刀從白紙上剪下一個長... 2023-07-19
生活玻璃門安裝方法及注意事項介紹
安裝玻璃門時，必須首先了解門的組件和門的類型，門的組件是門蓋，門頁，門鎖，鉸鍊和門觸，根據其功能分類，包括平開門，推拉門，折疊門，弧形門等。門的形狀包括門頁和門蓋部分，門的大小一般為800mm*200... 2023-07-19
生活家庭護理不再困難護理床安裝方法
現如今的家庭越來越多的老人患病久卧不起，尤其身患腦溢血腦血栓的老人家庭護理很困難，護理床的問世不僅減輕了病人的痛苦還方便了照顧人的護理，多功能護理床采用了獨特的雙折面結構，床面系為特殊的軟墊結構，使床... 2023-07-19
生活 oppo手機書簽在哪裡找
查看方法：打開手機浏覽器，進入裡面的書簽，點擊手機的菜單鍵即可看到。電子書簽定義：1、在網絡中指在g... 2023-07-19
生活燈具怎樣拆卸燈具安裝技巧
1、先确認控制回路，尤其是多回路控制燈具；2、大型燈具應在地上進行預安裝，保證燈具安裝部位正确、牢固；3、安裝之前進行試燈工作，避免完成後出現不亮等故障；4、先安裝燈具主要部件，把燈罩、光源等拆下，以... 2023-07-19
生活安裝地暖？地暖安裝注意事項
地闆采暖分為兩種，一種是電地暖和一種地闆采暖。選擇時，請選擇适合您的選項。地闆采暖安裝也是一個大項目，所以請專業人士安裝。那麼在安裝地闆采暖的過程中有哪些注意事項？在施工過程中我們可以采取哪些保障措施... 2023-07-19
生活集成吊頂工程燈的安裝方法
集成吊頂工程燈的安裝方法第一種安裝方法支架固定式：先在天花闆打幾個螺絲洞，再把LED面闆燈滑入式吸頂框安裝于天花闆上，固定好三面。然後再把面闆燈向固定好的滑入式安裝框裡面滑入，再把第四面邊給上螺絲固定... 2023-07-19
生活晾衣架安裝難不難？簡單介紹晾衣架的安...
晾衣架的安裝看起來很複雜而且很長，但實際上操作起來非常簡單，不要被長篇故事吓到！下面本站介紹了晾衣架的安裝步驟。1.找到手搖曲柄的安裝位置，沖床：建議手搖振動器的高度距離地面1M-1.2M，然後确定轉... 2023-07-19
生活科龍空調安裝費用一般空調安裝的費用價...
一般空調安裝的費用價格：5P（含）以下挂J機，單拆60元、單裝80元、移機150元；1.5P（含）以下一拖二單拆100元、單裝140元、移機240元；2P壁挂、櫃機單拆90元、單裝100元、移機180... 2023-07-19
生活簡單快速打蝴蝶結的教程
第一、準備一根帶子，不用很長，這樣打蝴蝶結更方便。第二、用左右手各拿起帶子中間的兩個地方，往上拱起兩個套。第三、把右邊的套壓在左邊的套的上面。第四、把右手的套往下折，從中間的小洞中穿出來。第五、把兩手的套同時拉緊，再整理一下形狀，簡單又快速的蝴蝶結就打完了。 2023-07-19
生活比較簡單的家居水晶吊燈安裝步驟和技巧
美麗的水晶燈對于80年代甚至70年代後的翻新房變得越來越不可缺。雖然我們的父母會縫衣服，會修理廁所，他們會安裝燈具。但我們的年輕一代将無法做這種工作。安裝水晶燈變成越來越不可缺少的燈具，但我們擔心買了... 2023-07-19
生活吊裝筒燈怎麼安裝？吊裝筒燈安裝方法
1、首先要将帶有吊環的頂裝底件固定在天花闆上，像吊燈安裝方法差不多，首先将底件貼在頂部描出孔位，然後用電鑽在孔位上鑽孔，打入預埋件，之後将預留的電源線穿過底件中心部位與裝線鐵管電源線連接。2、将燈具逆... 2023-07-19
生活湯圓怎麼儲存
1、首先，包完湯圓之後不要馬上放到冰箱去，先放在外面晾晾，等摸着外面差不多幹的時候再放進去冷凍，不過... 2023-07-19
生活如何折漂亮的玫瑰花
第一、首先，将這一張正方形小紙條對折，然後再沿着它的對角線進行對折。第二、然後，根據剛剛所折的折痕，分成的四個小正方形，每一個手指均帶一個小正方形，然後往頂不頂。最後會形成一個菱形的圖形。第三、形成菱形的圖形之後，根據中間這條折痕。對折，兩個三角形，另外兩邊也同樣如此。第四、折好了之後讓他打開，會出... 2023-07-19
生活雙水槽下水器的優點是什麼？水槽下水器...
廚房水槽可說是家家戶戶都有的廚房配件，為了更好的使用水槽，許多家庭都會選擇雙水槽下水器，那麼，雙水槽下水器的優點是什麼？到底好不好呢？水槽下水器如何安裝呢？接下來，小班為您詳細解答。一、雙水槽下水器的... 2023-07-19
生活東芝手提電腦的桌面圖标不見了,怎麼辦
1、右擊桌面空白處-排列圖标-點選顯示桌面圖标。2、在桌面上右鍵點擊-屬性-桌面項-自定義桌面-勾選... 2023-07-19
生活如何畫手賬簡筆畫
第一、首先，我們在素描本上畫出一個熊貓的腦袋，如下圖所示，然後在耳朵裡面分别畫出一個半月狀的小黑圈第二、在臉部的下端，靠近下颔的位置畫出一個圓，然後在其中上段畫出一個小點的橢圓，下端畫出一個小波浪線，如下圖所示第三、然後我們在圓的上方畫出兩隻眼睛，再畫出下面的身體部分第四、接下來，畫出兩隻腳與手第五... 2023-07-19
生活小型沙發床怎麼安裝—怎麼安裝小型沙發...
現在人們的需求是越來越多的，居住環境也是越來越多變的，對于單身人居住的話，小型沙發床是很方便的，有時候我們看電視看累了就可以直接在小型沙發床上睡覺。因此，現在要是一個人居住，很多人都是會購買小型沙發床... 2023-07-19
生活單層鐵架床安裝步驟及價格區間
對于鐵架床，小班真的是熟悉的不能再熟悉了，從初中到大學，近十年的時光都是在學校的鐵架床上睡的。鐵架床有單、雙層之分，下面小班主要講講單層鐵架床安裝步驟及價格區間，想要了解的小夥伴們一起來看看吧！一、安... 2023-07-19
生活 u啟動提示缺少硬盤驅動
1、這是因為主啟動引導不對造成的。2、進BIOS修改啟動模式，改UEFI啟動模式為Legacy模式。... 2023-07-19

tft每日頭條

> 生活

> 不平衡值計算

不平衡值計算

相关生活资讯推荐

热门生活资讯推荐

网友关注