在分類任務中,各指标的計算基礎都來自于對正負樣本的分類結果,用混淆矩陣表示。
真實情況 |
預測結果 | |
正例 |
反例 | |
正例 |
TP |
FN |
反例 |
FP |
TN |
其中:TP、TN、FP、FN的含義:
TP(True Positives)預測為正樣本,并且預測對了(真陽性)
TN(True Negatives)預測為負樣本,而且預測對了(真陰性)
FP(False Positives)預測為正樣本,但是預測錯了(假陽性)
FN(False Negatives)預測為負樣本,但是預測錯了(假陰性)
假如模型對20個樣本進行預測,結果如下:
預測值 0 0 0 0 1 0 1 0 1 0 1 0 1 1 0 1 1 1 0 1
真實值 0 0 1 1 1 1 1 0 1 0 0 0 0 1 0 1 1 1 1 0
預測值=1 |
預測值=0 | |
真實值=1 |
7 |
4 |
真實值=0 |
3 |
6 |
預測值=1 |
預測值=0 | |
真實值=1 |
TP |
FN |
真實值=0 |
FP |
TN |
1、精度(Accuracy)
Accuracy = |
TP TN |
TP FN FP TN |
即所有分類正确的樣本占全部樣本的比例。
Accuracy = |
7 6 |
7 4 3 6 |
計算:Accuracy=13/20=0.65=65%
2、精确率,精準率又叫做:Precision、查準率
Precision = |
TP |
TP FP |
即預測是正例的結果中,确實是正例的比例。
Precision = |
7 |
7 4 |
計算:Precision=7/10=0.7=70%
3、召回率,召回率又叫:Recall、查全率
Recall= |
TP |
TP FN |
即所有正例的樣本中,被找出的比例
Recall= |
7 |
7 3 |
計算:Recall=7/11≈0.6364≈63.64%
4、P-R曲線,P-R曲線又叫做:PRC
根據預測結果将預測樣本排序,最有可能為正樣本的在前,最不可能的在後,依次将樣本預測為正樣本,分别計算當前的精确率和召回率,繪制P-R曲線。
PRC曲線圖
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!