分類模型的常見度量指标-tft每日頭條

分類模型的常見度量指标

圖文更新时间:2026-08-01 13:00:39

信貸評分模型的評估指标常見的有P-R曲線、AUC、KS、混淆矩陣、AR、洛倫茨曲線等，各個評估指标之間都有或多或少的聯系和區别，從而從不同角度對模型進行評估。本文嘗試寫一些各個評估指标間的聯系，從而對模型評估指标有更加深入的理解。

正負樣本的選擇
混淆矩陣與概率密度分布
提升圖與洛倫茨曲線
洛倫茨曲線與KS
KS與AUC值
參考資料

一、正負樣本的選擇

直觀上，在信貸風控建模中都以好樣本為正樣本，以壞樣本為負樣本。其實正負樣本的選擇不同直接影響的就是混淆矩陣，在以好樣本為正樣本的情況下，信貸業務的一些指标如通過率與壞賬率如下：

通過率，即模型判斷為好樣本的數量占總樣本的數量。

分類模型的常見度量指标（模型評估指标之間的一些聯系）1

壞賬率為模型判斷為好樣本(P)中真正的壞樣本(FP)所占的比例。

分類模型的常見度量指标（模型評估指标之間的一些聯系）2

而模型的準确率Precison定義為模型判斷為好樣本中真正的好樣本所占比例，即：

分類模型的常見度量指标（模型評估指标之間的一些聯系）3

由此可見，壞賬率就是1-Precison，在模型優化時設法讓Precison值更高，即通過樣本中的好樣本占比盡可能高，這是一個很好的性質，也是将好樣本作為正樣本的優點。但同時其他的一些指标比如F1指标，這個時候就是無效的。

在機器學習中，往往是将少數樣本定義為正樣本，在信貸模型也就是将壞樣本定義為正樣本，表示希望模型在訓練時更加關注壞樣本，控制模型對壞樣本的預測能力，這也更符合業務場景。

總結一下，正負樣本的選擇沒有強制要求，根據自身需求而定，不同正負樣本的選擇會對指标的表現方式産生影響。

二、混淆矩陣與概率密度分布

為了便于理解，以好樣本為正樣本，将混淆矩陣與正負樣本的概率密度函數對應到一張圖上：

分類模型的常見度量指标（模型評估指标之間的一些聯系）4

虛線左邊為拒絕的樣本，即經模型預測低于cutoff值的壞樣本；右邊為通過的樣本，即經模型預測高于cutoff的好樣本。FN為模型預測為壞樣本但實際為正樣本，即被誤拒的好人；FP為模型預測為好樣本但實際為壞樣本，即誤準入的壞人。

TPR為預測為正例且實際為正例的樣本占所有正例樣本的比例，即所有好樣本中通過樣本的占比。

分類模型的常見度量指标（模型評估指标之間的一些聯系）5

FPR為預測為正例但實際為負例(誤準入)的樣本占所有負例樣本的比例，即所有壞樣本中被誤準入的樣本占比。

分類模型的常見度量指标（模型評估指标之間的一些聯系）6

由于KS值是取TPR和FPR之差的最大值，可以理解為兩個累計分布之差。以上圖中的cutoff值為例，虛線往左移則TP增加的比例要小于FP增加的比例，虛線往右移則TP減少的比例大于FP減少的比例，因此隻有在虛線處TP的占比與FP的占比差值最大，也就是KS的取值。所以上圖中三條線交叉的地方取到的cutoff值，正好為KS值對應的cutoff值。

三、提升圖與洛倫茨曲線

提升圖比較的是采用模型與不采用模型帶來的改善，即采用模型後對壞樣本識别能力的提升程度。計算過程如下圖：

分類模型的常見度量指标（模型評估指标之間的一些聯系）7

上圖中的右側有兩條曲線，綠色的這根是Lift曲線，它是将每一組的壞樣本占比除以整體的壞樣本占比得到。這條曲線是趨于0的，且越陡說明模型的區分度越高。還有一根藍色的曲線是累計的Lift曲線，是将累計的壞樣本比例除以整體的壞樣本占比所得，這條線是的臨界點是1。

如果将用模型判斷得到的每組累計壞樣本占比與随機判斷每組的累計壞樣本占比進行繪圖，就得到洛倫茨曲線，計算方式如下圖：

分類模型的常見度量指标（模型評估指标之間的一些聯系）8

洛倫茨曲線如下：

分類模型的常見度量指标（模型評估指标之間的一些聯系）9

用洛倫茨曲線比較模型性能時，較好的模型的洛倫茨圖應該更偏向于左上方坐标軸，這種比較模型性能的方式與ROC曲線相同。上圖中洛倫茨曲線上一點的含義是:在通過率為50%的情況下，模型可以識别出80%的壞樣本。

分類模型的常見度量指标（模型評估指标之間的一些聯系）10

現在知道洛倫茨曲線越往左上方說明模型的性能越好，因此可以用一個指标來量化這種性質，如上圖将圖形分為A、B、C三塊區域，理想狀态下A的面積等于A B的和，此時可以完美地識别所有壞樣本。因此，将A和A B的比值定義為基尼系數，也叫作AR值。

四、洛倫茨曲線與KS

洛倫茨曲線中在給定通過率後，隻能得到對壞樣本的識别能力，并沒有反應對好樣本的識别能力。而K-S曲線的本質是對壞樣本的洛倫茨曲線和好樣本的洛倫茲曲線構成的。

分類模型的常見度量指标（模型評估指标之間的一些聯系）11

所以，上圖中壞樣本的累計占比曲線就是FPR，好樣本的累計占比曲線就是TPR。上圖中KS值為0.36，其含義是在通過率為62%時，模型能識别70%的逾期用戶，但有34%的好樣本被誤判為壞樣本拒絕。

KS值的高低與建模樣本中的壞樣本濃占比相關，并不是KS值越高風控就越好。下面是知乎"獨孤qiu敗"文章中的一個例子：

（1）如果建模樣本中好壞樣本比例good/bad=50/50，壞賬率為50%；k-s值0.6指的是如果在誤殺20%好用戶的情況下可以識别80%的壞樣本；那麼使用模型之後的結果為good/bad=40/10，壞賬率變為20%；這個我們做風控策略的人都知道在使用一些較好的變量的情況下是有可能的，因為畢竟做到50%的壞賬已經是夠爛的了。（2）如果建模樣本中好壞樣本比例good/bad=80/20，壞賬率為20%；k-s值0.6指的是如果在誤殺20%好用戶的情況下可以識别80%的壞樣本；那麼使用模型之後的結果為good/bad=64/4，壞賬率變為5.88%，其實我們知道這個一個模型是很難做到。

五、KS與AUC值

這一部分直接搬運求是汪的文章了，風控模型—區分度評估指标(KS)深入理解應用。

因為KS = |TPR - FPR|，如果添加輔助線TPR = FPR KS，那麼這條直線的截距就是KS值。當與ROC曲線相切時，截距最大，也就對應max_ks。

在理解KS和ROC曲線的關系後，我們也就更容易理解——為什麼通常認為KS在高于75%時就不可靠？我們可以想象，如果KS達到80%以上，此時ROC曲線就會變得很畸形，如下圖：

六、參考資料

1.《Python金融大數據風控建模實戰》

>【作者】：Labryant

>【原創公衆号】：風控獵人

>【簡介】：某創業公司策略分析師，積極上進，努力提升。乾坤未定，你我都是黑馬。

>【轉載說明】：轉載請說明出處，謝謝合作！~
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

圖文人而無信言而無信
人而無信言而無信?“人而無信，不知其可也”，現在小編就來說說關于人而無信言而無信?下面内容希望能幫助到你，我們來一起看看吧!人而無信言而無信“人而無信，不知其可也。”——引自在第八輪中美戰略與經濟對話和第七輪中美人文交流高層磋商聯合開幕式上... 2022-12-30
圖文 fgo日服狩獵本和日常本
fgo對于後續國服要開啟的新活動，近期官方正式公開了具體的情報，這裡帶來具體的活動預告說明和解釋，本次即将開啟的新活動是狩獵任務第6彈，具體的特色還有核心内容下面的帶來介紹和說明。本次活動開啟時間從11月20日下午5點開始，持續到11月27... 2023-04-04
圖文九寨溝花果山水簾洞
我是孤獨的腿來東莞爬山，怎能錯過銀屏山，銀屏山是東莞第一峰，最高海拔898米，峰頂是銀屏嘴，銀屏山位于謝崗鎮，緊鄰惠州，如果天氣良好，在峰頂可以看到惠州市區，同時站在峰頂環顧四周，有種傲視群雄的感覺。東莞第一峰山頂銀屏嘴依稀可以看到惠州市區... 2023-02-17
圖文世界深海排名
一說起大海，有些人十分向往，有些人卻對它充滿了畏懼，海洋可以說是生命的起源之地，正是海洋孕育出了最初的生命，而大海也是我們這個世界重要的組成員部分。由于海洋的神秘性，很多人也是用盡一生去研究探索大海的奧秘。不過要說起世界上最深的海，大家能說... 2023-01-19
圖文 2022到2023年冷冬還是暖冬
民間諺語“熱在三伏，冷在三九”，還有“一九二九不出手，三九四九冰上走，五九六九沿河看柳，七九河開，八九雁來，九九加一九耕牛遍地走。”可以明顯看出來“三九”和“四九”是一年中最冷的時候了。今年冬至是公曆12月22日，按照9天為一個“九”的說法... 2023-04-03
圖文竹筒粽子又香又甜
端午節不僅是一個放假休息，團圓聚會的節日，它還是一個承載着家國情懷寄托着後人濃濃哀思的日子。這個傳承了千年的傳統節日裡流淌着華夏兒女炎黃子孫對這片土地炙熱的愛和對先人憂國憂家精神的崇敬。屈原聽聞自己的國家被秦國攻滅後痛心疾首，抱石投汨羅江而... 2022-11-05
圖文 excel中四張報表的勾稽關系如何做
我們經常要利用Excel生成指定類型的報表，但是很多報表原始數據是混雜在一起，或者是分布在各個子表中。現在利用Excel透視報表的功能，我們可以快速将混雜的數據分離為分頁報表，或者将獨立子表整合為彙總報表。簡單分頁，混雜報表變身分頁報表為了... 2023-01-17
圖文點擊量最高的歌一人一首成名曲
一首歌的傳奇：《老鼠愛大米》“我愛你，愛着你，就像老鼠愛大米。無論有多少風雨，我都會陪着你。”相信很幾年前，很多人都聽過這首歌，并且還會唱上幾句。大還記得這首名叫《老鼠愛大米》的歌嗎？這首歌當時有什麼魅力，讓那麼多人喜歡和傳唱。歌曲《老鼠愛... 2023-04-04
圖文生活小竅門23個生活中的經典技巧
日常生活中，我們經常會遇到很多的小麻煩，從而帶給我們困惑和煩惱，有時候甚至是百思不得其解。然而，隻要稍微懂得一些聰明的生活小竅門，就可以将困難迎刃而解了。快快和我一起來見證吧。1、如何讓餅幹一直嘎嘣脆想讓餅幹保持嘎嘣脆的狀态，就是将餅幹裝在... 2023-01-23
圖文做微商早安朋友圈正能量語錄
1)想要走得快，就獨自上路;想要走得遠，就結伴同行。快與遠，都是我們的追求。追求快中的獨立，追求快中的堅強，給自己留一片屬于自己的天空。追求遠中的歡聲笑語，追求遠中的結伴同行，便不會有孤單。即便是失敗了，那也無所謂，失敗了，總是搏了一回，不... 2023-03-22
圖文陳钰琪唐嫣街拍
陳钰琪穿衣好前衛，半蕾絲工裝褲隻有她敢穿，主要效果還不賴最近唐嫣和羅晉即将在維也納成婚的消息一度占據了我們的視野，同樣受到關注一如既往的是貌美的伴娘團，網傳這次的婚禮伴娘團陣容中會有在《錦繡未央》中，唐嫣工作室的旗下藝人陳钰琪，這位演技好的... 2023-01-10
圖文神武2名人榜第55期
《神武2》與浙江衛視綜藝節目《天生是優我》深度合作，十三位個性迥異的美少女在節目中大放異彩，你更喜歡哪一位呢?《神武2》人氣少女評選大賽正式啟動，為少女們點贊投票，助優我少女正式出道!神武2人氣少女評選大賽點贊助少女出道《神武2》作為《天生... 2023-02-17
圖文論文答辯的ppt該怎麼做
論文答辯的ppt該怎麼做?不管是哪個專業，PPT首先都是結構設計，好在學術論文一般都有套用的結構，那麼PPT也應該和論文主體結構一緻，大家可以參考，不同學科在答辯結構上我個人認為大同小異，下面我們就來聊聊關于論文答辯的ppt該怎麼做?接下來... 2022-11-24
圖文 word文檔如何計算總和
第一步：添加工具選項卡—添加其他命令添加其他命令第二步：選擇不在功能區中的命令—計算添加計算功能選項卡第三步：添加計算命令選項卡添加計算命令選項卡第四步：先選中内容後單機計算按鈕—然後在等于号後面按CtrlV（所有需要計算的内容以此類推）計... 2023-02-03
圖文低價洋房好樓盤
準備好了嗎？一大波洋房正在襲來。作為地産人，應該敏銳發現，今年以來，成都新房産品結構有所變化，那就是疊拼産品明顯少了，取而代之的是洋房。據買房菌不完全統計，成都即将推出洋房産品的新盤近10餘個，其中超過一半為純洋房項目。僅統計11F以下華潤... 2022-11-14
圖文江西省沙漠有多大
一說起沙漠，大多數人可能想到的就是黃沙遍地，整片沙漠都是不毛之地。大部分的沙漠确實如此，但世界之大無奇不有，有一個沙漠就一點不像是沙漠。它的年降水量超過1600毫米，水比沙子還多，擁有上千個湖泊。幹旱少雨是沙漠的常态，也是沙漠形成的主要原因... 2022-11-14
圖文形容不被懷疑的成語
這倆兄弟是不是很多人傻傻分不清，佛系混用？你看，就連頭條發文助手也來神助攻。不負衆望【解釋】負：辜負。不辜負大家的期望。不孚衆望其實絕大多數成語詞典中并不存在這個成語，應該是根據“深孚衆望”衍生出來的習慣說法，好在也容易理解。【解釋】孚：使... 2023-03-11
圖文陳數霸氣發言
17日晚，首部抗疫題材電視系列劇《最美逆行者》開播了！今晚播出的是《最美逆行者》的第一單元《逆行》，此篇章中描述了武漢封城後，軍醫、院長、公交車司機、建築工人等不同崗位、不同身份的人物積極參與武漢抗疫中這一“逆行”壯舉。懷着複雜且沉重的心情... 2023-02-12
圖文廣州到三亞五天旅遊景點攻略大全
作者:廣州全攻略旅行，是重新認識自己的過程在全新的地方發掘全新的自己小新最愛當然是蔚藍的大海如三亞的浪漫，墾丁的清新，馬代的漂亮當然，其實廣東也是沿海地區在我們隔壁就有一個絕美度假聖地！論浪漫，它有不輸馬爾代夫的水晶教堂論夢幻，它有不輸茶卡... 2022-12-18
圖文天天酷跑奧利奧最強搭配
天天酷跑奧莉奧搭配吸血伯爵怎麼樣？好不好？很多玩家都想知道，下面小編給大家分析下！天天酷跑奧莉奧搭配吸血伯爵好不好?新坐騎奧莉奧可以生成竹排，還能追到3隻高分熊貓仔仔，雖然目前技能沒有進一步曝光，不過小編推測，他應該也能将金币變化成高分的小... 2022-10-31
圖文暗黑2寶石合成符文
接觸暗黑破壞神2久一點的玩家們多少都會了解一下符文之語，制作符文之語的條件必須是合适的底材加上對應的符文，然後按照一定的順序鑲嵌符文才能觸發符文之語效果。初期比較受歡迎的人物符文之語比如精神劍盾（四孔白色劍或者盾鑲嵌7号10号9号11号），... 2023-01-16
圖文農村上墳有什麼說法
祭祀，在我國乃至東南亞諸國都是比較隆重的活動。尤其是在傳統文化比較盛行的農村，一些喪家婚俗習俗都完整地保存了下來。在祭祀的同時彌生出了很多的俗語，雖然這些俗語很大一部分在當今社會已經不太實用了，但是話語中透露的對先人濃濃的思念和深深的孝意。... 2023-04-01
圖文 abs融資模式圖
abs融資模式圖?在銀監會對金融機構要求降杠杆的大背景下，此前消費金融公司以資産證券化增加融資的方式正逐漸被限制目前，消費金融平台正采用新的融資渠道進行融資，我來為大家科普一下關于abs融資模式圖?下面希望有你要的答案，我們一起來看看吧!a... 2023-02-09
圖文曾子殺豬的故事經過
偉大的教育家，孔子有3000多學生，他說教的都是仁義禮智信，曾子就是孔子的學生，有一次，曾子的妻子準備去趕集，由于孩子哭鬧不已，曾子的妻子許諾孩子，回來後殺豬給他吃，她從集市上回來後，曾子便捉豬來殺，妻子阻止說，我不過是跟孩子鬧着玩的，曾子... 2023-01-10
圖文年夜飯必備的六道菜吉利寓意好
#良品上桌就是年#年夜飯如果選擇在自己家做，那一定是一場展露自己廚藝的機會，在這場“廚藝秀”上，大家可以盡自己所能展現自己的廚藝，就算做的不是那麼太好，也不會有人去嫌棄，因為這些菜裡有濃濃愛的味道。年夜飯雖然對菜肴沒有要求，沒有規定具體做... 2023-02-13
圖文史努比秋季套裝
曾怡嘉/綜合報導為了歡慶在台上市十周年，肌研和Snoopy跨界聯名推出限定複古包裝，共推出四款，橫跨50年代到80年代風格，每個瓶身皆以逗趣的四格小漫畫呈現，收藏指數爆表。2019年9月于全台寶雅獨家限量上市，慢了可就買不到！▲美白化妝水9... 2022-11-15
圖文學者評價李冬果飾演的阮小七
文/主任說李冬果，可能知道的人不多，但是要說到水浒傳中的阮小七，那大家很快就會想起一個人。這個人眼如銅鈴、放出兇光，而且臉蛋很長、鼻孔很大，牙齒排列不成體系，總體來說就是兩個字：彪悍。而這樣一副形象，恰恰就是阮小七在水浒中的形象，也正是阮小... 2023-04-03
圖文陌生人給轉了5000元要不要收
“好友”發來一條短信10萬塊錢沒了“老婆”要“愛的小紅包”，發後即被拉黑到底是哪裡出了問題這都是冒充熟人、親友詐騙的套路換上“熟人”、“親友”的微信頭像、昵稱求轉賬這種詐騙手法實在是太簡單、太沒有技術含量了再加上大家防騙意識的提高近年來在微... 2023-03-02
圖文倉鼠的簡單喂養
硬硬的倉鼠飼料倉鼠的牙齒如果任意長出來的話很危險的。也有牙齒會透過倉鼠的腮長出來的情況。還有牙齒太長的話不能好好吃食物。如果倉鼠沒有任何疾病，但還是不吃時，也有可能是因為牙齒太長，所以一定要注意。如果隻給蔬菜或軟食的話可能會産生如上情況。所... 2023-02-10
圖文南航飛機票退票手續費怎麼算
圖片來源/視覺中國新京報訊（記者王勝男）3月21日，中國南方航空（簡稱“南航”）發布消息稱，南航将于3月24日起，推行新的國内機票退改手續費收費标準。越早退改，手續費越低。根據新規，南航自願變更和自願退票手續費收費标準将實行“階梯費率”，共... 2023-02-13

tft每日頭條

> 圖文

> 分類模型的常見度量指标

分類模型的常見度量指标

相关圖文资讯推荐

热门圖文资讯推荐

网友关注