風控建模基本要求及面試問題總結-tft每日頭條

風控建模基本要求及面試問題總結

圖文更新时间:2026-07-31 18:25:00

編輯導讀：如今，銀行和互聯網大廠的和合作越來越頻繁。其中，一項重要的合作是聯合建模。本文作者根據自己的一次風險聯合建模的經曆，從中總結出一些問題，希望對你有幫助。

最近雷帥慢銀行着實愁壞了，行内消費信貸業務新增客戶越來越少，活躍度也越來越低了。疫情長期結束不了，消費下滑經濟下行，監管持續趨嚴，資産規模和質量都開始面臨很大的增長壓力。

雷帥慢銀行尋思，這麼下去不是辦法，形勢再差，也要人為，得主動出擊去找優質資産。

怎麼找，流量和質量都掌控在互聯網大廠手上。

于是，找到了雷帥快大廠，你把優質用戶給我，我們來做款産品，一起分潤。

互聯網公司都是在做流量變現，雷帥快大廠就爽快同意了。

win-win。

那快大廠怎麼把優質用戶給慢銀行呢？

快大廠雖然自己也做消費信貸業務，也有内部風險評分。但風險是由用戶和産品決定的，慢銀行想要的是适合他們産品的優質用戶，快大廠的優質用戶雖然不錯，但不是最優。

這就是合作中最重要的一環，聯合建模。

慢銀行提供一批有風險表現的用戶給快大廠去匹配特征，風險是慢銀行的，特征是快大廠的。

由慢銀行同學去建模，有了模型之後就可以對快大廠的流量做精準風險評估了。

一般來說，誰用模型誰建模。

于是慢銀行和快大廠分别成立了一個小組，兩方各自指定了個負責人，專項對接該模型開發工作。
一、立項會議
小組成立之後，馬上開了一次語音會議，聊這個模型怎麼建。

兩方負責人先拉了個微信群，把慢銀行和快大廠這次聯合建模相關的人員都拉進去了。

慢銀行一堆問題就跟機關槍一樣發射了，
你們有多少特征，能回溯到什麼時候？
需要用什麼主鍵去匹配特征？
你們的數據能不能傳給我們，我們直接在行内建模？
我們要建xgb模型，你們xgb模型怎麼部署？
……

快大廠不爽了，你們急個毛線，
我們數據多着呢，近兩年都可以回溯，身份證和手機号做主鍵，我們上千個特征不出庫，我們準備好電腦和建模環境，你們帶着标簽過來。
你們準備多少樣本建模，最好多帶點？
你們自己怎麼定義标簽的？
你們準備建幾個模型，輸出幾個字段？

一來二回，都覺得對方不給力。

慢銀行嫌快大廠特征數據不出庫，還要他們派模型同學駐場建模。

快大廠嫌慢銀行能帶出的樣本太少了，建模效果不好的話還要怪數據質量。

但好歹，一些事情還是确定下來了。

慢銀行指定了一個模型同學（慢A），快大廠也指定了個同學（快B）。

然後，慢A去準備建模需要的10w樣本，走申請流程帶出。

快B就去準備了兩台電腦，搭建建模環境。
二、數據準備
慢A同學在慢銀行苦心經營，找了許多人開了許多會，終于确定了如何選取這10w樣本。

又潛心寫了幾行代碼抽取這些樣本，還請同事幫忙review一下這幾段sql。

然後走起了漫無邊際的審批流程，匹配加密的主鍵，樣本出庫等。

這個時候的慢A覺得自己是張骞。

此時，快B同學在快大廠申請了兩台舊電腦，确保了無網絡訪問權限，然後安裝了下必備的Python包。

然後開始準備怎麼做都有問題的特征，從特征庫裡選擇了幾張合适的穩定有效的特征表，開始做一些脫敏處理。

變量的值要脫敏，例如分段處理，變量的含義也要做脫敏，巴不得改名為變量1、變量2……。

無所不用其極，這個時候的快B覺得自己是SB。

最後，還要計算變量的分布，确保分段處理後的變量分布逐月穩定且合理。
三、無窮無盡的拉扯
許多天以後，慢A終于準備好了樣本，快B被慢銀行罵了幾次SB後，變量的含義還是沒改，不過加了一個維度列。

這些加密的主鍵被發送到快B，匹配了早已不知道是什麼的特征。

終于，慢A帶着這10w個好壞樣本，不情不願地來到了快大廠的所在地，快B給安排了工位，電腦桌面放好了10w個樣本的匹配結果。

慢A開始了無腦的數據分析，統計了數據的匹配情況，對着f1、f2……的特征強壓着内心的怒火。

在旁邊拿出了自己帶來的電腦，連上熱點，開始了百度一下。

找出了早已備好的計算woe、iv的代碼塊，對着所有的變量跑了一通，篩出了一些區分度高的變量後，又看了他們的風險分布。

問天，這個單增的變量是不是應該單增；問地，這個單減的變量是不是應該單減；問自己，這個U型分布變量是個什麼鬼。最後問快B，快說，我有刀。

時間無情的流逝。

模型終于建好了，慢A算了幾個KS，不由得想罵人，怎麼有點低，怎麼波動這麼大。

找快B，找慢銀行，多方讨論，也沒有什麼高招，隻好就這樣。

然後定了個阈值做了一些業務指标的測算，出了一個報告。

慢A把成果發送回了慢銀行，進行了遠程彙報……

最後，模型就這麼定了。

這個階段慢A很煩躁。
四、模型部署
慢A把模型文件和模型變量交給快B之後，就逃也似的離開了快大廠。

此時的快B覺得氣定神閑，上線過很多個模型之後，誰還會把這這當回事呢。

然後不緊不慢地打開了慢A給的文件，差點沒吐血。

這些變量咋還被再次處理了，給的變量都被分段好了，還合并分組幹什麼，不知道xgb是二叉樹嘛。

怎麼入模了這麼多變量。

模型文件一解析，又發現這樹怎麼長這樣，這xgb參數也太扯淡了。

快B大叫一聲不好，一個電話打給了慢A，慢A說有些變量分組人數太少就合并了，參數是網格搜索找出來的。

快B很吐血，這意味着，要多一層特征處理作業，這一步很容易出錯。另外，模型打分作業耗時久，需監控的變量多。

因為徒增了這些工作，重要但不緊急的模型部署變成了重要又緊急的todo。

但好歹，模型文件給到了快大廠，離線打分總遠遠好于實時打分。

模型終于被部署好了，并經過了一緻性校驗。

這個階段快B很暴躁。
五、我說
有件事情特别重要，而很多建模的同學并沒有意識到。

離線打分再把分數推送至線上接口，會比推送特征線上實時計算分數容易地多。

前者，模型複雜度就不太重要，計算作業再耗時也不是什麼大問題。

但後者，就注定不能用太多變量，不能讓模型過于複雜，因為推送幾百個特征至線上是很困難的，保證接口響應速度是很吃資源的，驗證分數的一緻性也是更不容易的。

這決定了你如何去做特征工程，如何去訓練模型。

所以，最為要緊的事情是，在啟動建模前就必須想清楚最終将如何上線應用。

負責建模的A和B同學，一定要清楚這個流程，即使他們本人還沒有這些經驗，也需要有人告知并提醒他們。

并且保持一定頻率的交流。

如果你們在聯合建模，或者任何建模，确保你有辦法知曉更全的信息。如果沒辦法，我可以盡一點綿力。歡迎交流。

本文由@雷帥原創發布于人人都是産品經理。未經許可，禁止轉載

題圖來自Unsplash，基于CC0協議
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

圖文鱿魚章魚有什麼不一樣
鱿魚章魚有什麼不一樣?在生活中，有許多人都分不清章魚和鱿魚，其實大家在看一種海鮮時，除了它的營養價值看不到外，外觀仔細觀察的話還是可以分辨出來的，那麼怎麼區别章魚和鱿魚呢？今天就來教給大家，并附帶幾種鱿魚的做法，我來為大家科普一下關于鱿魚章... 2022-10-15
圖文如何做趨勢分析
了解市場規模很重要，但了解市場是呈擴張還是收縮趨勢，對于企業制定戰略和營銷決策也至關重要。市場趨勢計算市場規模，可以使我們粗略的了解到當前形勢下，企業可能獲取到多少用戶和收入。而通過市場趨勢，我們可以知道在未來企業，可能會獲取到多少用戶和收... 2023-02-09
圖文為什麼痘痘反複發作
痘痘在醫學上被稱為痤瘡，對許多人來說是一種可怕的困擾，而且痤瘡被認為是一種慢性皮膚病。痤瘡很容易複發，使痤瘡治療變得困難。其實，隻要大家找見反複發作痘痘的原因，可以有效的幫助人們預防這種情況。痤瘡形成的機制是什麼？當皮膚上的小孔（稱為毛囊）... 2022-11-26
圖文人性中最醜陋的一面
人性中最醜陋的一面?我們現在經常用來教訓那些不可早就之人的這句名言“朽木不可雕，糞土之牆不可杇”，這句話到底出自哪裡，又在訓誰呢？，我來為大家講解一下關于人性中最醜陋的一面?跟着小編一起來看一看吧!人性中最醜陋的一面我們現在經常用來教訓那些... 2023-02-20
圖文嘉盛集團任命公示
嘉盛集團任命公示?挖貝網9月29日，合順興（871167）發公告稱，根據《公司法》及公司章程的有關規定，公司第三屆董事會第五次會議于2022年9月28日審議并通過：任命盧禧為公司财務負責人，任職期限至第三屆董事會屆滿，自2022年9月28日... 2023-02-09
圖文淩晨4點我見海棠花未眠下一句
淩晨4點我見海棠花未眠下一句?淩晨四點，海棠花未眠，我也未眠，他也未眠…我是還沒睡，他是驚夢醒還從沒這個時間點兒說過話，我曾經隻拍過淩晨的星月給他，今天他徘徊在星月下…沒有啥星月神話，而是“舉杯邀明月，對影成三人”…，接下來我們就來聊聊關于... 2022-10-10
圖文梁佩玲演任盈盈時多大
說起梁佩玲，很多人對她印象最深刻的一個角色就是《笑傲江湖》中的女主任盈盈，但比起這個角色，任盈盈的公主切發型更讓人印象深刻，這種發型在古裝劇裡雖然顯得很有特色，但真的不算美，原本美貌出衆的梁佩玲，搭配公主切發型，令她美貌大打折扣，令很多觀衆... 2023-03-06
圖文 cba各隊球員身高臂展
北京時間12月12日，CBA常規賽繼續進行，本賽季CBA聯賽進入2.0時代，在各個方面都做得更加專業，今日，CBA官方賬号發布了《中國男子籃球職業聯賽國内球員基礎信息白皮書》，未來，CBA聯盟也将在每個司機擇機發布當賽季《白皮書》，讓社會各... 2022-11-05
圖文大汶口文化遺址文化符号
大家好我是山東大阿彬！大汶口遺址，1959年首次挖掘，距今4000年的新石器時代，遺址有墓群，房址，文物，還有石斧，石鏟，骨器等。大汶口鎮南門前，是一座建于明代的大石橋，蜿蜒橫穿汶水。南至甯陽縣茶棚村，建于隆慶年間（1567——1572），... 2023-03-13
圖文 hdmi接口是怎麼來的
如今在電腦中，VGA模拟接口、DVI數字接口逐漸淘汰，而高清的HDMI已經成為目前主流視頻接口。那麼hdmi接口有幾種規格尺寸？hdmi什麼接口？有什麼用？帶着衆多問題下面帝特分享一下高清HDMI接口知識大掃盲。hdmi什麼接口？有什麼用？... 2023-03-14
圖文兒子昨夜又夢見你了
淩晨4:00，醒了，再也沒睡着。我确定我哭了，枕邊留着一大塊淚漬。我夢見還在上初中，背上還是那個蛇皮口袋，裡面裝着媽為我烙的烙馍，還有一罐頭瓶子紅油辣子潑了鹹菜。我在往學校走的路上，媽站在門口老槐樹下。她的頭上還裹着那塊咖啡色泛白的頭巾，半... 2022-10-20
圖文薛之謙說他的心願是和平
好懷念……打出這個标題的時候，我仿佛能看到老薛右手指着前方，一臉認真的樣子。老薛有好多梗哦，“神經病啊”、“我不要面子的”、“整段垮掉”，還有……“世界和平”。是“梗界”的“前輩”了吧，可是，你哥還是不滿足，火星第四季居然又想了新梗——緻命... 2023-03-16
圖文打印機打印文檔不完整的解決辦法
自己買了一台打印機，原本想着不管是學習方面還是工作方面有需要打印的資料，借助自己購買的打印機可以立即打印，為自己節省一些時間；可是現實情況卻沒有自己想象的那麼美好。自己買完打印機後，卻發現墨盒、打印紙還需要打印度購買，起初買了一些便宜的墨盒... 2023-03-19
圖文不鏽鋼鍋燒黃怎麼清洗
在廚房的所有鍋具裡，我們用的最多的大概就是不鏽鋼鍋了，但是在使用的過程中，難免會因稍不留神或用火過大，而導緻鍋底燒焦發黃，甚至發黑，形成一層很難清理的污垢。清洗不鏽鋼鍋,讓很多人因為這個問題而苦惱,清洗方法雖然很多,但是不能保持不鏽鋼鍋具的... 2022-10-31
圖文銀川哪個區經濟最發達
銀川市，簡稱“銀”，是甯夏回族自治區的首府，國家曆史文化名城，西北地區重要的中心城市[1]，是軍事、政治、經濟、文化、科研、交通和金融中心，以發展輕紡工業為主，機械、化工、建材工業協調發展的綜合性工業城市。位于甯夏平原中部，東踞鄂爾多斯西緣... 2023-01-21
圖文 vintage穿搭秋季
時尚穿搭風格中，Vintage風一直備受追捧。說起Vintage，上世紀每一個年代都它的标志性元素。20’s一戰後，整個西方社會進入了一個和平時期，戰後的歐洲和美國沉浸在歡呼和平與物質享受之中。時尚的女人身着華麗的服裝，妝面也較為濃烈。随着... 2023-01-20
圖文藍藻是光合作用的原核生物嗎
利物浦大學的研究人員進行的一項新研究揭示了古老的光合作用生物--藍藻--是如何進化它們的光合作用機制并組織它們的光合作用膜結構以有效地捕獲太陽光和能量轉導的。由植物、藻類和藍藻進行的含氧光合作用，為地球上的生命生産能量和氧氣，可以說是最重要... 2022-11-09
圖文天然珍珠和養殖珍珠的區别價格表
珍珠是一種廣受愛美女性歡迎的飾品，其潔白圓潤的光澤能賦予佩戴者高雅的氣質。近日，有消息稱，未來不久珍珠飾品價格或将上漲。據央視财經報道，近來，又到了珍珠蚌大量上市的季節，記者在國内最大的淡水珍珠集散地——浙江省諸暨市的山下湖鎮采訪後得知，進... 2023-01-27
圖文有關屠夫的民間故事
屠夫與和尚從前有一個和尚跟一個屠夫是好朋友。和尚天天早上要起來念經，而屠夫天天要起來殺豬。為了不耽誤他們早上的工作，是他們約定隔天早上互相叫對方起床。并且約定，一、三、五、七日和尚叫屠夫起床，二、四、六日屠夫叫和尚起床。多年以後，和尚與屠夫... 2023-01-21
圖文魔獸世界懷舊服前期怎麼刷金
作者：NGA-xiaohanksp3在即，賊區新人問法力摸金的越來越多，适逢爆本無聊，給大家分享幾個摸金小技巧。1.野魔花和ss糖共cd，1000血量關鍵時刻真能保命，比如暗牧痛還有一秒，而你隻有500血，大紅cd哭笑價錢嘛，法琳娜4-10... 2023-03-29
圖文雕和鷹的區别大嗎
小時候，看《神雕俠侶》的時候，見到楊過手臂上停着一頭雕，那可老威風了。于是在那個時候，見着一隻鷹就開始嚎，“快看，有雕！”長大後，才知道自己有多麼無知。那麼，鷹和雕究竟有什麼區别呢？首先，讓我們來看看什麼是鷹。鷹是一種肉食性的猛禽，它會捕捉... 2023-01-11
圖文安全生産标準化的三個階段
安全生産标準化的三個階段?8月17日，國家應急管理部通報了7月份全國安全生産的形勢，7月份全國共發生各類生産安全事故1912起、死亡1609人，雖然各類事故和死亡人數同比有所下降，但是仍有較大的降低空間，今天小編就來聊一聊關于安全生産标準化... 2022-12-30
圖文宋茜短發幹練霸氣十足寫真
宋茜短發幹練霸氣十足寫真宋茜短發幹練霸氣十足寫真宋茜短發幹練霸氣十足寫真宋茜短發幹練霸氣十足寫真宋茜短發幹練霸氣十足寫真, 2023-03-28
圖文 dnf阿拉德謀略戰兩星最強陣容
【阿拉德謀略戰】◆遊戲模式遊戲模式包含劇情模式和競技模式。劇情模式包含20個關卡和一個最終關卡，挑戰新關卡不需要消耗活力，挑戰完成後可以獲得首通獎勵，獲取首通獎勵後變為冒險模式，需要消耗一定的活力值才能重複挑戰獲取資源。遊戲中的資源含怪物硬... 2023-01-03
圖文二年級必背古詩十五首
二年級上學期必背古詩30首，為長圖，可以存在手機，慢慢品讀。其實二年級所背的古詩詞，已經遠遠超過了我們這些70後，80後家長們的想象力了。不得不說，現在小學所學習的内容，已不是我們普通家長朋友們所能夠掌控的了！與時俱進的今天，我們也需要同孩... 2023-01-04
圖文羅建森官司
//閱讀本文需要約12分鐘圖片：趙陽--馬戲團003丹青文|羅建森一、陳宛仲我們從麥地裡鑽出來的時候，正是日落時分，父親的剪影立在山頭，轉動着腦袋朝四周張望。我知道他在看什麼，于是擡頭朝他大喊一聲：“爹——”他低下頭來看山腰上的我，眼睛裡閃... 2023-03-29
圖文能誘魚的香精有哪些
餌料的香味有很多種，比如奶香、草莓香等等，人為什麼可以聞到這些香味？是因為這些餌料中添加了一些可以在空氣中揮發香精，而這些香精在水中到底能不能揮發，起到誘魚作用呢？不一定。大多數釣友們在開餌時，把餌料袋打開後先聞一聞是哪種香味，哪種适合釣鯉... 2023-03-09
圖文仿紫砂的配方
路朔良生于1949年，字逸雲、号北辰，雲溪精舍創始人，中國十大紫砂名家，研究員級高級工藝美術師、江蘇省工藝美術大師。路朔良大師生長在書香門第，詩文傳家，自幼酷愛書法、繪畫、金石、镌刻和雕塑藝術。他将書畫、雕塑等表現手段運用在紫砂陶器表面，妙... 2022-12-28
圖文居間服務費比例是多少
居間服務費比例是多少?我們先了解什麼是居間服務，其實用傳統意思來說就是中介的意思那麼居間服務有哪些相關的定義，又有什麼作用呢希望以下内容對你多少有些幫助，現在小編就來說說關于居間服務費比例是多少?下面内容希望能幫助到你，我們來一起看看吧!居... 2023-03-19
圖文生物死後去了哪裡
生物死後還能做什麼?如果問你這個問題，你也許會一時啞口無言，死都死了，還能發生什麼改變，做出一番大事業嗎?不過，這種“偏見”可能要發生改變了，有些時候，死亡反而意味着新生。一隻鲸魚的“重生”1977年，美國幾位駕駛着深海潛水器的潛水員在太平... 2023-03-28

tft每日頭條

> 圖文

> 風控建模基本要求及面試問題總結

風控建模基本要求及面試問題總結

相关圖文资讯推荐

热门圖文资讯推荐

网友关注