神經網絡預測的學習-tft每日頭條

神經網絡預測的學習

生活更新时间:2025-07-02 08:49:37

張揚：

新加坡國立大學博士生。從事可解釋性機器學習研究，以第一作者身份發表相關論文于NeurIPS，MICCAI等會議。曾在德國亞琛工業大學，慕尼黑工業大學，微軟亞研院進行過研究實習。

解釋黑盒神經網絡的一種主要方法是特征歸因（feature attribution），即識别輸入特征對網絡預測的重要性。最近有方法提出使用信息瓶頸（information bottleneck）模型來識别特征所包含的信息并以此衡量特征的重要性。之前的方法通常通過在神經網絡内部插入信息瓶頸來識别對模型預測有意義的特征。我們提出了一種在輸入空間中使用信息瓶頸并識别含有有效信息的輸入特征的方法。該方法可生成比以往更加細化的模型解釋，并且可以應用在任意模型架構上。

INTRODUCTION AND MOTIVATION

可解釋性的重要性

即便今日的深度學習發展迅速，各種模型也比較成熟。但是神經網絡依舊是一個黑盒模型，我們對其内部的結構仍然所知甚少。這樣一種不可理解的特質，使得深度網絡始終無法大規模部署到醫療、金融等對錯誤判斷非常敏感的領域。神經網絡不夠可信的例子有很多，比較有代表性的是美國特斯拉所采用的自動駕駛系統，有過許多因識别錯目标而導緻的公路事故。下圖即是特斯拉的視覺系統錯誤的将一輛翻倒的卡車識别為藍天而導緻事故。

神經網絡預測的學習（幹貨解釋神經網絡）1

以上種種，可見學界與工業界對可解釋模型有需求。部署可解釋模型可以幫助我們理解模型，使我們就能在部署和訓練的過程中提早發現問題。也能夠向監管機構更好的證明模型的行為使得模型可以通過監管部門的評估并部署到醫院，保險，民生等領域。

通過可解釋的模型打開“黑盒”有什麼意義呢？

1. 在訓練過程中指導模型朝着更好的方向去發展。

2. 讓這個模型獲得更好的回溯能力。

3. 實現更加安全、人性化且公平的AI模型。

下圖展示了傳統機器學習模型和解釋模型共同應用在醫療領域上的表現。通過生成熱力圖，我們可以輔助醫生去更好的理解模型的預測，以此減輕醫生的工作量。

神經網絡預測的學習（幹貨解釋神經網絡）2

Background

可解釋模型的分類

分類方式1：主要根據可解釋性如何獲得

Intrinsic vs post-hoc explanation

Intrinsic explanation:一個訓練好的模型本身就具有解釋自己行為的能力。
比如：決策樹。

神經網絡預測的學習（幹貨解釋神經網絡）3

具有很好解釋性的模型可能會在準确率上有trade-off，即為了實現可解釋性，模型準确率可能會下降
post-hoc explanation：在模型訓練好之後生成解釋，不需要提前定義模型架構。可以在不打開“黑盒”的情況下解釋“黑盒”

分類方式2：根據模型解釋範圍是局部還是全局

Local vs global explanation

Global explanation:模型在數據集上的整體行為◾ 目前技術難以實現，需要很高的抽象能力
Local explanation: 解釋基于單個輸入樣本的模型行為
結果并不可被泛化到整個數據集◾ 隻能解釋某種特定行為在本次研究中，我們重點關注post-hoc, local 的可解釋方法。

FEATURE ATTRIBUTION 特征歸因

我們一般需要去尋找和決策相關的輸入特征，輸出的結果被稱為特征圖（attribution map）。特征歸因方法同樣可以被分為好幾類。

Class Activation Maps

◾ 通過不同channel的加權平均獲得特征圖

◾ 隻能被應用在CNN上

◾ 例子有ScoreCAM , GradCAM

神經網絡預測的學習（幹貨解釋神經網絡）4

Backpropagation-based反向傳播◾ 用反向傳播的梯度信息構造特征圖◾ 被證明是不可信的（視覺欺騙）

神經網絡預測的學習（幹貨解釋神經網絡）5

Shapley Value◾ 運用博弈論（game theory）◆ 輸入的特征作為玩家◆ 模型看做一個得分函數◆ 得出每個玩家的貢獻分值◾ 通常需要使用大量近似來近似真實的得分函數◾ 代表性的方法有：DeepSHAP, Integrated Gradients

神經網絡預測的學習（幹貨解釋神經網絡）6

Perturbation-based基于擾動◾ 将模型看做輸入-輸出的關系◆ 翻轉擾動特定的輸入值◆ 觀察對輸出的影響來判斷對模型是否有作用◾ 生成的解通常是一個局部解，而不是全局解◾ 代表性的方法有：LIME , Extremal Perturbation

神經網絡預測的學習（幹貨解釋神經網絡）7

Information-theory-based基于信息瓶頸的理論◾ 限制神經網絡的信息流來獲得含有信息量最多的特征◾ 方法建立在信息論和信息瓶頸這兩個數學模型上◾ 代表性的方法有：IBA, 還有我們所提出的InputIBA

神經網絡預測的學習（幹貨解釋神經網絡）8

Fine-Grained Neural Network Explanation

我們提出了一種識别輸入特征的預測信息的方法，叫做InputIBA，具備以下優勢。首先，InputIBA可以直接識别輸入中含有信息的特征，相比之前方法具有更高的細粒度。其次，InputIBA是一個和模型架構無關（model-agnostic）的方法，可以應用到各種類别的網絡上。為了證明模型無關性，我們在論文中将InputIBA應用到了圖像識别和自然語言處理兩類任務中。

神經網絡預測的學習（幹貨解釋神經網絡）9

Background: Information Bottleneck

神經網絡預測的學習（幹貨解釋神經網絡）10

我們的方法基于Information Bottleneck (也稱作IBA)。該方法是通過信息瓶頸插入到神經網絡的内部來限制信息流。具體做法是在隐藏特征R種加入噪聲，并利用信息瓶頸理論構造優化函數，以求盡可能的把R裡面和預測無關的信息剔除掉。

神經網絡預測的學習（幹貨解釋神經網絡）11

我們把最後求得的結果作為神經網絡特定輸入的解釋。在實踐中，IBA存在一些問題，大多和涉及到的近似有關。

比如，當信息瓶頸插入到神經網絡後部時候，還需要對結果進行一些特定變換。

神經網絡預測的學習（幹貨解釋神經網絡）12

我們發現在進行upscale的結果依然是非常模糊的。

神經網絡預測的學習（幹貨解釋神經網絡）13

但是當我們将信息瓶頸插入到神經網絡前部時，Q(Z)是一個高斯分布，可是信息瓶頸越往神經網絡前部移動，Q(Z)就越不趨近于高斯分布。結果就是生成的Attribution map中很多有用的特征被移除。

神經網絡預測的學習（幹貨解釋神經網絡）14

下面我們也有實驗進行論證：

神經網絡預測的學習（幹貨解釋神經網絡）15

神經網絡預測的學習（幹貨解釋神經網絡）16

當信息瓶頸插入到神經網絡後部的時候，生成的結果如左圖，非常模糊；

當信息瓶頸插入到神經網絡前部的時候，生成的結果如右圖，大量有用結果被移除導緻幾乎不可見。

我們的方法就是将信息瓶頸插入到輸入之後，神經網絡之前，然後通過預測先驗知識來替代信息瓶頸再進行神經網絡的學習，得到的結果就比之前好很多。

神經網絡預測的學習（幹貨解釋神經網絡）17

我們需要把信息瓶頸挪到輸入層，然後定義的優化函數也随之發生變化。但是Zi變量我們無法預測，隻能通過尋找其先驗知識進行優化。

神經網絡預測的學習（幹貨解釋神經網絡）18

當Q(Z)預測合理的時候，都是在神經網絡的後部。我們需要将其挪到神經網絡的輸入層，具體的變換我們需要使用生成模型。計算得到的Z*變量是一個Bottleneck Variable，裡面包含針對隐藏層的預測信息。

神經網絡預測的學習（幹貨解釋神經網絡）19

現在我們通過輸入I構造一個ZG，再把其通過神經網絡的前半部分直到隐藏層R。這樣我們得到的變量相當于一個隐藏特征f(ZG)，且和ZG對應。

神經網絡預測的學習（幹貨解釋神經網絡）20

接下來我們要做的便是最小化f(ZG)和Z*這兩個概率變量之間的距離。最終我們會把學到的ZG應用到ZI上。

Qualitative Comparison 結果對比

Vision (ImageNet)

神經網絡預測的學習（幹貨解釋神經網絡）21

我們可以發現相對于之前提出的方法，具有相當高的細粒度。

Natural Language Processing (IMDB Dataset)

神經網絡預測的學習（幹貨解釋神經網絡）22

在自然語言模型上，baseline方法完全失效且無法找到有效的特征，而我們的方法效果良好。

Qualitative Comparison 結果對比

神經網絡預測的學習（幹貨解釋神經網絡）23

我們發現，在量化實驗中，我們方法在多個基準上跑出來的結果都是要優于之前的方法。

總結

InputIBA避免了IBA中所使用的幾種近似，直接在輸入層中識别出預測信息。

InputIBA作為一個計算特征重要性的方法，實現了細密的解釋；
同時也能被應用到不同的模型架構上。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活騰訊成長守護平台官網超級家長在哪
1、首先家長通過手機微信搜索關注“成長守護平台”進入公衆号，請點擊左下角“超級家長”選擇“立即綁定”... 2023-07-04
生活正月為什麼不能剪頭發
1、俗語有一句話“正月不理發，理發死舅舅”，特别是有許多地方一直有這個傳統，就是到了臘月時候，大家都... 2023-07-04
生活檔案在自己手裡怎麼辦
1、檔案在自己的手上超過2年就會變成死檔，建議要盡快去當地的人才交流服務市場（也就是當地的人力資源或... 2023-07-04
生活羅蘭聲卡rubix44怎麼手機内錄
1、依次安裝羅蘭聲卡驅動，ASIO跳線工具，最後安裝SAM機架。2、打開SAM機架，加載ASIO跳線... 2023-07-04
生活海闊天空海南十大旅遊景點
海南處于熱帶北邊，屬于熱帶季風氣候，這是一年氣溫都很高，長夏無冬，冬夏的變化不大，整個島面朝大海，是人們避寒和享受陽光大海旅遊的好去處。那麼，本期的城市文化就帶大家一起來看看海南十大旅遊景點。天涯海角... 2023-07-04
生活适合年輕人旅遊的地方之三亞
得天獨厚的地理位置，加上大自然的鬼斧神工，造就了一批美不勝收、令人流連忘返的桃源勝境。那麼，接下來就讓我們跟着城市文化一起來了解下适合年輕人旅遊的地方之三亞吧。海南三亞推薦理由：三亞，是個被上帝寵壞了... 2023-07-04
生活什麼軟件可以讓電腦恢複出廠設置
1、不用安裝軟件。2、将電腦關機然後開機或者直接點擊重啟，然後按住DELETE鍵，這時，電腦會自動進... 2023-07-04
生活長沙十大景點花明樓
長沙又叫做星城，有着東亞文化之都的美稱。很多人對于長沙比較的熟悉估計是因為湖南電視台太出名了，這裡的美食臭豆腐也是聞名海外。那麼去長沙玩的遊客不能錯過哪些景點呢，本期的長沙文化，帶你去看看。花明樓，位... 2023-07-04
生活煤氣罐冬天凍了怎麼解決
1、冬天煤氣罐凍住了，應停止使用，放置在溫度較高的地方待其自動化凍。2、冬天使用液化石油氣時，因氣溫... 2023-07-04
生活 s990是什麼意思
1、s990便是足銀首飾的字母标志。其中s是Silver的首字母，便是代表銀的意思。而990代表的便... 2023-07-04
生活蘋果6s聽筒沒聲音打開免提有聲音
1、隻有插耳機和免提有聲音的這種情況，說明你的這個蘋果6S手機進入耳機模式了。2、應該是耳機插孔的微... 2023-07-04
生活旱龜怎麼養
1、旱龜在養殖時，可先準備好一個合适的養殖環境，可選擇飼養箱，裡面放入合适的墊材，保持好空氣流通。2... 2023-07-04
生活中國10大著名溪澗之神農溪
巍巍中華，泱泱大國，中國文化已經擁有五千年的曆史。中國山河壯麗，人文景觀更是美不勝數。其中不乏一些溪澗，溪澗的飛瀑之聲如隐雷滾滾，不絕于耳。那麼，接下來就讓我們跟着城市文化一起來了解下中國10大著名溪... 2023-07-04
生活令人陶醉世界十大水上奇迹
我們現在知道唯一人類可以居住的地方：地球。在這裡萬物得以蓬勃發展。我們地球有70%的表面積都是海洋和水，那麼這也就造就了數不勝數的水上奇迹，水有如此大的魅力。那麼就讓城市文化為你介紹，世界十大水上奇迹... 2023-07-04
生活金絡腦象征着什麼
1、金絡腦象征了作者想被提拔和重用的一種手段和信念。絡腦指的是馬籠頭，而金絡腦就是金子做的馬籠頭，屬... 2023-07-04
生活高原明珠泸沽湖旅遊景區
雲南，是人類文明的重要發源地之一，這片充滿魅力又神秘的淨土有着美麗的風景，絢爛的文化，獨特的民族風情吸引着來自世界各地的旅客。雲南有哪些地方值得我們一去呢？那麼本期的城市文化，就帶你去探訪雲南的高原明... 2023-07-04
生活公積金的繳存基數是什麼
1、公積金繳費基數是指個人有工作的情況下，工作第一年以基本工資為個人繳費基數，以後的基數是上年繳費合... 2023-07-04
生活種姜催芽方法
1、室内催芽法：在室内搭建一個長方形催芽池，高達80cm,長短視種植規模而定，在池地鋪一層曬過的麥穰... 2023-07-04
生活靜夜怎麼養
1、養殖時要用透水且透氣性好的土壤，可将五份煤渣，四份泥炭，然後在摻雜一份珍珠岩混合配制做土壤，這樣... 2023-07-04
生活該怎麼讓寶寶自己吃飯
1、家長應當讓寶寶自己嘗試在寶寶8個月大的時候，他們會想自己抓着勺子模仿大人去吃飯，這時候應當給寶寶... 2023-07-04
生活自釀葡萄酒保質期多長
1、一般來說，自制葡萄酒的保質期隻有一到兩個月。2、在家自釀葡萄酒，生産标準和衛生标準其實不達标，缺... 2023-07-04
生活不鏽鋼砧闆的害處
1、如果長期在不鏽鋼砧闆上面切菜，容易損傷刀具；2、因其為金屬材質，多數刀具等也同為金屬制品，切菜時... 2023-07-04
生活圍巾的寓意是什麼
1、圍巾代表溫暖，送人圍巾代表關心，送給老朋友代表你在乎這段友誼，送給新朋友代表你想繼續發展這段友誼... 2023-07-04
生活裝配圖明細欄尺寸
1、特征尺寸表示機器（或部件）的性能或規格的尺寸叫特征尺寸。這種尺寸在設計機器（或部件）時就已經确定... 2023-07-04
生活如何處理孩子調皮
1、處理孩子調皮的方法有：喚醒孩子的同理心，換位思考。年幼的孩子對于幹擾他人的行為不具備認知，但家長... 2023-07-04
生活豬舌頭怎麼處理才幹淨
1、燒開一鍋蔥姜水，目的是去腥，放入豬舌，水再次燒開後放一湯勺料酒，繼續煮3至5分鐘。2、将豬舌頭撈... 2023-07-04
生活虎皮蘭翻盆方法
1、準備花盆：虎皮蘭養兩年左右需換次花盆，可先選好合适的花盆，要比之前的略大一點，将新花盆放在清水中... 2023-07-04
生活 11月15日是什麼日子
1、11月15日對應節日：城市公共安全日。2、上海市委副書記、市長韓正2010年11月22日上午主持... 2023-07-04
生活切好的土豆絲怎麼保存
1、保鮮袋存儲，我們将切好的土豆絲放置在保鮮袋中，然後将多餘的空氣擠出來，放入冰箱冷藏。2、我們可以... 2023-07-04
生活二字簡單大氣公司名字
1、天壹第一個要介紹的名字就是天壹，天是上天的意思。天代表的登高望遠，深深遼闊，志向遠大，壹是第一，... 2023-07-04

tft每日頭條

> 生活

> 神經網絡預測的學習

神經網絡預測的學習

相关生活资讯推荐

热门生活资讯推荐

网友关注