如何評價幸存者偏差-tft每日頭條

如何評價幸存者偏差

生活更新时间:2026-07-30 18:43:31

導讀：本文帶你了解數據收集的偏差。

作者：徐晟

來源：華章科技

如何評價幸存者偏差（終于有人把幸存者偏差講明白了）1

數據收集是一項重要的工作，需要投入大量精力和時間，這是因為數據質量直接關乎分析結論的成敗。然而，錯誤的數據收集方法可能造成結果偏差。

比如統計對象出現錯誤，明明應該統計數據集合A，卻統計了數據集合B。又比如統計對象不全面，隻抽樣了部分數據，卻沒有統計全體，或者忽略了數據分布存在偏斜等。

這些錯誤的數據收集方法會産生兩種常見的數據偏差——幸存者偏差和選擇性偏差。

01 幸存者偏差

幸存者偏差指用于統計的數據僅來自幸存者，導緻結論與實際情況存在偏差的情況。

幸存者偏差源自一個真實故事：二戰時期，美軍統計了作戰飛機的受損情況，他們發現，返航飛機各個損傷部位被擊中的彈孔數不同。這些飛機發動機部位的彈孔數最少，機翼的彈孔數量最多。于是有人提出，要趕緊加固飛機機翼，因為這些部位更容易受到敵方炮火的攻擊。

可是，美國哥倫比亞大學的沃德教授立即否決了這個方案。沃德教授是一位統計學專家，他應軍方要求提供相關專業建議。沃德指出，應該強化的不是機翼，而是發動機。從理論上講，飛機各部位的中彈概率應該是相同的。發動機部位的彈孔明顯偏少，隻能說明：那些被擊中引擎的飛機大多沒有返航。

這就是幸存者偏差，軍方隻看到幸存下來的飛機，卻沒有意識到它們隻是一部分數據，不能反映飛機受損的真實情況。

選擇正确的數據樣本非常重要。我們必須保證數據考察是全面的，而非其中的一部分。在很多場合，人們下意識地會做出具有幸存者偏差的選擇。

比如一個粗心的研究者在統計醫學數據時，為圖方便選擇了住院病人為研究對象，卻沒有意識到這種做法可能為研究結果帶來偏差——隻有病人才去醫院。

一些成功學的書中提到，比爾·蓋茨、紮克伯格、喬布斯、埃裡森等成功人士都在大學退學創業，似乎從大學退學更有可能獲得成功。但這隻是幸存者的案例，我們從未聽到失敗者故事，更不能說明大學退學創業就是成功的必需特質。

如果一項研究是通過已有的樣本去研究過去某個規律，那就要當心了，因為它很有可能存在幸存者偏差。當我們選擇已有的樣本時，就隻看到了幸存者，而忽略了沒被統計到的樣本。

比如，查看公司财務報表時，就已經過濾掉了那些經營不善而破産的公司；查看老年人在醫院的診療記錄時，就默認地排除了沒有活到老年的人群；統計某款手機軟件的受歡迎程度，不自覺地排除了那些買不起手機或者從未安裝過該手機軟件的人。這樣的例子比比皆是。

之所以會産生幸存者偏差，是因為很多人從一開始就搞錯了統計樣本，隻看到經過篩選的數據，但沒有意識到篩選的過程。如果隻是人為地選擇部分觀察數據，那就無法保證結論的客觀性。

要獲得“全樣本”數據絕非易事。由于認知局限，很多人隻看見了那些能看見的現象——比如受損的飛機、就醫的病人、成功的企業家、公司的報表，但忽略了沒有看見的真相—未返航的飛機、健康的人、失敗的創業者、破産的公司，而這些被忽略的數據同樣重要，甚至更加重要。

如何評價幸存者偏差（終于有人把幸存者偏差講明白了）2

02 選擇性偏差

19世紀初期，人們認為統計就是要追求考察對象的大而全，數據越多，結果就越準。不過，想要考察大而全的總體，有時不具備操作性。于是一些統計學家提出了抽樣的想法，認為隻要方法得當，就算不考察總體，也能通過研究一部分有代表性的随機個體來推斷出總體的特征。

這些從總體中選出來的個體的集合，叫作樣本，随機選擇的動作叫作抽樣。統計學界圍繞“抽樣”這件事争論了好幾十年。直到20世紀30年代，抽樣的科學性才被學術界逐漸認可。

抽樣是一種非常好的了解大量樣本空間分布情況的方法，适用于大樣本。抽樣的對象要盡可能分散和有代表性，這樣才能體現出整個樣本的分布特點。

不過，抽樣畢竟對研究對象做了精簡，因此它很可能存在樣本選擇上的偏差，即選擇性偏差。比如想要調研中年男性的健康程度，抽樣時隻選了亞洲人，這個抽樣對象顯然不夠全面。又或者，調研時隻收集了若幹人的數據，研究樣本過少，因此得到的結論也不具備普适性。

選擇性偏差是在抽樣時出現的一大問題。有時，人們為了證明自己的觀點，傾向于選擇特定的數據來支撐結論，從而忽略了其他證據。采用有偏差的抽樣數據，幾乎可以得到人們想要的任何結論。

假如在調研問卷中問這樣一個情感問題：“假如愛情可以重來，你是否還會選擇和他/她在一起？”結果會如何呢？我想多數會收到“不會”的答案。這并不是真相，隻是那些回複的人群可能是“有偏的”。

因為調查問卷是自願回複，所以對這個話題抱有強烈負面感受的人，更有可能不厭其煩地做出回應，那些生活幸福的人也許随手就将問卷丢進了垃圾桶。

又比如，去高檔的購物場所進行調研，會出現選擇性偏差，因為去那裡消費的人相對富有；而如果去山村調研，則很可能得出完全相反的結論。

在以上的例子中，前者由被調查的人自行決定要不要回應，後者則由調查人員決定如何選取樣本，這兩種調查方法都會人為地影響統計結果。

抽樣的結論若要很好地代表整體，需要具備兩個條件：

一是樣本足夠大，根據大數定律，這樣的樣本分布更接近總體；
二是抽樣方法要正确，确保抽樣是完全随機的，它既不受調查者的選擇影響，也不受被調查者的偏好影響。

采用随機抽樣的方法，可以一定程度上消除對樣本選擇的偏差。

以民意調查為例，我們知道，美國的總統選舉永遠是個熱門話題，網絡和媒體會密切關注，并跟蹤報道一手資料。其中一個熱門話題就是關于選舉結果的預測。由于選票會涉及不同階級、不同種族、不同利益的人和團體，所以要調研民衆意向，抽樣時就應該考慮兼顧各種利益團體的樣本，否則很有可能出現帶有偏差或者歧視的結論。

為了調查民衆的看法、意見和心态，喬治·蓋洛普設計了一種蓋洛普民意測驗。他根據年齡、性别、教育程度、職業、經濟收入、宗教信仰這6個标準，在美國各州進行抽樣問卷調查或電話訪談，然後對統計結果做出分析。此方法産生于20世紀30年代，今天仍會被使用，并且有着相當高的權威性。

總之，抽樣要針對大樣本，保證樣本的随機性。如果抽樣的樣本很少，或由于其他原因導緻了統計不充分，那麼結論很可能是錯誤的。

如何評價幸存者偏差（終于有人把幸存者偏差講明白了）3

小結

數據樣本偏差帶來了“以偏概全”的風險，它會得出“差之毫厘，謬以千裡”的錯誤結論。過去，人們擔心小樣本導緻統計誤差；而在大數據時代，這個問題并不會消失，反而變得更加複雜，也更難察覺。

幸存者偏差提醒我們，要考察所有類型的數據。選擇性偏差提醒我們，要客觀地挑選數據。前者是因為沒有準确選擇研究對象而導緻的偏差，後者是由于沒有“公平”地挑選數據導緻的偏差，兩者都未看清數據的全貌。

為了避免幸存者偏差，我們需要擁有全面的數據集合，而不是有意或無意地排除總體中的某個子集。為了避免選擇性偏差，我們應該客觀地考察所有數據，而不是僅僅考慮少量的數據，或者支持既定假設的數據。

關于作者：徐晟，某商業銀行IT技術主管，畢業于上海交通大學，從事IT技術領域工作十餘年，對科技發展、人工智能有自己獨到的見解，專注于智能運維（AIOps）、數據可視化、容量管理等方面工作。

本文摘編自《大話機器智能：一書看透AI的底層運行邏輯》，經出版方授權發布。（ISBN：9787111696193）

如何評價幸存者偏差（終于有人把幸存者偏差講明白了）4

《大話機器智能：一書看透AI的底層運行邏輯》

推薦語：AI是什麼？機器如何擁有“智能”？“智能”如何起作用？本書以通俗易懂的方式，勾勒人工智能的全貌，展現AI的底層運行邏輯，即AI是如何工作的。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活空中瑜伽有哪些保健效果
第一、空中瑜伽可以幫助人體解壓，蕩秋千般的感覺讓人仿佛回到了孩童的歲月，自由自在飛翔的感覺能讓我們暫時忘記生活的艱辛，達到釋放壓力的目的。第二、當我們練習空中瑜伽時，需要脊柱來支撐身體，使我們脊柱周圍的血液快速流動，進而達到鍛煉脊柱的目的。空中瑜伽對治療辦公一族的腰酸背痛有顯著作用。第三、空中瑜伽還... 2023-07-08
生活辦公室搞笑短句
1、辦公室裡，同事甲跑過來找同事乙修改圖紙。由于甲已經來過好幾次了，所以乙有些不耐煩，抱怨說：“已經... 2023-07-08
生活路透照是什麼意思
1、路透照的意思就是快訊，或者更簡單點說就是最新時訊消息，片場路透就是片場快訊。2、直擊片是英國著名... 2023-07-08
生活文件被占用無法發送是什麼意思
1、文件被占用無法發送，意思是因為該文件已經被打開，因此隻要找到該文件的文件夾将其關閉即可恢複，也可... 2023-07-08
生活女性長輩生日祝福語溫馨
1、外婆的心，是最溫暖的春風；外婆的手，是最靈巧的畫家；外婆的笑容，是世界上最溫暖的彩虹！親愛的外婆... 2023-07-08
生活商業用水和居民用水區别
1、用途區别：商業用水就是用來從事商業活動的水，比如說餐館之類的，居民用水就是老百姓平時生活用水。2... 2023-07-08
生活淘寶店鋪購物須知
第一、不看模特看自身這裡指的是買一些服飾類的時候，上衣褲子鞋帽之類，千萬别看模特穿的那些圖片，沒有模特的身材膚色和氣質是穿不出效果的，想要購買，先看看自身條件再做選擇。第二、看差評中評而非好評在淘寶店購物的時候，千萬别隻看好評，太多淘寶店的好評幾乎都是刷出來的，那些差評以及中評比較的真實。第三、追評... 2023-07-08
生活水煮魚片怎麼做
1、将魚去頭，剔骨，取下兩面淨魚肉，魚骨剁成小塊，魚肉順着魚尾方向斜刀片成薄片。2、将片好的魚片加料酒、胡椒粉、少量鹽、生抽、蛋清及澱粉抓勻，腌制10分鐘。3、蔥姜蒜，幹辣椒，花椒準備好。4、白菜洗淨，菜葉用手撕成大片，菜幫子用刀斜切成薄片。5、鍋裡倒入一點底油燒到六成熱，放入花椒，幹辣椒慢火炸，待... 2023-07-08
生活非洲茉莉的養殖方法和注意事項
1、要選擇疏松透氣的有機土壤，放入花盆中，将非洲茉莉重在花盆中。2、給茉莉的葉子噴适量的水，給非洲茉... 2023-07-08
生活淘寶聚劃算團購怎麼報名聚劃算報名步驟
第一、淘寶聚劃算是有基礎條件的，你要滿足基礎條件必須是淘寶商家才可以在淘寶聚劃算報名團購，在電腦上打開浏覽器并進入淘寶網。第二、進入淘寶後，登錄個人信息，點擊聚劃算進入。第三、聚劃算界面的右上角，點擊商戶中心進入。第四、進入之後，點擊我要報名進入，提交信息即可報名加入團購。 2023-07-08
生活适合中秋國慶的優美句子
1、悠悠的雲裡有淡淡的詩，淡淡的詩裡有綿綿的喜悅，綿綿的喜悅裡有我輕輕的問候，國慶中秋快樂!2、月到... 2023-07-08
生活家用網線插座接法圖解
1、将牆内網線或槽線用剝線鉗，在離線頭10厘米處，去除網線皮，不要傷到金屬線路。2、用打線鉗内側将網... 2023-07-08
生活怎樣練出有靈氣的眼神
1、首先需要保持充足的睡眠，充滿血絲或者混沌不清的眼睛是不可能有靈氣的感覺的。保持睡眠充足可以讓眼睛... 2023-07-08
生活二手房抵押可貸多少額度
1、二手房申請抵押貸款，可以申請的貸款額度要看二手房目前的評度估價值是多少。一般來說，可以申請得到的貸款額度可以達到目前市場評估價值的70%。不過不同的情況，二手房抵押貸款的額度比例會有一定版的變化。2、個人申請二手房抵押貸款的額度，同時還和申請人的還款能力有關，申請人還款能力越高，可以申請的貸款額... 2023-07-08
生活手機裡通訊錄找不到了怎麼辦
1、現在的大部分智能手機都帶有雲賬戶功能，手機用戶可以通過雲賬戶功能将丢失的手機聯系人進行恢複。安卓... 2023-07-08
生活如何強制解除qq密保手機
1、首先，登錄手機qq，進入qq的首頁，點擊qq左上角的頭像，可以進去個人中心。2、進入個人中心之後... 2023-07-08
生活鞋底磨損怎麼修複
1、膠水。如果鞋底磨損程度不算嚴重，可以自行到超市買強力的膠水，用膠水粘到磨損處，但要注意的是，粘過膠水後的鞋子，不能馬上穿，放在通風的地方晾幹，一天過後才可以穿，不然膠水會容易裂開。2、鞋掌。如果平時愛好運動着，那麼運動鞋底的磨損幾率相對來說比較大，在購買了新鞋子後，可以去專業的修鞋店，在鞋底打上... 2023-07-08
生活砌磚怎樣瞄線
1、先在牆兩角鋪上引線磚、再把線挂在兩端、就可以鋪中間的磚了、一般線離磚要有3毫米的間隙，然後開始砌... 2023-07-08
生活真假枸杞的鑒别方法
1、果臍是明顯的白色。甯夏産出的枸杞，每一粒的果臍部位都是白色的。不參雜任何其他的顔色。果臍部位的白... 2023-07-08
生活蚯蚓如何做魚餌
1、制作碎蚯蚓拉餌：将小紅蚯蚓裝在木質蚯蚓盒内，然後滴入适量淡鹽水，存放一天後蚯蚓就會把腹中污泥基本... 2023-07-08
生活南浔古鎮好玩嗎南浔古鎮旅遊攻略
第一、南浔古鎮好玩嗎？南浔古鎮裡面有很多古典的建築，主要是看景，玩的東西幾乎沒有，不過總體來說還是不錯的。第二、去南浔古鎮旅遊要怎麼玩？進入南浔古鎮是需要買門票的，現場買票是100元每人，可以在網上買，網上是88元，很實惠。第三、南浔古鎮景點多，可按照小蓮莊、嘉業堂藏書樓、劉氏梯号、廣惠宮、鎮史館、... 2023-07-08
生活怎樣識别真假迪士尼書包
第一、看内襯正版的迪士尼書包内襯有MickeyMouse、Princess等logo，而且很清晰，而假冒的迪士尼書包是沒有的，要是有也不是很清晰。第二、看拉鍊扣正版的迪士尼書包拉鍊扣會有米奇、米妮、安妮公主等迪士尼人物的頭像，而假冒的是沒有的，就一個普通的拉扣。第三、卡扣正版的迪士尼書包卡扣處印有米... 2023-07-08
生活孔雀竹芋可以在室内養嗎
1、孔雀竹芋是放在可以室内的。2、觀賞性：它本身是觀賞植物。而且，它本身是觀葉的，它的葉子非常漂亮，像是孔雀開屏一樣，極具觀賞性。它也會開花，但是花期非常短，相對于葉子來說還是葉的觀賞性更大一些。它放在室内可觀賞，特别是配上一個好看的背景。另外，它還可以調節人的情緒、陶冶情操等。3、淨化性：首先是釋... 2023-07-08
生活男人吃什麼補腎最好呢
1、豆制品、花生等富含精氨酸的食物精氨酸是精子形成的必需成分，它可以促進體内一氧化氮的釋放，起到放松... 2023-07-08
生活一千元擺地攤賣什麼好
1、集市賣小吃、俗話說民以食為天，無論在什麼時候人都要吃東西，且各種小吃很受歡迎，比如湖南臭豆腐、桂... 2023-07-08
生活聯想筆記本怎麼樣買筆記本電腦什麼牌子...
第一、每一款産品都是有優點和缺點的，沒有十全十美的産品。聯想筆記本電腦的優點是質量問題少，價格很實惠，性能也算是可以的，是大學生和剛畢業沒存款的年輕人最佳選擇。第二、聯想筆記本電腦的缺點就是用久了很容易卡機，電池不耐用，而且外觀也比較普通，沒什麼特色。追求高端筆記本電腦的話，就不要選擇聯想電腦，聯想... 2023-07-08
生活貓咬了怎麼處理
1、如果被貓咬傷，必須要嚴格消毒處理傷口，必須要用雙氧水以及生理鹽水，反複把傷口沖洗幹淨之後再塗上碘... 2023-07-08
生活熟牛肉常溫可放幾天
1、熟牛肉常溫一般隻能保存1～2天，如果是冬季室溫的話，保存時間可以稍微延長一些，但是最好還是盡快吃... 2023-07-08
生活電腦開機提示你的設備需要恢複該怎麼處...
1、首先檢查電腦的外部接線是否接好，把各個連線重新插一遍，看故障是否排除。2、如果故障依舊，接着打開... 2023-07-08
生活怎麼投訴拼多多商家怎麼舉報多多店不良...
第一、将手機浏覽器設置為電腦版，而後搜索拼多多新電商開拓者第二、進入官網後，找到右上角的廉政舉報第三、進入後閱讀廉政舉報須知，八秒後點擊舉報第四、進入舉報界面後填寫相應内容即可舉報 2023-07-08

tft每日頭條

> 生活

> 如何評價幸存者偏差

如何評價幸存者偏差

相关生活资讯推荐

热门生活资讯推荐

网友关注