tft每日頭條

 > 生活

 > 統計學數字如何計算

統計學數字如何計算

生活 更新时间:2024-08-30 17:23:08

今天推薦的書籍是 《拼湊真相》作者:蒂姆·哈福德

統計學數字如何計算(幫你分清統計數字真相的十大法則)1

2022年第69本書

統計數據很容易撒謊,但沒有統計數據,撒謊更容易。

這本書列出十大法則來幫助讀者理解統計數據,并運用大量生動、鮮活且知名的故事,輔以大量資料佐證,帶大家深入充滿虛假信息、不良研究和糟糕動機的世界,從中挖掘可貴的數據,讓“用數據溝通”變得更可信,并教會大家正确運用統計數據,幫助個人、組織或政府部門做出更好的決策。

法則一 不讓情緒控制你

統計學數字如何計算(幫你分清統計數字真相的十大法則)2

當我們遇到某個世界問題的統計數據,想着要不要在社交媒體上點贊轉發,或者激烈駁斥時,停一下,先問自己這樣一個問題:“我的情緒為何如此激動?

我們這樣做不僅僅是為了自己,還有一種社會責任在裡面。我們已經看到社會壓力在我們的觀念和思考問題的方式方面的影響有多大。我們要慢慢下定論,學會先控制自己的情緒和抛開黨派立場,隻關注事實本身,這樣我們不僅可以更清醒地思考問題,也為他人提供了正确的思考問題模式,即我們不是以某個政治派别的成員的立場,而是以持不偏不倚态度的個體身份思考和推理問題的。我想形成這樣的習慣。我希望這也是你的願望。

情緒能左右人的思考,範•米格倫洞悉這樣的人性。所以當解讀統計數據時,專業知識和技術固然重要,但如果不給情緒這匹野馬套上缰繩,任由它帶着我們時

信時疑,我們終将會馬失前蹄。

法則二 對标個人經驗

統計學數字如何計算(幫你分清統計數字真相的十大法則)3

如果我們不知道統計數據,我們對世界現狀的認知很可能大錯特錯。人們很容易被自己的雙眼蒙蔽,以為看到的都是真相,事實并非如此。有些現象,即使得到了真實數據,我們也搞不懂其原因,但如果沒有真實數據,恐怕連知道真相的機會都沒有。

然而,如果隻看數據,我們就隻能看到世界的一角。所以在看完數據表格之後,我們也可以擡起頭來,帶着好奇心去看去聽去摸,去感受真實的世界。

那麼,我的第二條建議是,試着從兩個角度看問題:蠕蟲視角和鳥瞰視角。兩個視角會給你展視一些不同的東西,這可能也成為你的難題:這兩種景象敦真敦假?這樣的疑問會讓你踏上探究之旅。我們在後面會發現有時統計數據會誤導我們。有時,我們自己的眼睛欺騙了我們;有時,一旦我們明白了事情的緣由,數字和眼晴所見的不符也就可以理解了。要做到這一點,通常需要我們問一些聰明的問題。

法則三 搞清楚統計的數據是如何定義的?

統計學家有時被人嘲笑為“隻會計算”。這種不屑既誤事又傷人。制定政策需要的數字豈是兒戲,我們不僅難在計算,更難在界定。一旦你明确了要算的是什麼,計算就是輕而易舉的事,但如果你不理解這個界定,那麼即使有了數字也不會看出所以然。

所以可悲就在于我們中很多人從一開始就犯了方向性錯誤。那麼,如何避免掉入這個陷阱呢?

要學會問問題:

問問統計對象是什麼,統計數據背後有什麼故事。人們總是天真地認為統計最多就是跟數字打打交道,比如,怎麼記一個百分比,怎麼化整為零并分類。其實這些都是數學問題,都是技術問題。隻有方向對了,技術才派得上用場,對吧?

法則四 從整體角度看數據

如何評論一個統計結果?

除了前面三個建議之外,你還要學得把數據放到大背景裡去看,看宏觀層面,所謂登高才能望遠。

找一些能給你帶來宏觀感受的東西,比如把一個國家的情況與另一個國家的情況進行比較,或者算出一些政府拟支出的人均成本。

有時需要更深入的了解統計數據是如何産生的。

法則五 看看硬币的另一半

你如果對某個觀點有疑問,可以很容易找到第三方的意見。因為幾乎所有學科,不論是理工類還是社科類,隻要重大研究一出來,全網的同行業專家很快會了解,并将他們的意見和想法發表在網上。很多科技記者認為,互聯網給他們這個職業幫了很大的忙;

在一項對約100名歐洲科技記者進行的調查中,2/3的人認同這一觀點,隻有不到10%的人不認同。為什麼這樣說呢?因為在互聯網上,你可以很容易找到你要看的論文,還可以看到底下的評論,也可以聯系到專家,讨教他的意見。

如果你想要了解醫療方面的事,我可以告訴你一個咨詢的好去處:科克倫醫學文獻數據庫 (Cochrane Col laboration〉。它是以醫生、流行病學家和循證醫學倡導者阿奇•科克倫的名字命名的。1941年,科克倫在被德國人俘虜投入戰俘營後,居然進行了一次臨床試驗,這需要巨大的勇氣,決心和隐忍能力,三者缺一不可。

當時監獄裡的戰俘都病得厲害,科克倫自己也是,所以他懷疑這是由于飲食中缺少某種元素引起的。他知道自己掌握的信息還不夠多,沒法很有把握地給出治療意見,但他沒有絕望,也沒有任憑直覺,而是設法組織他的戰俘同伴測試了不同飲食的效果,終于發現他們缺少的是什麼,然後向戰俘營軍官提供證據,後來維生素補充劑被及時供給戰俘營,從而挽救了很多人的生命。

而後來伊恩 查莫斯爵士根據他的觀點,開始系統收集醫學文獻,發展成一個醫學科研人員的國際性群體,他們對各種臨床課題進行審查、評價、綜合分析,并公布最新數據。他們自稱為科克倫協作組織,也就是科克倫醫學文獻數據庫。這個數據庫免費開放,可以看到任何課題的綜述,以及在随機試驗的基礎上,對該課程研究的摘要性描述。

法則六 查看統計樣子是否覆蓋全面

統計學數字如何計算(幫你分清統計數字真相的十大法則)4

不管是美國大選,還是英國脫歐,在之前的民調結果都跟結果完全不同。很大一部分原因出在,民調機構試圖尋找一個最有代表性的選民群體樣本。

而很多調查都是同樣。2011 年英國的人口普查,答卷率為 95%,還有 5%的人沒有回應。就這一點,就可以說人口普查數據失真。

如果樣本本身就跑偏了,算法再怎麼分析,它得出的結論也一定是跑偏的。

除非我們親力親為地收集數據,否則對統計漏失能做的有限。但至少,在别人給我們提供數據時,我們可以,也應該記得問一下,哪些人或哪些内容可能遺漏了。

一些數字的缺失是很明顯的,例如,有關販賣婦女或吸毒等犯罪方面的真實數據就沒有被很好地收集。其他類型的遺漏隻 要仔細查看也能發現。比如,研究人員可能沒有明說某項實驗隻研究男性,這種信息有時會隐藏在統計附錄中,或者有時根本沒處找。但快速調查一下,就會發現這項研究的瑕疵。如果一個實驗隻研究男性,我們不會認為實驗要是包括了女性,還會得出同樣的結論。如果政府的統計是針對一個家庭的收入的,我們必須認識到,我們不可能由此了解到太多這個家庭裡誰花錢最多的信息。

大數據看起來很全面,也可能用途很廣,但一個都不少,是一種容易讓人上當的錯覺:一切盡在自己掌握中。其實我們必須常問:〝數據裡少了誰?漏了什麼?,這隻是我們對待大數據要謹慎的原因之一。

大數據代表者數據收集和統計方式的巨大變化.這種變化的影響還有待我們審視。

法則七 要求用算法統計透明

“大數據”正在改變我們周圍的世界,如果電腦以人類不能理解的方式代替人類做決定或預判,自然會遭到排斥。我認為人類的擔心并不多餘。現代數據分析可以産生一些奇迹般的結果,但大數據往往不如小數據可信。小數據通常可以被核實,大數據往往被深藏在矽谷的地庫裡。分析小數據的統計工具也容易檢驗,但模式識别算法則容易成為商業領域敏感的神秘黑匣子。

所以我認為我們既要抵制人們對大數據和算法的炒作,也要警愓對它們的全盤否定。涉及要緊的事情,我們應該就事論事地不停追問:底層數據是否可訪問?算法的性能是否進行了嚴格的評估?例如,通過随機試驗,看看人們是否在沒有算法幫助的情況下做得更好。是否允許外部專家對算法進行評估?他們的結論是什麼?我們絕不可以把算法和人都絕對化,認定一個怎麼都比另一個好,這樣一刀切的想法才是個大大的陷阱。

法則八 統計數據來之不易

即使官方的統計數據如我們所願, 客觀、公正、不受任何幹擾地編制出來了,它們也不會永遠完美無瑕,因為我們關心的一些事情很難用數字衡量,比如家庭暴力,逃稅或露宿街頭的情況。所以,官方統計學家無疑還有很大的進步空間,比如讓他們收集的數據更具代表性、相關性,更契合日常生活實情,并且完全公開,無所保留。他們越往這個方向努力,就越能赢得我們的信任。

盡管官方統計局存在種種問題和缺點,但它們仍然是我們最可信任的機構。當一個國家挑出一群統計學上的精兵強将,并愛護他們時,他們會不遺餘力地将事實以精準數據的方式呈現給大衆來回報這份信任。但當一個國家的統計機構辜負了這種信任時,它們也會受到國際同行毫不留情的鞭撻。當一個剛正不阿的統計學家受到政客的陷害時,同樣的群體也會起來聲援他。統計人員大多比我們想象的勇敢無畏。他們有捍衛數據真理的職業操守,我們決不能無視,更不能輕視這份操守,

作為公民,我們也有捍衛統計這個國家公器的責任。無論是出于私人目的,還是以監督為目的,如果我們想了解國情,那麼我們通常會從機構或組織,如國家統計局,歐盟統計局。加拿大統計局,勞工統計局和國會預算辦公室等處提供的統計數據開始。

世事紛繁,但作風硬朗, 思想獨立的統計機構可以讓民衆看到真相。

法則九 不要被漂亮的信息圖迷了眼

南丁格爾做了正确的事情,推動了曆史的進程,但許多濫用美麗信息圖的人卻可能正在做相反的事,因此,當我們看那些美麗的圖形的時候,要警惕,要先用辨别它們的良莠。

首先,也是最重要的,要稍安毋躁。因為視覺會觸發感受,所以要先審視自己看到圖後的情緒反應,是覺得勝了,還是想辨解,是生氣,還是想慶賀?要警惕這種情緒對你正确解讀信息的影響。

其次,你要問自己這些問題:我是否理解圖上的術語?軸線代表什麼?統計對象是什麼?統計的範疇說了嗎,還是取樣有限?如果圖片反映的是複雜的分析或實驗結果,我看懂這個過程了嗎?如果我判斷不出圖片描述的是否屬實,那些專家的意見能信嗎?我有沒有向誰讨教過經驗呢?

當你看到可視化的信息時,你要知道有人在輸出觀點。正如話有三說,用圖說話也無可厚非。隻要圖說的有道理,我們也不應故步自封,要随時以圖為鏡,矯正自己的錯誤看法。

法則十 适時而變,識勢而變

統計學數字如何計算(幫你分清統計數字真相的十大法則)5

費雪和凱恩斯都是業界大腕,他們手頭有大量現成的信息,也會認真地收集更多數據。正如亞伯拉罕• 布雷迪烏斯這位藝術鑒賞大師被僞造者米格倫騙得暈頭轉向一樣,費雪和布雷迪烏斯落得如此下場不是因為他們專業不夠精深,而是因為他們被感覺沖昏了頭。

本書的出發點是,數據的收集和分析是能夠幫我們了解世界本真的。但我也同時指出,我們經常搞錯,不是因為沒有數據,而是因為我們拒絕接受數據給我們呈現的東西。對費雪和其他許多人來說,拒絕接受這些數據的原因是他們拒絕承認世界己經變了模樣,時代己經往前走了,而他們還留在原地。

費雪的競年對手之一,一位叫羅傑•巴布森的經濟預言家不無惋惜地評論費雪為“當今世界最偉大的經濟學家之一,也是貢獻最大、最無私的公民,但作為預言家,他失敗了,因為他認為世界整體是理性的,不是感性的。

總結:

第一,我們應該學會在看到數據結果時,稍稍停頓一下,觀察自己的情緒反應,看會不會因受情緒擺布而接受或拒絕數據結果。

第二,我們應該從個人經驗出發,對數據的解讀。應将“烏瞰”的廣角視角與 “蠕蟲”的聚焦視角結合起來。

第三,我們應該看看自己是否能理解數據标簽上的内涵和外延。

第四,我們要把數據放到應有的背景中去看,并學會對比着看數字的含義

第五,我們應該看看統計數據後面是否還有故事,是不是哪些數據己經被篩掉了。

第六,我們應該問一下統計樣本是否全面,是否己将某些對象排除在外,如果将其包括進來,統計結論是否會有所不同。

第七,我們不應該無條件信任大數據和算法,我們要明白無論大數據還是算法,沒有透明性,信任度就要打折扣。

第八,我們應該多多關注官方統計機構,要保護那些捍衛統計公正性的英勇的統計學家。

第九,任何美麗的圖表或信息圖都良莠不齊,我們要睜大眼睛。

第十,我們是否能保持開放心态,問問自己會犯什麼錯,情況是否已經發生了變化

事實上,與其說是戒律,不如說是經驗法則,或者說是我從經驗教訓中養成的思維習慣。當你遇到對你很重要的統計數據時,不妨用這些方法試一下。

不需要每一個統計數據都核對一遍,但對你的新聞來源做個初評它們還是有用的:記者有沒有把術語解釋清楚?

有沒有提供數據背景?有沒有有評估數據來源的可靠性? 如果這些思維習慣你還沒有養成,就容易上假數據的當。

好奇心你幫助你突破局限,去尋找真相。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved