首發于超級預測
導語:貝葉斯是一個人的名字,貝葉斯定理反映了一種考慮問題的思維方式。
一般人的思維是先找到原因,再分析結果;貝葉斯則相反,就是也不知道期間發生了什麼,隻看到了結果,但可以通過結果來分析各種原因的可能性。
貝葉斯定理的數學方程長這樣:
本文内容部分來自 farnamstreet 等網站相關文章;雲猜平台翻譯整理如下,轉載請聯系
如何用概率來思考問題?在生活中,或賭局上,根據所掌握的所有信息,用概率與絕對值來思考問題是很有用的。你可以借此改進先前的決定,并得到更好的結果。與此同時,概率思維也會督促你經常思考,我對這個預測有多自信?什麼樣的信息會影響這種信心?
貝葉斯定理
貝葉斯定理涉及到一些複雜的數學問題,但它的核心非常簡單:概率估計應該從我們已知的世界開始,然後随着新信息的出現逐步更新。貝葉斯定理是一種将概率思維融入我們生活的簡便方法。利用已有的知識去評估事物發生的概率就是貝葉斯式的思考方式。托馬斯·貝葉斯(Thomas Bayes)是18世紀的一位英國牧師,他最有名的作品《一篇旨在解決機會主義問題的論文》(a Essay toward Solving a Problem in the Doctrine of Chances) 是在他去世兩年後,由他的朋友理查德·普萊斯(Richard Price)在1763年交給了英國皇家學會。
這篇文章并沒有包含這個定理,而是種下了這個想法的種子。了解概率計算的确切數學方法并不是理解貝葉斯定理的關鍵。貝葉斯關注的是,對真實性以及準确性的概率分配,更重要的是,當我們遇到影響情況的新數據時,我們應該如何調整對概率的估計。後來,法國學者皮埃爾-西蒙·拉普拉斯(Pierre-Simon Laplace)等人将這一理論發展成為一種有用的思考和計算工具。
托馬斯·貝葉斯
舉個例子:
我們想要做一個預測。預測北京市冬天,某一天下雪,那麼當天堵車的概率是多少?
這裡A代表堵車,B代表下雪
假設北京冬天堵車的概率是 80%(P(A) = 0.8)
假設北京冬天下雪的概率是 10%(P(B) = 0.1)
如果某一天堵車,下雪的概率是 10%, P(B|A) = 0.1
根據公式和已知概率,我們可以得到P(A|B)
0.1*0.8/0.1=0.8
也就是說如果北京冬天某一天下雪,那麼有80%的可能性,當天會堵車。
這個非常簡單的推導過程就可以被稱為貝葉斯式的分析。貝葉斯定理在現實生活中的有什麼應用呢?最常見的是分類問題,比如判斷一封郵件是不是垃圾郵件。如果郵件中出現了“彙款”這個詞,它是垃圾郵件的可能性是多大?可以認為,郵件中的每一個詞都是特征之一。或者是給新聞分類,比如一篇文章中,如果出現了C羅這個詞,那麼這篇文章是體育類文章還是科技類文章呢?每條新信息都會影響原始概率,這就是貝葉斯定理的關鍵之處。
回到那條公式。我們把P(A)稱為“先驗概率”(Prior probability),即在B事件發生之前,我們對A事件概率的一個判斷。P(A|B)稱為“後驗概率”(Posterior probability),即在B事件發生之後,我們對A事件概率的重新評估。P(B|A)/P(B)稱為“可能性函數”(Likelyhood),這是一個調整因子,使得預估概率更接近真實概率。
通過以下這個例子,我們再鞏固一下對于貝葉斯定理的理解:
一所學校裡面有 60%的男生,40%的女生。男生總是穿長褲,女生則一半穿長褲一半穿裙子。假設你走在校園中,迎面走來一個穿長褲的學生,你能夠推斷出他(她)是男生的概率是多大嗎?
同樣,分清和理解問題中的規律和現象(理清問題中的規律和現象是理解和運用貝葉斯公式的關鍵)。兩個規律:男生規律和女生規律。而且知道各個規律的發生概率:P(男生規律)=0.6,P(女生規律)=0.4。兩種現象:穿長褲現象,穿裙子現象。而且知道各個現象發生概率,假設有10個學生,6個男生,4個女生,那麼,P(穿長褲現象)=(6 2)/10=0.8,P(穿裙子現象)=2/10=0.2。另外,P(穿長褲現象|男生規律)=1.0,P(穿裙子現象|男生規律)=0.0,P(穿長褲現象|女生規律)=0.5,P(穿裙子現象|女生規律)=0.5。現在,看到了一個穿長褲的學生,需要推斷是男生的概率,即P(男生規律|穿長褲現象)。
有了前面那些知識,根據公式
P(男生規律|穿長褲現象)=P(穿長褲現象|男生規律)*P(男生規律)/P(穿長褲現象)
還原為數字,即是1*0.6/0.8=0.75,這也就意味着,迎面走來一個穿長褲的學生,ta是男生的可能性為,75%。
衡量證據的份量
人們總是傾向于去關注最新的信息,而習慣性地忽略先驗信息。但貝葉斯定理背後的主要思想是,我們必須根據需要不斷更新我們的概率估計。納特·西爾弗(Nate Silver)和艾倫·萊恩(Allen Lane)在他們的著作《信号與噪音》(The Signal and The Noise) 提醒我們:當我們把新信息放在我們已知、更大的背景下時,它們才往往成為最為關鍵的那一部分。
貝葉斯定理是對我們預測未來努力的一個重要的現實檢驗。它可以用于任何事情,從宏觀經濟預測到一局撲克遊戲,貝葉斯定理即可以看作是一個數學公式,但貝葉斯推理也可以作為一種思維方式和經驗法則。我們傾向于要麼否定新的證據,要麼接受它,當然,在這一過程中,我們也簡化了許多問題。貝葉斯主義者試圖以一種明智的方式權衡舊的假設和新的證據。
貝葉斯定理的局限性
不要認為貝葉斯定理可以解決一切問題。首先,世界本身便是一個不斷變化的概率陣列;其次,我們還必須記住歸納推理的局限性。某事為真與說它為真是兩碼事。想想伯特蘭·羅素(Bertrand Russell)的《哲學問題》(The Problems of Philosophy) 中提到的這些例子:
經常沿着某條道路行駛的馬,很可能會拒絕走另一條路;家養動物看到喂食者,就會期待食物;終生喂養那隻雞的人最終扭斷了這隻雞的脖子,所有這些對統一性的粗略期望都容易産生誤導,我們不得不接受這樣的事實,更均勻的、更細緻的看法可能會更加适用于生活。
不過,歸根結底,學習貝葉斯推理可以改變你的生活,在你沉浸于貝葉斯定理一段時間後,它開始對你的思維産生一些根本性的改變。例如,你會更加意識到你的信念置于某種灰色地帶;它們不是黑色,或者白色,它們從0到100%之間不等,而且處在一個不斷波動的狀态。
使用貝葉斯定理的妙處在于它鼓勵不斷更新,還使我們有機會從多個角度審視局勢,進而鼓勵開放的思想。所以,接受不确定性,并将其轉化為你的優勢。不要因為拒絕新信息而固守過時的信念,而是要通過一個評估概率的系統來接受你遇到的新情況。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!