tft每日頭條

 > 圖文

 > 數學外接球知識

數學外接球知識

圖文 更新时间:2024-07-20 01:28:45

數學外接球知識(讓概率來幫我們預測未來)1

概率論,不隻是數學作業中投骰子的問題,而是切實可以預測未來的東西,指導我們應對諸如災難預警、疾病檢測等現實問題——它就是數學家手中的水晶球。本文譯自紐約市立大學約克學院數學與計算機系榮譽教授Joseph Malkevitch所撰寫Mathematics and Crystal Balls一文,将分為兩篇推送。

撰文 | Joseph Malkevitch (紐約市立大學約克學院數學與計算機系榮譽教授)

編譯 | 施昊

人們都想希望能夠預見未來,比如想知道明天的天氣如何;想知道我們是否為自己将來的退休生活儲備了足夠的積蓄;想知道我們與朋友的友誼将如何發展;或者是知道在大學裡學什麼課程能夠給我們帶來快樂。事實上,使用數學工具可能會比用水晶球更有效的預測未來。我們都喜歡歲月安好,并盡可能避免不愉快的時光。然而,人們做的每一件事都可能産生負面結果,因此我們一直在尋找一些方法來規避這些風險。而數學往往能幫助我們。

數學外接球知識(讓概率來幫我們預測未來)2

水晶球丨圖片來源:iStock

災難預測帶來的麻煩

對于那些想過上“無憂無慮”生活的人來說,很少有地方不會遭受“外界”危險的侵襲。比如說,在美國,一些地區容易遭受龍卷風、大雪侵襲;其他地方有洪災、飓風,和地震等災害。在這些由于“大自然的行為”導緻受災的地區,如果我們能夠作出災難預測,使得沒有人員傷亡,财産損失降到最小,那就太好了。如今,人們已經開發了一些數學模型以協助處理各類自然災害。我們所依賴的最常見的預測模型就是越來越準确的一周天氣預報。這些預報是科學家基于衛星、陸基監測以及傳感器系統的數據給出的。另一方面,這些預測還依賴于以偏微分方程理論和求解這些方程的數值方法為基礎建立的大氣模型——計算能力和理論的突飛猛進使這些報告更加可靠。

一個有趣例子發生在2009年的意大利。一群意大利地質學家和一個政府官員,因被指控未能對2009年意大利拉奎拉地震給出恰當的警告而受到了審判,此次地震造成309人死亡。世界各地的地質學家憂心忡忡,他們理解,盡管在試圖預警方面的技術我們取得了很大的進步,但是預測,得到的僅僅是有概率發生而非确定發生。經過審判,7人被判犯有過失殺人罪,處以六年徒刑。讓全世界科學家長舒一口氣的是,在2014年,上訴法院釋放了這些地質學家,并為政府官員減刑。但是那些死者的親屬還是在法庭上譴責政府為自己脫罪的行為。

數學外接球知識(讓概率來幫我們預測未來)3

拉奎拉地震,當地政府辦公室也被毀壞丨圖片來源:wiki

當一個大風暴來臨時,天氣預報員如果沒能夠對潛在危險發出足夠嚴重的警告,他們應該受到指責嗎?有時候因為預報原因,可能被大風暴破壞的運輸系統被搶先關閉,這會給許多人造成了巨大的後勤和經濟問題。如果風暴沒有如期而至——這樣的事情時有發生,對于許多人來說反而是略有失落的。但反過來說,當人們可能獲救的時候,有些人反應不夠強烈,這就涉及到“意大利地震”事件中的問題。當然了,與天氣預報相比,地震的預測要落後太多了。

另一個例子是傳染病。有些傳染病(例如流感)會每年都會流行,也有周期性的幾年流行一次。對于小孩來說,得了百日咳或者麻疹可能會導緻死亡;而對于老人來說,他們不知道年輕時接種的一些疫苗還是否有效。此外,如果這時流感出現,老年人可能會受更嚴重的影響。因為較于年輕人得了流感可能沒有大礙,可老人得了流感會導緻肺炎或者患上其他危及生命的疾病。那麼,父母應該給孩子接種疫苗嗎?老人們應該接種流感疫苗嗎?

雖然一些人有過敏反應,但是從長期的疫苗接種史來看,疫苗極大的延長了人們的壽命,改善了生活的質量。

風險行為

最近,美國強力球(Power Ball)推出了16億美元的驚人巨獎!從業者對和賭場賭博有信心的一個重大原因是,數學告訴他們隻要有很多的消費者,這些“産業”就會蓬勃發展。如果一個人擁有一個能幫助他選擇正确的水晶球,他會賺得盆滿缽滿。

無論是作為個人還是團體的一部分,思考未來時,人們總是對未來抱有期望——有時候是美好的期望,有時候則顯得不那麼吸引人。對于理解未來能帶給我們什麼,數學的一個貢獻就在于帶來了“期望值(expected value)”的概念。當時數學家們使用這一術語時,他們腦中有一個極其精确的定義,但這個定義有許多微妙之處。人們對未來感到緊張的一個原因是他們不确定将來會發生什麼。未來涉及随機性和概率(chance,danomness,stochasticness, probability)。為了理解期望值的含義,我們首先要談一下概率論。

我們經常會聽到類似如下關于未來的表達:

下雨的概率70%;

這個地點再次發生地震的概率是一百萬分之一;

抛一對均勻的骰子,兩個骰子的點數之和等于7的可能性是1/6;

這種陳述是什麼意思呢?要回答這個問題,我們不得不回到數學的兩大支柱——基礎數學和應用數學。基礎數學建立了基于定義和公理(規則系統)的思想和概念體系,然後從這些構造中推導出數學事實和定理。應用數學則采用這些數學并試圖用它們來洞察世界。後文我将嘗試以相對非正式的方式進行講述,盡量避免“繁瑣”的數學符号和“正式”的定義。

首先,概率既适用于有限結果的定義域上,也能被用在無窮的結果的定義域上。為了能夠幫助理解這句話,這裡有不同的例子來解釋。比如有限結果的定義域:

蘇珊女士想要一對雙胞胎,她的孩子出生順序一共有四種可能——兩個男孩先後出生;兩個女孩先後出生;先是女孩後是男孩;先是男孩後是女孩。我們隻考慮這四種可能順序。

對于無窮的結果定義域,例如,我們可能會捕到一條正在去美國西部某條河流産卵的鲑魚,并對這條鲑魚進行稱重。稱重的可能結果是鲑魚所能達到的體重範圍之間的一個實數——可能是無窮多個重量中的一個。

從數學的角度來看,我們能夠模拟這些可能性,通過想象從某個“實驗”或者實際觀察的結果組成集合M。集合M可以是有限的,也可以是無窮的。對于有限結果集合M中的每一個結果m,我們将會分配一個實數給它,稱為結果m的概率,記作P(m)。這些實數不能以完全任意的方式分配,它們必須遵循特定的屬性或公理:

A:P(m)的取值範圍在0到1之間,包括0和1。

B:所有在M中m對應的P(m)的和,加起來要等于1。

請注意,如果m出現的概率是P(m),那麼互補事件m’ 的概率,即m将不發生的概率是1-P(m)。也就是說,如果硬币可以是正面或反面,反面的概率是2/5,那麼正面的概率是3/5。

另外,因為我們隻有有限的結果,所以我們不需要任何與極限(微積分)有關的想法來做計算。

對于有無窮結果的集合M,我們要求上文列出來的兩個條件依舊成立。如果在P(m)中存在最小的值,對于所有的結果而言,他們的概率和就不可能是1了。因為無論多麼小的有限數,相加無限次,總會有一個大于1的和。因此,處理無窮集合上的概率有其他的精妙之法。

但值得注意的是,我們能夠找到一個無窮集合,在這個無窮集合上每個單獨事件結果的概率可以是非零的。這是可行的,因為存在無窮的正數數列,數列總和是1。

當我們在使用數學時,我們必須将數學概念從一個混沌的、未有定義的術語與公理的世界中抽離,并闡釋它們的意義。

如果給出一個數據集,比如說30天内你的體重(可能是每天早上同一時間測量的)。人們往往會觀察這些數字的波動——這些數大概不會相同。如果你想要了解這些數字的“規律”,一個方法就是去計算一些典型值,如“平均值”,這是一個非常具有吸引力的數。平均值通常是把所有的數值加起來除以試驗的次數而得的。

使用單個數字來代表一個龐大的數據集的問題在于,表達不同東西的數字集往往會有相同的單個數字作為它們的代表。比如5,5,5,5,5,5的平均值是5,而 -3,-3,-3,13,13,13的平均值也是5。在科學和統計學中使用數字的早期發展之一是,人們認識到,多次“獨立”地測量同一數字可能比一次隻測量一個數字更可靠。由于測量裝置和“人為”過程,無論如何,測量都不可避免地産生一些誤差,但是人們可以使測量盡可能可靠。

與随機值的均值相似的是一個叫“期望值”的量。假設在某個遊戲中,你有3/10的機會赢3美元,7/10的機會赢4美元。通過将結果與結果的概率進行加權,你可以看到如果你玩這樣的遊戲将會“平均”赢得多少錢。在上述情形下,期望值是你3/10的時間中你會得到3美元,7/10的時間中你會得到4美元,因此

期望值= 3(3/10) 4(7/10)= (9/10) (28/10)= 37/10 = 3.70。

如果你需要支付3.75美元才能玩這個遊戲,那麼平均每玩一次,你就會損失5分錢。在你赢了3美元的時候,你其實損失了75美分;而赢了4美元的時候你才會賺取25美分。但是因為輸赢的頻率不同,結果的概率不一樣,你平均會損失5美分。注意,3.70不是遊戲的結果,也不是概率。

條件概率

有時, “實驗”的實施方式會影響事件發生的概率。

盒内有兩個黑球和兩個白球,考慮以下兩種不同的方案::

方案A: 攪動盒子,打亂球。從盒子中選擇一個球,然後放回第一個球,繼續攪動,取出第二個球。

方案B: 攪動盒子,打亂球。從盒子裡選出第一個球,緊接着選出第二個球。

毫無疑問,你拿到兩個黑球的概率取決于你用了哪一種方案。在方案B中,如果你第一個抽出來是白球,那根本不可能拿到兩個黑球。

對于方案A,你隻有在第一次抽到黑球,并且第二次抽到的也是黑球時,你才能拿到兩個黑球。因此抽到BB(B代表你抽到了黑球)的概率可以通過計算P(BB)=(1/2)(1/2)=1/4。而在方案B中計算抽到兩個黑球的概率,我們需要分析情況:

第一個抽到的球是黑色,第二球也是黑色。因此第一個球是黑色的可能性是2/4=1/2。現在既然還剩下3個球:兩個白球,一個黑球。黑球被抽到的可能性是1/3。考慮到這一點,我們可以看到兩個黑色球被抽出的概率是(1/2)(1/3)= 1/6。

這個簡單的問題與概率論中最基礎卻又最精妙的問題有關,即條件概率。這個概念可以追溯到研究随機性的最早時期。如果我們用現代符号來表示,P(A|B)表示在B發生的情況下A發生的概率。舉個例子,當我們從盒子中取出兩個球,給定第一個球是白色的,那麼第二個球是黑色的概率就是2/3。我們也可以把P(A|B)看成是P(A∩B)/P(B) = P(第一個球是黑的,第二個球是黑的)/(P(第二個球是黑的)=(1/3)/(1/2)=2/3

如何“定義”或考慮P(X|Y)的值?換句話說,我們求的是如果Y發生了後X發生的概率,P(X|Y)是X和Y同時發生的概率除以Y發生的概率。注意,在這個計算中,P(Y)是作為分母的。對于計算P(Y|X),我們計算Y和X同時發生的概率(與X和Y發生的概率一樣),但是我們除以的是P(X)。我們是找“X發生的部分”對“Y和X同時發生的”影響。

貝葉斯定理

很多人會混淆P(A|B)和P(B|A) 這兩個條件概率,它們通常不一樣。比如說,如果事件A表示一個藥物測試是陽性,事件B表示病人有這種病。那麼患上這種病的病人做藥物測試是陽性的概率,和做藥物測試是陽性的人得這種病的概率,兩者是完全不同的。

醫學檢測可能非常準确,但當一種疾病相對罕見時,僅僅因為檢測結果是陽性,這并不意味着這個人一定患有這種疾病。一個例子将有助于揭示相關問題。

假設一種疾病(D)非常罕見,一般人群發病率0.005,表示1000個人中有5個人患這種病。假設疾病D的診斷測試是驗血。當人真患有疾病D時,返回一個患有疾病D指标陽性的概率是0.99。但是不妙的是,當人沒有患疾病D時候,檢測也可能會出現陽性結果(即患病),概率為0.05,相對較低。注意0.99和0.05不能相加,因為這兩個不是互補事件。

這裡面給出了三個不同的數字,我們将用這些數字通過一些概率的“法則”推導出一些其他數字。讓我們引入一些符号來理清思路。符号既有好處也是壞處。這些符号能讓人概念更清楚,因為有很多相似但意義不同的概念。為了區分它們,必須用到大量的符号。

T表示檢測結果為陽性的事件,無論人是否患病;

P(D)表示某個人患病的概率;

P(T|D)表示一個人在患病時檢測為陽性的概率;

P(T|D')表示一個人即使沒有患病也能檢測出陽性的概率;

根據以上信息,我們可以寫下這三種不同概率的值:

P (D) = 0.005

P (T | D) = 0.99

P(T | D ')= 0.05

當檢測結果為為陽性時,患者很想知道自己患病的幾率,但請注意,答案不是上面給出的數字之一!不過,我們可以通過概率論來推斷出這個數字。

除了其他的概率工具之外,我們還将利用一個被稱為貝葉斯定理或貝葉斯公式的“事實”,這個結果是由托馬斯·貝葉斯(Thomas Bayes,1702-1761)提出的,但并未在他生前發表。如今,因為“貝葉斯推理(Bayesian inference)”和“貝葉斯統計(Bayesian statistics)”等術語在統計學上的應用,貝葉斯享有盛名。

數學外接球知識(讓概率來幫我們預測未來)4

托馬斯·貝葉斯

貝葉斯的得出的結果如下面霓虹所示:

數學外接球知識(讓概率來幫我們預測未來)5

貝葉斯定理丨圖片來源:wiki

盡管我們可能隻知道P(B|A),但這個結果允許我們計算與問題P(B|A)相關的其他條件概率。

回到上面的診斷情況,讓我們看看我們能推斷出什麼。

首先使用補事件的概念,以及事件和補事件的概率之和為1,我們有:

P(D') = 1-P(D) = 1-.0005 = 0.995 (某人不會患病的概率)

P(T'|D) = 1-P(T|D) = 1-0.99 = 0.01(某人患病但未檢測到陽性的概率)

P(T'|D') = 1-P(T|D') = 1-0.05 = 0.95(某人沒有患病也沒有被檢測出陽性的概率)

現在,讓我們看看一些其他值得關注的概率。比如,無論是否患上疾病得到陽性反饋的概率,以及無論患病與否得到陰性反饋的概率。得到陽性反饋的概率有兩種方式,一種是患病得到陽性檢測結果;另外一種是不患病得到陽性檢測結果。我們可以用符号來表示:

P(T) = P(T|D)P(D) P(T|D')P(D') = (0.99)(0.005) (0.05)(0.995) = 0.00495 0.04975 = 0.0547

P(T ')= P(T ' | D)P(D) P(T ' | D ')P(D ')=(0. 01)(0.005) (0.95)(0.995)=0.9453(這裡我們把一個人患病但是沒有檢測陽性的概率,和沒患病也沒有檢測出陽性的概率相加。)

我們需要檢查計算的正确性。按理說,0.0547 0.9453加起來應該等于1,而且确實相加等于1!可能這些數字看起有點讓人吃驚——得到陽性檢測結果的概率相當的小,但這正恰恰反映了很少人患這種疾病。

然而,到目前為止,我們還沒有得到我們真正感興趣的數字——如果一個人檢測成陽性,那麼他患病的可能性是多少?如果一個人被檢測成陽性他需要感到很害怕嗎?這就是我們需要用到貝葉斯結果的地方。

P(D|T) = (P(T|D))(P(D))/P(T) = (0.99)(0.005)/(0.0547) = 0.0904936 ≈0.0905

因此,即使測試檢測到這種疾病的概率很高,也隻有一小部分檢測陽性的人确實患病。因為這種病很罕見才導緻的這種結果。通常情況下,疑似患者會做另一個獨立的測試,看看是否真患病,以免不必要的治療。

貝葉斯的結果也可以用來得到另外三個條件概率,其中兩個也可以通過使用“一個事件和它的互補事件的概率和為1”這個事實得到。

P(D ' | T)= 0.9095(檢測陽性而未患病的概率)

P(D ' | T ')= 0.99995(檢測陰性而未患病的概率)

P(D | T ')= 0.00005(檢測陰性而患病的概率)

最後這個數字可以用貝葉斯的結果來計算,如下所示:

P(D | T ')=(P(T ' | D))(P(D))/ P(T ')= 0.01(0.005)/ 0.9453 = 0.00005

是的,盡管這裡的符号和計算紛繁複雜,但是這些可以幫助病人和他的醫生正确看待罕見病檢測中得到陽性結果意味着什麼。

(未完待續)

參考文獻

[1] Beniston, M,, From Turbulence to Climate: Numerical Investigations of the Atmosphere with a Hierarchy of Models, Springer, Berlin, 1998.

[2] Daston, L., Classical Probability During the Enlightenment, Princeton U. Press, Princeton, 1988.

[3] Falk, R., and M. Bar-Hillel, Probabilistic dependence between events. The Two-Year College Mathematics Journal. 14 (1983) 240-7.

[4] Falk, R., Conditional probabilities: insights and difficulties. In Proceedings of the Second International Conference on Teaching Statistics 1986, pp 292-297.

[5] Falk, R., Misconceptions of statistical significance. Journal of structural learning. March, 1986.

[6] Gelman, A. and J. Carlin, H. Stern, D. Rubin, Bayesian Data Analysis (2nd edition), Chapman & Hall/CRC, Philadelphia, 2003

[7] Hacking, I., The Emergence of Probability, Cambridge U. Press, New York, 2006.

[8] Hald, A., A History of Mathematical Statistics from 1750 to 1930, Wiley, New York, 1998.

[9] Hald, A., A History of Probability and Statistics and Their Applications Before 1750., Wiley, New York, 2003.

[10] Mayo, D., Experimental Knowledge, University of Chicago Press, Chicago, 1996.

[11] Mayo, D., Error and Inference: Recent Exchanges on Experimental Reasoning, Reliability, and the Objectivity and Rationality of Science, Cambridge University Press, New York, 2010.

[12] Roulstone, I. and J. Norbury, Invisible in the Storm: the role of mathematics in understanding weather, Princeton U. Press, Princeton, 2013.

[13] Stigler, S., The History of Statistics: The Measurement of Uncertainty Before 1900, Harvard U. Press, Cambridge, 1990.

[14] van Plato, J., Creating Modern Probability: Its Mathematics, Physics and Philosophy in Historical Perspective, Cambridge U. Press, New York, 1994.

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved