tft每日頭條

 > 生活

 > 概率和統計的定義

概率和統計的定義

生活 更新时间:2024-12-05 12:26:26

統計、概率傻傻分不清?其實從下圖中就應該知道概率、統計是有區别的

概率和統計的定義(概率和統計是一回事麼)1

本話題主要是為了後續讨論與理解最大似然估計(MLE)、最大後驗概率估計(MAP)貝葉斯公式做基礎。本篇我們隻讨論概率與統計之間的區别。

為了更通俗的理解,先來讨論統計,為什麼呢?因為概率可以理解為在統計基礎上衍生出來的。


什麼是統計(statistics)

先來看個問題:有一種動物,請問這是什麼動物(答案唯一)?

這...沒人能猜得對吧。我也猜不出來,即便是天王老子來了也猜不出來。加個條件,它一天24小時隻幹兩件事(幹飯、睡覺),請問這是什麼動物?

咦,這不是你女朋友麼?(開玩笑)

概率和統計的定義(概率和統計是一回事麼)2

噓,别瞎猜,要不然狗命不保。


那麼再加些條件:四條腿、還會哼哼哼的叫,鼻子長長的,有的還可以當寵物。

嗯,模型基本可以确定了,對,就是他

概率和統計的定義(概率和統計是一回事麼)3

我們仔細想想這個過程,你是怎麼猜出它來的。

我們有一堆數據,動物、四條腿、鼻子(長長的)、叫聲(哼哼哼)、行為(幹飯、睡覺),通過判斷與觀察這些數據,大夥一緻的認為并且确定這個模型是豬。

概率和統計的定義(概率和統計是一回事麼)4

這個遊戲和統計有什麼關系呢?在實際的統計研究中,我們也是通過觀察數據來初步推測模型的。

就像文章 建立回歸模型的完整步驟 中提到的,我們通過數據的散點圖走勢分布來判斷是否使用線性回歸模型,當然通過數據還可以判斷出其他分布模型:像指數分布、高斯分布、拉普拉斯分布。

概率和統計的定義(概率和統計是一回事麼)5

當然,如果上述遊戲的模型參數、數據量再給多點我們甚至可以研究歸納出:判定豬的品種模型,究竟是圈養豬呢還是松遼黑豬呢還是烏克蘭小乳豬。

(此模型隻做演示說明使用,并非真正的模型)

概率和統計的定義(概率和統計是一回事麼)6

其中,y 是豬的種類,x1為産地 ,x2為大小,x3為可愛程度...

再舉一個更加實際的栗子:當我們去醫院看病的時候,醫生通過詢問你的症狀(飲食、不良行為....)來判斷歸納(建立病症模型)出什麼病,最後才對症下藥。

以上案例都是建立在人們熟知的模型上去做判斷,若是一種新的物種、病情呢?通過數據無法從已有模型中挑選出對應模型怎麼辦,這個時候就進入了統計的原始階段,需要大量數據、案例做支撐,然後發明一個新的模型,不斷演化直到成熟被公認。

一句話總結:統計是在已知數據的前提下,進行模型的歸納與推斷。


什麼是概率(probabilty)

概率研究的問題恰好與統計相反,概率是在已知模型的基礎上去預測這個模型産生的結果(方差、均值等)。如:現在我們有一個已知模型(判斷豬的種類模型)

概率和統計的定義(概率和統計是一回事麼)7

其中,y 是豬的種類,x1為産地, x2為大小 ,x3為可愛程度,....

故事線:現在有一個人在山間上發現一隻豬,但又不确定是什麼豬,萬一是隻野豬(兇猛)那就不好了,正巧他想起外甥是養豬協會的,他急忙給外甥打電話,并告知外甥這個豬的一些特征,balabala.....,外甥經過他多年悅豬無數的職場經驗(腦海已模型自現),立馬就判斷出這隻豬的品種,原來是隻烏克蘭小乳豬啊,很可愛不用擔心,真是虛驚一場。

這個過程我們可以簡化為:通過種類模型我們預測出來了符合條件的樣本數據(豬的特征)屬于哪一種豬 【極大概率上】

注:對于已成熟的模型(已通過模型有效性檢驗:R方、F檢驗)預測結果在極大概率上是可靠的。

一句話總結:概率是在已知模型的基礎上,對其他樣本數據進行預測。


還記得在讨論回歸話題時的這幅圖麼

概率和統計的定義(概率和統計是一回事麼)8

在統計學裡,任一現存的技術手段都是經曆了統計與概率的考驗才留下來,最終形成一個閉環(僅個人見解)。


最後借用專家的話來解釋總結下:

Lary Wasserman 在 《All of Statistics》 的序言裡有說過概率論和統計推斷的區别:

概率和統計的定義(概率和統計是一回事麼)9


大意:

統計學:根據手中信息,猜猜桶裡有啥?(樣本歸納總結出總體)

概率論:根據桶中信息,猜猜手裡有啥?(總體對樣本進行預測)

更多精彩内容請關注 公衆号:數據與編程之美

原文地址:概率和統計是一回事麼?

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved