機器學習是實現人工智能的重要技術之一。在學習機器學習的過程中,必須要掌握一些基礎的數學與統計知識。之前的兩篇文章我們分别講述了中心極限定理與大數定律,它們是數據分析的理論基礎。今天我們來介紹幾種常見的概率分布,掌握這些概率分布的類型,能夠幫助我們很好的理解數據的内在規律。本文的結構安排如下:首先介紹數據類型與概率分布,然後介紹幾種常見的概率分布類型,主要包括離散概率分布(伯努利分布與二項分布),連續概率分布(正态分布、指數分布),最後對整個概率分布進行總結。
概率分布思維導圖
數據類型與概率分布數據類型
按照不同的分類标準可以将數據分成不同的數據類型,一般來說,數據可以離散型數據和連續型數據。離散型數據通常是指隻能通過整數來表現的數據,比如說抛硬币的結果,要麼是0,要麼是1,還有年齡、學生人數等等。而連續型數據是指在一定的區間的可以任意取值的數據,比如說身高、時間的長短等。
概率分布
生活中的事可以分為确定事件與不确定事件。确定事件包括必然事件(太陽明天升起)與不可能事件(太陽從西邊升起)。随機事件就是在一定的條件下,可能發生也可能發生的事件,比如明天的天氣,可能是晴,也有可能是陰天。概率論研究的是不确定性(務必牢記)。而随機變量是随機事件的數量表現。根據前面的數據類型分類,可以分為離散型随機變量與連續型随機變量。概率分布是指用于表述随機變量取值的概率規律,它有兩種類型,離散概率分布(概率質量函數)與連續概率分布(概率密度函數)
幾種常見非概率分布伯努利分布
伯努利分布,又稱為兩點分布或者0-1分布,它是一種離散分布,1表示成功,0表示失敗。如果進行一次伯努利實驗,成功的概率為p(X=1),失敗的概率為1-p(X=0),我們則稱為随機變量X的分布為伯努利分布,它的概率質量函數為
伯努利分布函數
在機器學習的過程中,我們經常用到伯努利分布,因為我我們總是想讓機器做出“是”或者“否”的回答。
伯努利分布示例
二項分布
如果我們進行n重伯努利實驗,每次成功的概率為P,X代表成功的次數,我們把x 的這種分布稱為二項分布,它的概率質量函數為
二項分布函數
二項分布的例子在生活中很常見,比如我們抛十次硬币,我們像計算這十次當中正面出現的概率為多少的時候,我們就可以應用二項分布來解決。
二項分布示例
正态分布
正态分布又可以稱為高斯分布,我們可以用數學語言來描述:若随機變量X服從一個數學期望值為u、标準差為ό的概率分布,我們把它稱為随機變量服從正态分布。它的概率密度函數為:
正态分布函數
正态分布的期望值u決定了它的位置,而标準差決定了幅度。它的應用及其的廣泛,我們生活與工作中的大多數事情都可以用正态分布來表示,比如說某一個高校學生的身高分布。
正态分布示例
指數分布
如果X∼exp(λ),我們稱它為指數分布,它常用來表示事情發生的間隔時間。它的概率密度函數為:
指數分布函數
指數分布最常見的例子就是“壽命”類事件的分布,比如家電使用的壽命,近期發生故障的時間間隔,電話問題裡的通話時間等等。
指數分布示例
總結概率分布是指用于表述随機變量取值的概率規律。它可以分為離散概率分布(伯努利分布與二項分布)和連續概率分布(正态分布、指數分布)。其實,生活中還有一些其他的概率分布,比如泊松分布、幾何分布、t分布等等。要學習這些概率分布,還是要和生活相聯系。
歡迎大家在留言區批評指正!#人工智能# #人工智能# #科技新星創造營# #概率# #科技新星創作營#
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!