正态分布是高斯概率分布。高斯概率分布是反映中心極限定理原理的函數,該定理指出當随機樣本足夠大時,總體樣本将趨向于期望值并且遠離期望值的值将不太頻繁地出現。高斯積分是高斯函數在整條實數線上的定積分。這三個主題,高斯函數、高斯積分和高斯概率分布是這樣交織在一起的,所以我認為最好嘗試一次性解決這三個主題(但是我錯了,這是本文的不同主題)。本篇文章我們首先将研究高斯函數的一般定義是什麼,然後将看一下高斯積分,其結果對于确定正态分布的歸一化常數是非常必要的。最後我們将使用收集的信息理解,推導出正态分布方程。
首先,讓我們了解高斯函數實際上是什麼。高斯函數是将指數函數 exp(x) 與凹二次函數(例如 -(ax^2 bx c) 或 -(ax^2 bx) 或隻是-ax^2組成的函數。結果是一系列呈現“鐘形曲線”的形狀的函數。
兩個高斯函數的圖。第一個高斯(綠色)的λ=1和a=1。第二個(橙色)λ=2和a=1.5。兩個函數都不是标準化的。也就是說,曲線下的面積不等于1。
大多數人都熟悉這類曲線是因為它們在概率和統計中被廣泛使用,尤其是作為正态分布随機變量的概率密度函數。在這些情況下,函數具有的系數和參數既可以縮放“鐘形”的振幅,改變其标準差(寬度),又可以平移平均值,所有這一切都是在曲線下的面積進行歸一化(縮放鐘形,使曲線下的面積總是等于1)的同時進行的。結果是一個高斯函數包含了一大堆的參數來影響這些結果。
如果将其認為是均值 = μ 且标準差 = σ 的正态分布方程。将其與高斯 λ exp(-ax^2) 的一般形式進行比較,我們可以看到:
前導系數 λ 有時表示為 1/Z,其中 Z=√2πσ^2,正是這樣的一個結果将我們帶到了本文的主要觀點之一:√2πσ^2有時被稱為一個自變量的正态分布的歸一化常數,而1/√2πσ2則被稱為歸一化常數。在這兩種情況下,公式中都有 π,它是從哪裡來的?它通常與圓、徑向對稱和/或極坐标相關聯。單個變量的函數如何以 π 作為其在前導系數中的歸一化參數之一呢?
可以參考我們以前的文章,裡面有非常詳細的描述
高斯積分不定積分 ∫ exp(x^2) dx 不可能用初等函數求解。有沒有任何積分方法可以用來求解不定積分?
可以計算定積分,如上所述,首先對高斯函數求平方從而在 x 和 y 中産生一個具有徑向對稱二維圖的兩個變量函數。 這樣能夠将直角坐标系轉換為極坐标,在此基礎上就可以使用更熟悉的積分方法(例如置換)進行積分。 然後,簡單地取結果的平方根(因為我們在開始時對積分進行平方) 就得到了我們的答案,順便說一句,結果是是√π。
對高斯積分求平方
方法的第一步是對積分求平方——也就是說,我們将一維轉換為二維,這樣就可以使用多變量微積分的技術來求解積分
可以重寫為:
這兩個積分用x和y表示是等價的;所以它等同于x的單個積分的平方。因為變量x和y是獨立的,所以可以把它們移進或移出第二個積分符号,可以這樣寫:
如果你不熟悉如何解二重積分也不用擔心。隻需先使用内部變量進行積分得到單個積分。然後用左邊的變量和外面的變量積分。但現在還不需要這麼做。這裡需要注意的是當我們對積分進行平方時,得到了一個二維的圖形化的徑向對稱的高斯函數。用x和y來表示積分e的指數是- (x^2 y^2)給了我們下一步應該做什麼的線索。
轉換為極坐标這裡棘手的部分是,我們必須将直角坐标下的二重積分轉換成極坐标下的二重積分。
為了在極坐标中對整個無限區域進行積分,我們首先對 exp(−r²) 相對于從 x=0 開始并延伸到無窮大的半徑 r 進行積分。 結果是一個無限薄的楔形,看起來像我們原始一維高斯曲線的一半。 然後我們圍繞旋轉軸 Z 軸旋轉楔形,并累積無限數量的這些極薄的楔形。 也就是說——我們在 π 從 0 到 2π 時積分。
我們現在的二重積分看起來像這樣:
我們可以用 r^2 替換指數中的 −(x^2 y^2),這要感謝畢達哥拉斯。 但是我們仍然需要将我們的微分從矩形轉換為極坐标。
微分的轉換簡單的表示如下:
在任何情況下,我們的二重積分現在看起來像這樣:
添加适當的積分邊界:
如果我們設u=r^2,那麼du=2r,我們可以寫成(對于内積分)
然後求出外積分:
所以:
我們在下一節求解标準化常數時,這個結果很重要。
正态分布函數的推導現在我們有了推導正态分布函數的所有前提。下面将分兩步來做:首先确定我們需要的概率密度函數。這意味着以λ為單位重新轉換-a-産生的函數,無論為λ選擇什麼值,曲線下的面積總是1。然後用随機變量的方差σ^2來轉換λ。對整個實數線上的方差進行積分 從而得到我們在前導系數 √2πσ^2 中需要歸一化常數的項,也是我們在分母中需要的項指數 2σ^2。我們将使用分部積分來求解方差積分。
概率密度函數的推導我們将從廣義高斯函數f(x)=λ exp(−ax^2)開始,正态分布下的面積必須等于1所以我們首先設置廣義高斯函數的值,對整個實數線積分等于1
這裡将 -a- 替換為 a^2 稍微修改了高斯分布。為什麼要這樣做? 因為它可以使用 換元積分 U-substitution 來解決這個積分。 為什麼我們可以這樣做? 因為 -a- 是一個任意常數,所以a^2 也隻是一個任意常數,可以使用 U-substitution 求解。讓 u=ax 和 du=a dx 這意味着 dx=du/a, 由于 λ 和 1/a 是常數,我們可以将它們移到積分符号之外,得到:
我們從上面關于高斯積分的讨論中知道,右邊積分的值等于√π。 這樣就可以改成:
求解 -a- 可以這樣寫:
根據已經發現的λ 和 -a- 之間的關系,修改後的高斯下的面積總是等于 1 也是必須的,所以我們可以進一步修改,用 πλ^2 代替 a^2 并寫:
無論 λ 的值如何,該曲線下的面積始終為 1。 這是我們的概率密度函數。
确定歸一化常數在獲得歸一化概率分布函數之前還需要做一件事:必須将 λ 重寫為随機變量方差 σ^2 的函數。 這将涉及對整個實數線的方差表達式進行積分所以需要采用按分部積分來完成此操作。
如果給定一個概率密度函數 f(x) 和一個均值 μ,則方差定義為從均值平方(x - μ)^2的偏差乘以整個實數線的概率密度函數f(x)的積分:
假設μ=0,因為已經有了概率密度函數h(x),所以可以寫成
用分部積分法求解這個積分有:
第一項歸零是因為指數中的x^2項比前一項分子中的- x項趨近于∞的速度快得多所以我們得到
右邊的被積函數是概率密度函數,已經知道當對整個實數線進行積分時它的值是1 :
求解 λ 得到:
将 λ 的 1/√2πσ^2 代入我們的修改後的公式(即我們的概率密度函數),我們得到:
剩下要做的就是将平均值 μ 放入指數的分子中,以便可以根據 μ 的值沿 x 軸平移圖形:
這樣就完成了方程推導
作者 :Manin Bocss
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!