統計學相關分析的常用方法?正如本書P201給出的例子,要明确兩個變量之間是否存在相關性及其方向,可以通過計算均值的方式來初步評估,在本例中通過計算兩個變量與其均值的差值在不同象限的分布情況以明确兩個變量之間的相關性及其正負,如果兩個變量呈正相關,那麼大多數數據應該位于1、3象限,如果呈負相關,則位于2、4象限,如果二者沒有什麼關系,那麼4個象限中的數據應該差不多,下面我們就來聊聊關于統計學相關分析的常用方法?接下來我們就一起去了解一下吧!
正如本書P201給出的例子,要明确兩個變量之間是否存在相關性及其方向,可以通過計算均值的方式來初步評估,在本例中通過計算兩個變量與其均值的差值在不同象限的分布情況以明确兩個變量之間的相關性及其正負,如果兩個變量呈正相關,那麼大多數數據應該位于1、3象限,如果呈負相關,則位于2、4象限,如果二者沒有什麼關系,那麼4個象限中的數據應該差不多。
随後通過計算差值之和,如果總和為正,說明差值正數居多,即位于1、3象限中的點越多,則說明這兩個變量之間可能呈正相關。為了排除數據越多造成的值越大的幹擾,通過将差值和除以例數後可以得到進一步校正,由此得到協方差,但由于度量單位不統一的為導緻協方差不能不用不同數據的相關性計算,所以需要進行标準化,使得不同度量單位的數據均變換為以0為均數,以1為标準差的值,這樣就可以直接比較數據大小了。而根據标準化後的數據所計算的協方差就是線性相關系數,所以線性相關系數就是将協方差與數據标準化結合起來的一個公式。
Ref: 《白話統計》 馮國雙著
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!