tft每日頭條

 > 生活

 > correlation相關性如何計算

correlation相關性如何計算

生活 更新时间:2024-09-12 17:00:07

通常指Pearson product-moment correlation coefficient,統計學參數,用來研究變量間的相關性,通常描述變量間的線性相關性。其範圍介于-1和1之間,其絕對值越接近1,說明變量間的相關性越大。

  • 當r>0的時候,我們認為兩個變量之間是正相關的;
  • 當r<0時,兩個變量之間是負相關的。當r=0時,兩個變量之間是線性無關的。
  • 當r=-1和1時,兩個變量之間的相關性可以用一次函數(直線的形式)來描述。

correlation相關性如何計算(相關系數Correlation)1

相關系數r的範圍

Pearson相關系數的計算公式如下:

correlation相關性如何計算(相關系數Correlation)2

Pearson相關系數計算公式

該公式将變量x和y的協方差與變量x和y的方差積的根号值的比值作為新的參數來衡量變量x和y之間相關性。Pearson相關系數的好處在于歸一化了系數的範圍,不用考慮量綱值對參數評價的影響,但是該系數有一定的局限性,并不能完全描述所有變量的相關性。除此之外描述變量相關性的系數還有Spearman correlation coefficient(斯皮爾曼相關性系數)和Kendall(肯德爾相關性系數)系數。Spearman系數用于描述具有順序屬性的變量序列,而Kendall序列用于描述具有類别屬性的變量。

如何計算Pearson等相關系數呢?

明确了這些系數之後,重點在于如何計算這些系數。可以通過一些統計分析軟件,去計算這些系數,常用的有Origin和Spss等。此外也可以使用python和Matlab的庫函數很容易求得這些變量之間的相關系數。以Origin為例:

correlation相關性如何計算(相關系數Correlation)3

我們首先可以導入需要分析的變量值到一個工作簿中,然後進入Origin統計菜單,然後點擊相關系數進入相關系數頁面

correlation相關性如何計算(相關系數Correlation)4

在相關系數頁面,我們可以選擇要選取變量的範圍,指定需要計算那些相關性系數,同時可以将變量繪制成散點圖便于可視化分析。

correlation相關性如何計算(相關系數Correlation)5

通過計算可得變量A和變量B之間是高度相關的,其相關系數值高達0.99。

correlation相關性如何計算(相關系數Correlation)6

Origin計算相關系數

使用Python計算相關性系數

通過使用Python的pandas庫我們可以很容易對相應的變量執行相關系數計算,通過計算可以求得變量1和變量2之間的相關系數為0.99461,這和Origin計算得到的結果一緻。此外還可以在corr函數内設置相關系數的計算類别,進一步執行Spearman系數和Kendall系數計算。使用Python的好處是可以方便快捷去執行批量化的相關系數計算。

correlation相關性如何計算(相關系數Correlation)7

使用python計算相關系數

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved