tft每日頭條

 > 生活

 > 二維随機變量與相關系數

二維随機變量與相關系數

生活 更新时间:2024-12-23 19:23:45

随機變量的期望和方差反映的是随機變量自身的一維分布特征。然而一維特征之外,随機變量之間可能存在着種種相關關系。比如人的身高與體重,氣象的溫度與濕度,商品的廣告費用與銷量等等。有沒有數字特征來反映變量間的這種二維關系呢?下面我們就來談談描述随機變量之間相關關系的數字特征。

一、标準化1.1标準化的過程

我們知道兩個變量的協方差就是一個二維數字特征:

二維随機變量與相關系數(随機變量的标準化與相關系數)1

但協方差的取值受兩個變量各自的量綱影響,數字的意義并不明顯,我們隻知道獨立的随機變量,協方差為零,其他的關系呢?無法從協方差的數字中直接讀出。

今天我們将提出一種方法,對協方差進行無量綱化的修正。會有什麼樣的結果呢?

我們采用的方法就是對變量進行标準化處理。

如果随機變量X的方差DX存在,且DX>0,則稱

X*= (X-EX)/√DX為X的标準化随機變量。我們看到标準化處理就是對原随機變量減其期望再除上其根方差。

由期望方差的運算性質我們可得:

EX*=0

D X*=1

數值如此簡單,難怪X*被稱為标準化變量。

通過标準化處理任意的随機變量,都轉換成了期望為零,方差為1的标準化變量。

标準化的目的就是消除量綱希望以及方差的不同,對數據比較所造成的影響。

1.2标準分的應用

在綜合評價中,标準分就是一個重要指标。

例如某次考試後,語文和數學的成績都為均值80的正态分布。

二維随機變量與相關系數(随機變量的标準化與相關系數)2

但語文的方差為9,數學的方差為4;甲同學語文80分,數學86分。乙同學數學80分,語文86分。

從總分來看,兩人總分相同。請問你覺得他們的能力是否也相同呢?兩個86分,由正态分布的3σ原則,數學的86分是不是更加不易?是不是較語文的86分含金量更高?如何體現這種差異呢?對了,标準化處理。

我們分别計算兩個86分對應的标準化成績。

y^*=(86-80)/3=2;

x^*=(86-80)/2=3

減期望再除上根方差,數學的标準分就比語文的标準分高,而單純的總分沒能體現出這樣的差别。

所以标準化的思想在綜合評價中,特别是分布差異較大的指标時,是一個重要的處理方案。

二、相關系數2.1相關系數的取值

既然随機變量标準化後,消除了量綱上的差異。那标準化變量X*與Y*的協方差就是兩個變量二維特征的本質體現。

我們稱X*與Y*的協方差為原變量X 與Y 的相關系數。

即為ρ(X,Y)=cov(X*,Y*)。

由協方差的運算性質:

二維随機變量與相關系數(随機變量的标準化與相關系數)3

那相關系數能不能較好的反映随機變量x 與y 之間的關系呢?我們來研究一下相關系數的性質。

相關系數的取值在-1到1之間。

證明:

令X*= (X-EX)/√DX,Y*= (Y-EY)/√DY,則

由于X*與Y*都是标準化變量,方差為1,協方差即為相關系數ρ(X,Y)。

由于方差總是大于等于0的,所以解不等式有2ρ(X,Y)≥-1;

同理由差的方差公式:

解不等式2ρ(X,Y)≤1。

從這個性質之相關系數取值以零為中心,左右對稱,以±1為界。

2.2相關系數的含義

那相關系數取不同的值都代表了什麼意思呢?

ρ(X,Y)等于±1的充要條件為X與Y 以概率為1完全線性相關。

即 Y與X有線性的函數關系:

證明:

從剛才性質一的證明過程之相關系數等于1時,等價于D(X*-Y*)=0

而方差為零的變量将以概率1取值于他的期望。

由于X*與Y*為标準化變量,所以X*-Y*的期望為零,即以概率1有X*-Y*等于零。

P{ X*-Y*=0}=1即X*=Y*

P((X-EX)/√DX=(Y-EY)/√DY)=1,即=(X-EX)/√DX = (Y-EY)/√DY

同理,當ρ(X,Y)等于-1時。等價的有P{ X*=-Y*}=1。

表明ρ(X,Y)絕對值等于1時,X 與Y 具有最大的線性相關關系。

ρ(X,Y)=1時:

Y可以表示為X 的斜率為正的線性函數。

ρ(X,Y)=-1時:

Y 可以表示為X 的斜率為負的線性函數。

ρ(X,Y)=0時,表示X 與Y 沒有一點兒線性相關的關系,稱為X 與Y不線性相關。

ρ(X,Y) 不等于零時,表示X 與Y有部分的線性相關性,稱X 與Y線性相關。其中,若大于零為正相關若小于零為負相關。ρ(X,Y)的絕對值的大小反映了相關性程度的大小。如越接近于1。表示Y 越接近于X 的正系數的線性表達;如越接近于-1表示Y越接近于Y 的負系數的線性表達。若越接近于零,表示Y 與X 的線性表達程度越來越弱,直到完全沒有線性關系。

二維随機變量與相關系數(随機變量的标準化與相關系數)4

2.3相關系數和變量獨立

X與Y·1 獨立則協方差為零,從而相關系數也為零。所以獨立則不相關,反之則不然。雖然X與Y不相關,不具有線性關系,但可能存在非線性的關聯,那就不是獨立的了,所以獨立與不相關,并不等價。

但正态分布是一個特例,獨立與不相關是等價的。

對于二維正态随機變量

(X、Y)~N(μ1,μ2​,σ12​,σ22​,ρ),其中中的參數ρ,可以證明它就是X、Y 的相關系數。

由二維正态分布的性質。X、Y獨立的重要條件是ρ等于零,即X、Y不相關。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved