tft每日頭條

 > 科技

 > 用r語言做數據分析符号

用r語言做數據分析符号

科技 更新时间:2025-05-13 23:23:49

之前說的數據分析基本上是來自一元總體X,而在實際情況中,許多數據來自多元數據的總體,即來自總體(X1,X2,X3,...Xn)^T。對于來自多元總體的數據,除了分析各個分量的取值特點外,更重要的是分析各個分量之間的相關關系,這就是多元數據的相關分析。先從二元數據開始講解。

設(X,Y)^T是二元總體,從總取得觀測樣本(X1,Y1)^T,(X2,Y2)^T,...,(Xn,Y,)^T,其樣本觀測矩陣為:

用r語言做數據分析符号(用R語言做數據分析)1

用r語言做數據分析符号(用R語言做數據分析)2

則稱(X拔,Y拔)^T為二元觀測樣本的均值向量。

用r語言做數據分析符号(用R語言做數據分析)3

則稱Sxx為變量X的觀測樣本的方差,稱Syy為變量Y的觀測樣本的方差,稱Sxy為變量X、Y的觀測樣本的協方差,稱

用r語言做數據分析符号(用R語言做數據分析)4

為觀測樣本的相關系數。

例子:某種礦石有兩種有用成分A、B,取10個樣本,每個樣本中成分A的含量百分數x(%)及B的含量百分數y(%)的數據如下所示,計算樣本的均值、方差、協方差和相關系數。

用r語言做數據分析符号(用R語言做數據分析)5

> x<-c(67,54,72,64,39,22,58,43,46,34)

> y<-c(24,15,23,19,16,11,20,16,17,13)

> ore<-data.frame(x,y)

>ore.m<-apply(ore,2,mean)

> ore.s<-cov(ore)

> ore.r<-cor(ore)

>ore.m

x y

49.9 17.4

> ore.s

x y

x 252.7667 60.60000

y 60.6000 17.15556

> ore.r

x y

x 1.0000000 0.9202595

y 0.9202595 1.0000000

上述計算中,cov()函數用于計算協方差或協方差矩陣,cor()函數用于計算相關系數或相關矩陣,它們的使用格式為:

用r語言做數據分析符号(用R語言做數據分析)6

其中x是數值型向量、矩陣或數據框,y是控制(NULL、缺省值)、向量、矩陣或數據框,但需要與x的維數一緻。與cov和cor相關的函數還有:cov.wt()用于計算加權協方差,cor.test()用于計算相關性檢驗。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved