散點圖矩陣可以非常直觀地看到多個變量兩兩間的相關性,是變量間相關性分析的一把利器。
基本散點圖矩陣pairs( ),繪制基本散點圖矩陣
~mpg disp drat wt,表示所有需要繪制散點圖矩陣的變量
在行和列的交叉處為兩個變量之間的散點圖,上方的圖形和下方的圖形對稱,加入參數upper.panel=NULL可設置隻顯示下半部分
#查看頭幾行數據 head(mtcars) pairs(~mpg disp drat wt,data=mtcars,main="基本散點圖矩陣")
基本散點圖矩陣
散點圖拟合矩陣(推薦)scatterplotMatrix( ),推薦使用,繪制帶有拟合曲線的散點圖矩陣
散點圖上添加了線性拟合和平滑拟合線(綠線和紅線)
對角線上顯示了每個變量的核密度估計圖和軸須圖
spread=FALSE,表示不添加展示分散度和對稱信息的直線
lty=2,設置線性拟合(綠線)線的形狀為type“2”,也就是虛線
library(car) scatterplotMatrix(~mpg disp drat wt,data=mtcars,spread=FALSE,lty=2,main="利用car包繪制散點圖矩陣")
~mpg disp drat wt|cyl,不同發動機缸數cyl下的散點圖
diagonal="histogram",設置對角線上的圖形為變量的直方圖
○代表4缸發動機,△代表6缸發動機,﹢代表8缸發動機
scatterplotMatrix(~mpg disp drat wt|cyl,data=mtcars,spread=FALSE,lty=2,diagonal="histogram",main="不同發動機缸數下的散點圖矩陣")
不同類别下的散點圖拟合矩陣
帶顔色的排序散點圖矩陣cpairs(),畫圖函數
cor( ),計算變量的相關系數矩陣
變量離主對角線越近相關性越高
優點:當變量數目比較多時,利用這個圖一眼就能找到與我們所關注的變量最相關的變量
cor(mtcars[,c('mpg','disp','drat','wt')])
相關系數矩陣
library(gclus) data=mtcars[,c(1,3,5,6)] data.cor=abs(cor(data)) colors=dmat.color(data.cor) #生成顔色矩陣 order=order.single(data.cor) #用來排序 cpairs(data,order,panel.colors=colors,gap=0.5,main="帶顔色的排序散點圖矩陣") #gap=0.5,增加兩個圖形之間的間距
帶顔色的排序散點圖矩陣
從圖中可以看出,相關性最高的是車重wt和排量disp以及車重wt和每加侖英裡數mpg(标了紅色,而且離主對角線近)。相關性最低的是後軸比drat和每加侖英裡數mpg(标了黃色,且離主對角線較遠)。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!