文末領取
【7類SQL數據分析常用語句】
R語言所處理的工作層
解釋一下:最下面的一層為數據源,往上是數據倉庫層,往上是數據探索層,包括統計分析,統計查詢,還有就是報告。
再往上的三層,分别是數據挖掘,數據展現和數據決策。
由上圖可知,R語言是可以用于數據挖掘,數據展現,而後領導根據展現的數據來決策,R語言在數據展現的方面,擁有很強大的功能。
R語言的數據結構
包括如下的幾項:向量c,矩陣matrix,數組array,數據框dataframe,列表list和因子factor
1. 向量
創建向量的方法一共有三種,分别如下:
使用c的這個方法:
解釋一下,就是創建x1向量,x2向量,然後分别使用length和mode函數,獲得向量的長度和向量的類型,上面顯示的向量的類型是numeric,即為數字類型。
然後,分别使用rbind(x1,x2)和cbind(x1,x2)兩個方法分别對兩個向量進行行組合和列組合。
那麼向量是否可以為别的類型呢?答案很顯然是可以的,如下所示,向量中隻要含有字符串,那麼這個向量就是字符類型的。
創建向量的方法,及向量的截取:
由上面的代碼可知,不寫c的情況下,可以直接使用來完成向量的創建,而切在常見的同時,根據加減乘來決定所創建向量的具體的形式”
向量中元素的選取和别的語言中的數組的方法是相同的,不同的是,他可以加上一個負号進行選取,而後選取的結果就是去掉這個元素之後的其他的元素。
這種方法不單單适用于單個元素,依舊适用于多個元素,多個元素的時候使用來完成。
創建向量的方式:
這種創建方式,長的和第一種方法有點相同,其效果和第二個方法的效果又有點相似,其中by其表示等差,length表示的是個數,根據個數來判斷方差到底是多少?
這三種創建向量方法的總結對比,似乎會得到一個結論:
第一種,适合于創建有限個少量的元素的向量
第二種,适合于創建大量元素,但是這些元素之間關系不是那麼強烈的向量
第三種,适合創建擁有等差性質的向量
下面的時候,還有一個創建向量的方法。
最後還有一個向量,是R語言之中内置的常向量,用來表示a,b,c,d...z等26個字母
2. 使用特定的函數,對向量進行操作
這裡包括了which函數,其中which.max和which.min分别用來取向量中的最大值和最小值的下标,注意是下标,不是對應的值,還可以用來去特定範圍和特定值的下标,而後便是rev函數和sort函數,分别用來進行反轉和排序。
3. 矩陣
不同于創建向量的方法,矩陣的創建方法隻有一種,且是在向量的基礎上,對向量進行按列和按行進行排序得到的結果。
由上面可知,前面有關三個創建向量的方法是有誤的,c方法很顯然也可以用來創建大量的元素的向量,用matrix方法對向量進行組合的時候,默認是安裝列來進行書序的組合,比如第一個,矩陣,按照列,第一個列是1,2,3,第二列才是4,5,6所以就是明顯的按列進行,如果改為用byrow=T,則改為按行來排列。
4. 數組
5. 數據框
數據框的構建也隻有一種方法,他的也是有向量組合而成,由此可以見得,向量是R語言最根本對的數據結構,如果沒有向量,一切都是不行的。
同時不同于矩陣,他的每一個列可以和其他的列是不同的類型。
6. factor
下圖所示,iris是R語言内置的數據框,如果使用facotor就可以選擇其中的一列
如上圖所指示,就是去的列的值了,字面的上的意思就是取得影響因子。
7. 列表
所謂列表,可以看成是有序個元素的集合,他存進去的順序很顯然是和取出來的書序是相等的。
R語言計算相關的函數
1. 普通運算
由上圖所示,mean是求平均值,sum是求和,max( )是求最大值,,min 是求最小值
2. 矩陣運算
包括加減乘除,求特征值和特征向量等等
其加法減法的表示沒有啥特殊的,同時需要注意的是,t是表示轉置,他的功效很大,還可以吧轉化為矩陣,如下圖所示:
就完成了到行矩陣的轉換,同時也完成了行矩陣到列矩陣的轉換
矩陣的乘法,就是%*% ,純粹的*隻是矩陣的元素相乘。diag函數,可以根據矩陣獲得列表對象線上的元素,當然還可以根據對角線上的元素,來創建一個矩陣,同時可以用來構建單位陣。
如下計算,rnorm是去的随機數,solve函數是用求得矩陣a的逆矩陣,即為矩陣的除法
如下圖所示,solve函數依舊可以用來解方程組:
如下圖所示,eigen函數就是用來取得一個矩陣的特征向量和特征值,同時可以使用$來取出
R的語句
1. for語句
不同于别的語法,for循環之中,沒有必要初始化值,a或者b有一個初始化的值
2. while 循環語句
不同于上面的,a需要有初始的值,也還要控制i的加減
一些其他的特殊的函數
注意在,文本中,如果想加載這個文件打印,就需要在文本的代碼之中,使用print函數。
soure函數
print函數
正态分布函數rnorm
泊松分布函數rpois
指數分布函數rexp
Gamma分布函數rgamma
均勻分布函數runif
二項分布函數rbinom
幾何分布函數rgeom
End.
來源:博客園
【7類SQL數據分析常用語句】
· 愛數據每周免費直播 ·
直播主題:如何應聘在線醫療行業數據分析崗位
直播内容:
在線醫療數據崗位分析
在線醫療領域職業生涯規劃
在線醫療領域公司崗位說明
直播時間:3月19日 下周四晚20:30準時直播分享
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!