1.簡單随機抽樣
(1)定義:一般地,設一個總體含有N個個體,從中逐個不放回地抽取n個個體作為樣本(n≤N),如果每次抽取時總體内的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單随機抽樣.這樣抽取的樣本,叫做簡單随機樣本.
(2)常用方法:抽簽法和随機數法.
2.分層抽樣
(1)在抽樣時,将總體分成互不交叉的層,然後按照一定的比例,從各層獨立地抽取一定數量的個體,将各層取出的個體合在一起作為樣本,這種抽樣方法是一種分層抽樣.
(2)分層抽樣的應用範圍
當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣.
3.頻率分布直方圖
(1)縱軸表示組距(頻率),即小長方形的高=組距(頻率);
(2)小長方形的面積=組距×組距(頻率)=頻率;
(3)各個小方形的面積總和等于1.
4.頻率分布表的畫法
第一步:求極差,決定組數和組距,組距=組數(極差);
第二步:分組,通常對組内數值所在區間取左閉右開區間,最後一組取閉區間;
第三步:登記頻數,計算頻率,列出頻率分布表.
5.條形圖、折線圖及扇形圖
(1)條形圖:建立直角坐标系,用橫軸(橫軸上的數字)表示樣本數據類型,用縱軸上的單位長度表示一定的數量,根據每個樣本(或某個範圍内的樣本)的數量多少畫出長短不同的等寬矩形,然後把這些矩形按照一定的順序排列起來,這樣一種表達和分析數據的統計圖稱為條形圖.
(2)折線圖:建立直角坐标系,用橫軸上的數字表示樣本值,用縱軸上的單位長度表示一定的數量,根據樣本值和數量的多少描出相應各點,然後把各點用線段順次連接,得到一條折線,用這種折線表示出樣本數據的情況,這樣的一種表示和分析數據的統計圖稱為折線圖.
(3)扇形圖:用一個圓表示總體,圓中各扇形分别代表總體中的不同部分,每個扇形的大小反映所表示的那部分占總體的百分比的大小,這樣的一種表示和分析數據的統計圖稱為扇形圖.
6.中位數、衆數、平均數的定義
(1)中位數
将一組數據按大小依次排列,處于最中間位置的一個數據(或最中間兩個數據的平均數)叫做這組數據的中位數.
(2)衆數
一組數據中出現次數最多的數據叫做這組數據的衆數.
(3)平均數
一組數據的算術平均數即為這組數據的平均數,n個數據x1,x2,…,xn的平均數=n(1)(x1+x2+…+xn).
7.樣本的數字特征
1.頻率分布直方圖中的常見結論
(1)衆數的估計值為最高矩形的中點對應的橫坐标.
(2)平均數的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐标之和.
(3)中位數的估計值的左邊和右邊的小矩形的面積和是相等的.
2.平均數、方差的公式推廣
(1)若數據x1,x2,…,xn的平均數為,則mx1+a,mx2+a,mx3+a,…,mxn+a的平均數是m+a.
(2)若數據x1,x2,…,xn的方差為s2,則數據ax1+b,ax2+b,…,axn+b的方差為a2s2.
1.應用簡單随機抽樣應注意的問題
(1)一個抽樣試驗能否用抽簽法,關鍵看兩點:一是抽簽是否方便;二是号簽是否易攪勻.一般地,當總體容量和樣本容量都較小時可用抽簽法.
(2)在使用随機數法時,如遇到三位數或四位數,可從選擇的随機數表中的某行某列的數字計起,每三個或四個作為一個單位,自左向右選取,有超過總體号碼或出現重複号碼的數字舍去.
2.分層抽樣問題的類型及解題思路
(1)求某層應抽個體數量:按該層所占總體的比例計算.
(2)已知某層個體數量,求總體容量或反之求解:根據分層抽樣就是按比例抽樣,列比例式進行計算.
(3)分層抽樣的計算應根據抽樣比構造方程求解,其中“抽樣比=總體容量(樣本容量)=各層個體數量(各層樣本數量)”.
1.變量間的相關關系
(1)常見的兩變量之間的關系有兩類:一類是函數關系,另一類是相關關系;與函數關系不同,相關關系是一種非确定性關系.
(2)從散點圖上看,點散布在從左下角到右上角的區域内,兩個變量的這種相關關系稱為正相關;點散布在左上角到右下角的區域内,兩個變量的這種相關關系為負相關.
2.兩個變量的線性相關
(1)從散點圖上看,如果這些點從整體上看大緻分布在通過散點圖中心的一條直線附近,稱兩個變量之間具有線性相關關系,這條直線叫做回歸直線.
(2)回歸方程為^(y)=^(b)x+^(a),其中
^(b)=)2(n)=2(2), ^(a)=-^(b).
(3)通過求(yi-bxi-a)2(n)的最小值而得到回歸直線的方法,即使得樣本數據的點到回歸直線的距離的平方和最小,這一方法叫做最小二乘法.
(4)相關系數:
當r>0時,表明兩個變量正相關;
當r<0時,表明兩個變量負相關.
r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系.通常|r|大于0.75時,認為兩個變量有很強的線性相關性.
3.獨立性檢驗
(1)2×2列聯表
設X,Y為兩個變量,它們的取值分别為{x1,x2}和{y1,y2},其樣本頻數列聯表(2×2列聯表)如下:
y1 |
y2 |
總計 | |
x1 |
a |
b |
a+b |
x2 |
c |
d |
c+d |
總計 |
a+c |
b+d |
a+b+c+d |
(2)獨立性檢驗
獨立性檢驗是對兩個變量有關系的可信程度的判斷,而不是對其是否有關系的判斷.
[常用結論]
1.求解回歸方程的關鍵是确定回歸系數^(a),^(b),應充分利用回歸直線過樣本中心點(,).
2.根據K2的值可以判斷兩個分類變量有關的可信程度,若K2越大,則兩分類變量有關的把握越大.
3.根據回歸方程計算的^(y)值,僅是一個預報值,不是真實發生的值.
判斷相關關系的2種方法
(1)散點圖法:如果所有的樣本點都落在某一函數的曲線附近,變量之間就有相關關系.如果所有的樣本點都落在某一直線附近,變量之間就有線性相關關系.
(2)相關系數法:利用相關系數判定,當|r|越趨近于1相關性越強.
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!