第二十五章抽樣調查
[考情分析]
1、分值:3~7分
2、備考指導:本章節内容較少,理解難度較低,屬于較好得分的章節節
3、考綱要求:
(1)理解概率抽樣和非概率抽樣,辨别抽樣調查的一般步驟。
(2)掌握常用的基本概率抽樣方法的基本原理和适用場合。
(3)理解估計量的性質。
(4)掌握不放回簡單随機抽樣下均值估計量方差的估計方法和樣本量的計算方法。
(5)辨别概率抽樣中樣本量的影響因素。
一、抽樣調查的基本概念
(一)抽樣調查的基本概念
1、抽樣調查:指按照某種原則和程序,從總體中抽取一部分單位,通過對這一部分單位進行調查得到信息,以達到對總體情況的了解,或者對總體的有關參數進行估計。(抽樣調查是使用頻率最高的一種調查方式。)
2、總體:即調查對象的全體。
3、樣本:樣本是總體的一部分,它由從總體中按一定原則或程序抽出的部分個體所組成。與總體一樣,樣本也是一個集合。(每個被抽中進入樣本的單位稱為入樣單位。樣本中包含的入樣單位的個數稱為樣本量。)
4、總體參數:是我們所關心變量的數字特征,它是根據總體中所有單位的數值計算的。也可以說總體參數就是指标值,它是未知的常數,是我們通過調查想要了解的,不受樣本的抽選結果影響。
常用的總體參數:總體總量、總體均值、總體比例、總體方差等,如公司所有注冊在職人員的平均工資。
5、樣本統計量:根據樣本中各單位的數值計算的,是對總體參數的估計,也稱為估計量。
樣本統計量是一個随機變量,它取決于樣本設計和正好被選入樣本的單元特定組合。
常用的樣本統計量:樣本均值、樣本比例、樣本方差等
6、抽樣框:供抽樣所用的所有抽樣單元的名單,是抽樣總體的具體表現。
抽樣框可以有多種形式,常用的有名錄框,如企業名錄、電話簿、人員名冊等。抽樣框中的單位必須是有序的,便于編号。高質量
抽樣框應當提供被調查單位更多的信息,并且沒有重複和遺漏。
[經典真題]
1、[2021]在某省住戶收支與生活狀況調查中,通過對該城鎮住戶和農村住戶的抽樣調查來了解該省城鄉居民收入、消費即掐生活組昂庫。該抽樣調查的總體是該省()
A、被調查的住戶
B、每一個被采集數據的用戶
C、所有住戶
D、每一個住戶
參考答案:C
參考解析:總體即調查對象的全體。根據題幹,調查對象為住戶,總體為所有住戶。
(二)概率抽樣與非概率抽樣
按抽取樣本方法的不同分類:
A概率抽樣
1、概率抽樣:也稱随機抽樣,指依據随機原則,按照某種事先設計的程序,從總體中抽取部分單元的方法。概率抽樣有等概率抽樣和不等概率抽樣。
2、特點:
(1)按一定的概率以随機原則抽取樣本;
(随機原則,就是在抽取樣本時排除主觀上有意識地抽取調查單元的情況,使每個單元都有一定的機會被抽中。)
(2)總體中每個單元被抽中的概率是已知的,或者是可以計算出來的;
(3)當采用樣本對總體參數進行估計時,要考慮到每個樣本單元被抽中的概率。
B非概率抽樣
1、非概率抽樣:又稱為非随機抽樣,是調查者根據自己的方便或主觀判斷抽取樣本的方法,其最主要的特征是抽取樣本時并不是依據随機原則。
2、主要方法:
(1)判斷抽樣:指在抽取樣本時,調查人員依據調查目的和對調查對象情況的了解,人為确定樣本單元;如,選擇"平均型"單元作為樣本,選定的樣本可以代表所研究變量的平均水平。
(2)方便抽樣:指在抽取樣本時,依據方便的原則,以達到最大限度降低調查成本的目的;如“攔截式調查,在街邊或居民小區攔住行人進行調查。
(3)自願樣本不是經過抽取,而是由自願接受調查的單元所組成的樣本如:網上調查。
(4)配額抽樣:指将總體中的各單元按一定标準劃分為若幹類型,将樣本數額分配到各類型中,從各類型中抽取樣本的方法則沒有嚴格限制,一般采用方便抽樣的方法抽取樣本單元。
[經典真題]
1、[2021]在某企業網站上發布調查問卷開展該企業員工滿意調查,采用有獎問答的形式進行,企業員工接受調查。這種抽樣方法是()。
A、判斷抽樣
B、自願抽樣
C、配額抽樣
D、方便抽樣
參考答案:B
參考解析:自願樣本不是經過抽取,而是由自願接受調查的單元所組成的樣本。
2、[2020)下列抽樣調查方法中,屬于非概率抽樣的有()。
A、系統抽樣
B、判斷抽樣
C、方便抽樣
D、分層抽樣
E、多階段抽樣
參考答案:BC
參考解析:非概率抽樣的主要方法有:判斷抽樣、方便抽樣、自願抽樣本、配額抽樣。
(三)抽樣調查的一般步驟
1、确定調查問題:“要做什麼樣的調查研究”和“為什麼要做這項調查研究”。
2、調查方案設計:明确如何實施調查,主要包括抽樣方案的設計和問卷設計。
3、實施調查過程:獲得樣本單元的調查數據,關鍵是要保證原始數據的質量。
4、數據處理分析
(1)檢查、核對原始數據;
(2)對驗收合格的數據進行編碼和錄入;
(3)對錄入的數據進行預處理;
(4)對數據進行統計分析;
(5)對總體參數進行估計。
5、撰寫調查報告:是調查活動的最終成果。
[經典真題]
1、[2021]下列統計活動中,一般在數據處理分析階段完成的有()
A、數據錄入
B、抽取樣本
C、數據編碼
D、明确定義問題
E、問卷設計
參考答案:AC
參考解析:數據處理分析。這個過程包括對調查獲得的原始數據進行檢查、核對,對驗收合格的數據進行編碼和錄入,對錄入的數據進行預處理,對數據進行統計分析,對總體參數進行估計等。
1、[2021]下列統計活動中,一般在抽樣調查方案設計階段完成的有()
A、确定具體調研問題
B、數據預處理
C、确定抽樣方法
D、撰寫報告
E、數據錄入
參考答案:AC
參考解析:在抽樣調查方案設計階段,要明确如何實施調查,主要包括抽樣方案的設計和問卷設計。抽樣方案描述如何抽取樣本,問卷設計則将比較抽象的調研問題逐步細化,演變為現場調查中采訪者詢問的、比較具體的問題的工作過程。
(四)抽樣調查中的誤差
樣本估計值和總體參數真值之間的差異稱為誤差。一般來說,調查中的誤差可以分為抽樣誤差和非抽樣誤差兩大類。
A抽樣誤差
抽樣誤差:是由于抽樣的随機性造成的,用樣本統計量估計總體參數時出現的誤差。
産生的根本原因:抽到哪一個樣本完全是随機的,而抽到不同的樣本,對總體的估計就會不同。
B非抽樣誤差
非抽樣誤差:指除抽樣誤差以外,由其他原因引起的樣本統計量與總體真值之間的差異。
産生的原因:
(1)抽樣框誤差:如,用市場監督管理局(2021教材改動)簽發的營業執照作為個體商業的抽樣框,對個體商業實施抽樣調查,以掌握個體商業零售額的情況。但有些個體商販是無照經營、或有營業執照但已轉行等。用抽樣框中的單位數對總體零售額推估,也會造成誤差。均是由于抽樣框不完善造成的,故稱其為抽樣框誤差。
(2)無回答誤差
①随機因素:被調查者不在家或因病無法接受調查;減少了有效樣本量,會造成估計量方差增大。
②非随機因素:被調查者不願告訴實情而拒絕回答;不僅造成估計量方差增大,還會帶來估計偏差。
(3)計量誤差
①由于調查所獲得的數據與其真值之間不一緻造成的誤差。可能是由調查人員、問卷設計、受訪者等原因造成的。
②舉例:1>調查員誘導被調查者,調查中的提問錯誤或記錄答案錯誤,調查人員有意作弊;
2>由于問卷的原因受訪者對調查問題的理解上有偏誤;
3>受訪者記憶不清,受訪者提供虛假數字等。
[經典真題]
1、[2021]為調查新冠肺炎疫情對某城市餐飲行業個體戶經營狀況的影響,從市場監督管理局數據庫中按照等距抽樣方法抽取10000個餐飲行業個體戶進行抽樣調查,回答率為20%,該調查中可能存在系統偏差的誤差有()。
A、抽樣誤差
B、随機誤差
C、無回答
D、計量誤差
E、抽樣框誤差
參考答案:CDE
參考解析:非抽樣誤差包括抽樣框誤差、無回答誤差、計量誤差。
2、[2020]下列誤差來源中,可能導緻抽樣框誤差的是()
A、抽樣框遺漏部分總體單元
B、抽樣的随機性
C、調查人員作弊
D、受訪者拒絕接受調查
參考答案:A
參考解析:抽樣誤差是由于抽樣的随機性造成的,B錯誤。調查人員作弊會導緻計量誤差,C錯誤。受訪者拒絕接受調查屬于無回答誤差,D錯誤。
二、幾種基本概率抽樣方法
(一)簡單随機抽樣
1、[2020]某研究機構通過抽樣調查了解某市餐飲行業的營業,從所有餐飲業中随機抽取一家企業,再從剩餘企業中等概率随機抽取一家企業,以此類推直到抽取n家企業,這種抽樣的方法是()
A、簡單随機抽樣
B、分層抽樣
C、整群抽樣
D、系統抽樣
參考答案:A
參考解析:不放回簡單随機抽樣指從包含N個單元的總體中逐個随機地抽取單元并不放回,每次都在所有尚未被抽入樣本的單元中等概率地抽取下一個單元,直到抽取n個單元為止。
(二)分層抽樣
[經典真題]
1、[2019]關于分層抽樣設計的說法正确的有(
A、不同層間單元的差異盡可能大
B、各層的樣本單元比例必須與該層的總體單元比例一緻
C、不等比例分層抽樣的抽樣誤差大于等比例分層抽樣
D、抽樣框中必須有總體單元的分層信息
E、同一層内單元間的差異盡可能小
參考答案:ADE
參考解析:分層抽樣應用條件:抽樣框中有足夠的輔助信息,能夠将總體單位按某種标準劃分到各層之中,實現在同一層内各單位之間的差異盡可能地小,不同層之間各單位的差異盡可能地大,本題ADE正确。分層抽樣中,樣本量在各層中分配的方法可以歸為兩類,等比例分配和不等比例分配;選項B錯誤。為了降低抽樣誤差,在方差大的層中多抽,在方差小的層中少抽,這些都屬于不等比例抽樣;選項C錯誤。
(三)系統抽樣
[經典真題]
1、[2018]将總體的所有單元按一定順序排列,在規定範圍内,随機抽取一個初始單元,然後按事先規定的規則抽取其他樣本單元的抽樣方法是()
A、系統抽樣
B、整群抽樣
C、簡單随機抽樣
D、分層抽樣
參考答案:A
參考解析:系統抽樣是指先将總體中的所有單元按一定順序排列,在規定範圍内随機抽取一個初始單元,然後按事先規定的規則抽取其他樣本單元。
(四)整群抽樣
A概念
整群抽樣:将總體中所有的基本單位按照一定規則劃分為互不重疊的群,抽樣時直接抽取群,對抽中的群調查其全部基本單位,對沒有抽中的群則不進行調查。
B優點
(1)實施調查方便,可以節省費用和時間。
(2)抽樣框編制得以簡化,抽樣時隻需要群的抽樣框,而不要
求全部基本單位的抽樣框。
C缺點
由于抽取的樣本單位比較集中,群内各單位之間存在相似性,
差異比較小,而群與群之間的差别往往比較大,使得整群抽樣的抽樣誤差比較大。
D适用性
整群抽樣特别适合于對某些特殊群結構進行調查。
如果群内各單位之間存在較大的差異,而群與群的結構相似,整群抽樣反而會降低估計誤差。
1、[2021]在調查某城市餐飲行業個體戶的經營狀況時,從該城市的所有調查小區中随機抽取50個,然後對每個被抽中調查小區中所有餐飲行業個體戶進行全面調查,這種抽樣方法是()。
A、判斷抽樣
B、分層抽樣
C、等距抽樣
D、整群抽樣
參考答案:D
參考解析:整群抽樣是将總體中所有的基本單位按照一定規則劃分為互不重疊的群,抽樣時直接抽取群,對抽中的群調查其全部基本單位,對沒有抽中的群則不進行調查。根據題幹是對被抽中調查小區中所有餐飲行業個體戶進行調查。故選整群抽樣。
(五)多階段抽樣
概念
在大規模抽樣調查中,一次抽取到最終樣本單位是很難實現的,往往需要經過兩個或兩個以上階段才能抽到最終樣本單位,這就是多階段抽樣方法
(1)首先從總體中采用随機方法抽取若幹個小總體,稱為初級單元;
(2)再在這些選中的初級單元中随機抽取若幹個單位。
(多階段抽樣是對經過兩個及兩個以上抽樣階段的抽樣方法的統稱。)
采用原因
1、在大範圍抽樣調查中,往往沒有包括所有總體單位的抽樣框,或者編制這樣的抽樣框十分困難。多階段抽樣是分階段進行的,抽樣框也可以分級進行準備。
2、多階段抽樣是在選中的單位中進行再抽選,這樣就使樣本的分布相對集中,從而可以節省調查中的人力和财力。
缺點
1、多階段的抽樣設計比較複雜,不僅涉及如何劃分階段,還包
括在每個階段上應當抽取多大樣本量,以及每個階段的抽樣方法。
2、多階段的抽樣誤差計算也比較複雜。
1、[2021]在調查某城市參與行業個體戶的經營狀況時,從該城市的所有居(村)委會中随機抽取50個居(村)委會,然後在每個被抽中的居(村)委會中再抽出5個個體戶進行調查,這種抽樣方法屬于()。
A、整群抽樣
B、分層抽樣
C、等距抽樣
D、多階段抽樣
參考答案:D
參考解析:在大規模抽樣調查中,一次抽取到最終樣本單位是很難實現的,往往需要經過兩個或兩個以上階段才能抽到最終樣本單位,這就是多階段抽樣方法。首先從總體中采用随機方法抽取若幹個小總體,稱為初級單元;再在這些選中的初級單元中随機抽取若幹個單位(故選D)。如果經過兩個階段抽樣,抽取到接受調查的最終單位,稱為二階段抽樣;如果經過三個階段才抽取到接受調查的最終單位,稱為三階段抽樣,以此類推。所以,多階段抽樣是對經過兩個及兩個以上抽樣階段的抽樣方法的統稱。
三、估計量和樣本量
(一)估計量的性質(無偏性、有效性、緻性)
1、估計量的無偏性:對于不放回簡單随機抽樣,所有可能的樣本均值取值的平均值總是等于總體均值,這就是樣本均值估計量的無偏性。
2、估計量的有效性:由于方差是度量分布密集或離散狀況的重要指标,估計量方差常用于描述抽樣誤差。估計量方差越大,說明可能的樣本估計值之間的差異越大,用樣本統計量估計總體參數的效率就越低,抽樣誤差越大。
3、估計量的一緻性:随着樣本量的增大,估計量的值如果穩定于總體參數的真值,這個估計量就有一緻性,可稱為一緻估計量。
[經典真題]
1、[2021]随着樣本量的增大,估計量的值穩定于總體參數的真值,則這個估計量具有()
A、真實性
B、一緻性
C、無偏性
D、有效性
參考答案:B
參考解析:随着樣本量的增大,估計量的值如果穩定于總體參數的真值,這個估計量就有一緻性,可稱為一緻估計量。
(二)抽樣誤差的估計
抽樣誤差雖然無法避免,但可以計算。以不放回簡單随機抽樣下均值估計量為例:
假設從總體的N個單元中按照不放回簡單随機抽樣方法抽取n個單元作為樣本,用Y1,Y2,YN表示總體關于變量Y的N個觀測值,用y1,y2,......yn表示樣本中的n個觀測值。則估計量y的方差為:
(1)抽樣誤差與總體分布有關,總體單位值之間差異越大,則總體方差S越大,抽樣誤差就越大。
(2)抽樣誤差與樣本量n有關,在其他條件相同情況下,樣本量越大,抽樣誤差就越小。
(3)抽樣誤差與抽樣方式和估計量的選擇也有關系。例如,分層抽樣的估計量方差一般小于簡單随機抽樣。
(4)利用有效輔助信息也可以有效地減小抽樣誤差。
實踐中,總體方差S2是未知的,可以利用樣本方差來估計,因此計量方差的估計公式為:
[經典真題]
1、[2021]采用不放回簡單随機抽樣方法從總體(N=10000)中抽取樣本
(n=1000),用樣本均值的總體均值,樣本方差為1000,則估計量的方差估計為()。
A、0.09
B、0.9
C、0.99
D、9.9
參考答案:B
參考解析:
故估計量的方差=[1-(1000/10000) ]* (1000/1000) =0.9
參考答案:A
參考解析:
(三)樣本量的計算
1、樣本量的影響因素:
(1)調查的精度(同向).調查的精度是指用樣本數據對總體進行估計時可以接受的誤差水平。要求的調查精度越高(誤差水平越小),所需要的樣本量就越大。
(2)總體的離散程度(同向):在其他條件相同情況下,總體方差越大,所需要的樣本量也越大。
(3)總體的規模:對于大規模的總體,總體規模對樣本量的需求幾乎沒有影響。對小規模的總體,總體規模越大,為保證相同估計精度,樣本量也要随之增大(但不是同比例的)。
(4)無回答情況:若無回答率較高,樣本量要大一些。
(5)經費的制約:樣本量是調查經費與調查精度之間的某種折中和平衡。
(6)調查的限定時間及實施調查的人力資源。
[經典真題]
1、[2021]在簡單随機抽樣調查中,關于樣本量的說法,正确的有()
A、樣本量是調查經費與調查精度之間的某種折中和平衡
B、在不同的樣本量水平上,增加同等的樣本量所降低的抽樣誤差是相同的
C、總體規模增大,樣本量要同比例增大
D、允許的調查誤差越小,需要的樣本量越大
E、總體方差越大,需要的樣本量越大
參考答案:ADE
參考解析:随着樣本量的增大,增加同等樣本量所增加的精度幅度呈下降趨勢,B錯誤。對小規模的總體,總體規模越大,為保證相同估計精度,樣本量也要随之增大(但不是同比例的),C錯誤。
2、[2019]關于樣本量的說法,正确的有()
A、調查誤差越小所需的樣本量越大
B、總體方差越小所需的樣本量越小
C、總體規模越大樣本量要同比例增大
D、經費越少樣本量越小
E、無回答率越高需要抽取的樣本量越大
參考答案:ABDE
參考解析要求的調查精度越高(誤差水平越小),所需要的樣本量就越大;選項A正确。在其他條件相同情況下,總體方差越大,所需要的樣本量也越大;選項B正确。對小規模的總體,總體規模越大,為保證相同估計精度,樣本量也要随之增大(但不是同比例的);選項C錯誤。樣本量是調查經費與調查精度之間的某種折中和平衡;選項D正确。若無回答率較高,樣本量要大一些;選項E正确。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!