企業的客戶關系管理數據庫裡存有大量會員數據,對會員進行分析,就必須要抽取樣本,而會員因為消費、年齡等不同,又會有不同的分類,如果要想獲取準确的分析結果,不能采取單一的随機抽樣方法獲取樣本,而必須采用分層的方法,對會員分層,然後再抽取樣本。在實施最優分配方案時,可能會遇到意想不到的麻煩,我們知道每層的會員樣本量n與每層的會員數,每層的方差成正比,而與抽取每層會員單位成本的二次方根成反比。假如某些層的标準差S特别大,而每層的會員數N相對于總樣本量n又小得多,同時這些層的平均單位抽樣費用C較低,那麼此時按照最優分配n計算得出的層的樣本可能會超過每層的會員數,這時對這些層至少要實施100%的抽樣,即對這些層進行普查,然後再将剩下的樣本量按最優分配方式在其餘各層進行分配。
假設某公司會員總體按消費額度分為四層,Nh和Sh的值列于下表中,假如樣本量n=100,應如何進行内曼最優分配?
解:第一步:根據上表中的數據計算内曼最優分配下各層的樣本量n1=100*(3000/36000)=8,而N1=6,可見n1>N1,因此令n1=N1=6。
第二步:将n-n1=94個待分配的樣本量再按照内曼最優分配的原則分配到第2層到第4層,則n2=94*(12000/33000)=34.而N2=20,可見n2>N2,因此,再令n1=N1=6,n2=N2=20。
第三步:将n-n1-n2=74個待分配的樣本量再按照内曼最優分配的原則分配到第3層和第4層,則n3=74*(6000/21000)=21.而N3=300,可見n3<N3,且n4=74*(15000/21000)=53。而N4=500,也滿足n4<N4。
第四步:确定各層最終所分配的樣本量。n1=6,n2=20,n3=21,n4=53。
(作者系國際數控管理專家李穎)
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!