tft每日頭條

 > 科技

 > 各種抽樣方法的選擇

各種抽樣方法的選擇

科技 更新时间:2024-11-14 10:17:20

各種抽樣方法的選擇?從總體樣本中,抽一批數據,不管是訓練模型,還是查case追問題,還是分析特征,正确的抽樣姿勢,對得到的結論十分重要,科學合理的抽樣姿勢,有助于避免我們犯錯誤,下面我們就來聊聊關于各種抽樣方法的選擇?接下來我們就一起去了解一下吧!

各種抽樣方法的選擇(數據抽樣方法大全)1

各種抽樣方法的選擇

背景

從總體樣本中,抽一批數據,不管是訓練模型,還是查case追問題,還是分析特征,正确的抽樣姿勢,對得到的結論十分重要,科學合理的抽樣姿勢,有助于避免我們犯錯誤。

本文重點介紹數據抽樣方法。各位策略産品們必須收藏必須轉。

具體說明一、什麼是抽樣

抽樣是一種方法,它使我們能夠基于子集(樣本)的統計信息來獲取總體信息,而無需調查所有樣本。

二、為什麼抽樣

1、省時間

2、省資源

3、分析起來方便,容易突出問題

三、抽樣的步驟

1、抽誰:确認總體,明确定義目标群體

2、去哪兒抽:獲取群體名單列表範圍

3、怎麼抽:确認抽取的科學方法

4、抽多少:算清楚抽取樣本的量,有代表,能處理

5、開抽:抽取哪些信息,操作,得到結果,驗證代表性

四、抽取的科學方法

概率抽樣:在概率抽樣中,總體中的每個個體都有相等的被選中的機會。抽取應當是完全客觀的,不能依據某個人的主觀意志加以選擇。

1、簡單抽樣:簡單抽樣分為有放回抽樣和無放回抽樣。無放回抽樣:從N個個體中随機抽取n個個體,每次抽取一個個體,且抽取後不再放回。有放回抽樣:跟無放回類似,但是每次抽取個體之後,要放回。

2、簇抽樣( 整群抽樣):先将總體分為多個不相交的簇,然後再抽取一個或多個簇作為樣本。簇抽樣要求簇内的差異較大,簇之間的差異較小,從而使得簇抽取的樣本具有代表性。

3、分層抽樣(類型抽樣法):從一個可以分成不同子總體(或稱為層)的總體中,按規定的比例從不同層中随機抽取樣品(個體)的方法。這種方法的優點是,樣本的代表性比較好,抽樣誤差比較小。缺點是抽樣手續較簡單随機抽樣還要繁雜些,運用分層抽樣抽取測量樣本時,要盡力縮小各層組内的差異,增大層組間的差異;同時層組的劃分也不宜過細,以免層組内個體數目過少而無法抽樣;再次劃分層次的标準必須明确,以免混淆或遺露。

4、系統抽樣(機械抽樣、等距抽樣)):從N個個體中抽取n個個體,做法是先确定k=N/n(對k向上取整),把N個個體分為n段,每段有k個個體,設定一個整數m,1 <= m <= k,在每段中抽取第m個個體,抽取完n段得到n個個體,這n個個體就是抽樣的結果。機械抽樣的間隔接近評估總體中個體類别分布的間隔時,常常形成周期性的偏差。

非概率抽樣:在非概率抽樣中,所有元素被選中的機會都不相等。因此,有一個顯著的風險,即最終得到一個不具代表性的樣本。非随機抽樣是根據主客觀條件而主觀選擇樣本的方式,又稱判斷抽樣。

1、便利抽樣 :純粹以方便為着眼點的抽樣方法,樣本之選擇隻考慮方便與否,所以通常代表性較低,例如在街上随意抽訪。

2、配額抽樣:根據預先确定的總體特征來選擇樣本,也稱“定額抽樣”,是指調查人員将調查總體樣本按一定标志分類或分層,确定各類(層)單位的樣本數額,在配額内任意(主觀)抽選樣本的抽樣方式。

3、判斷抽樣:這也稱為選擇性抽樣。在選擇要求參加者時,取決于專家判斷。

4、雪球抽樣:現有的人被要求推薦更多他們認識的人,這樣樣本的大小就會像滾雪球一樣增加。當抽樣框架難以識别時,這種采樣方法是有效的。

五、結合業務的思考題以及答案

1、某信息流業務,需要抽取一部分feed流的用戶,投放 推薦滿意度調查問卷,應該如何抽樣?

2、某下沉市場巨頭,要對不同年齡段的用戶,對本産品的接受程度做線下調研,應該如何抽樣?

3、某在線教育公司,想調研不同收入的男女家長,對在線教育的接受程度,做電話訪談。

4、某二次元垂類App,想抽樣數據分析,大齡男性在B站的消費情況,以及留存差的原因。

歡迎有問題随時跟我交流,習題的答案在評論區公布哦到時候。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved