樣本量要怎麼取合适-tft每日頭條

樣本量要怎麼取合适

生活更新时间:2026-02-21 07:09:21

一、前言

背景：ABTester實驗是具有一定前瞻性，統計性，科學性的特點。用好了就實現了在大數據時代的充分利用數據分析問題，解決問題，為決策提供強有力的依據，但是有時候用戶在使用ABTester時候，會出現一些痛點和疑惑。
痛點：
每次實驗需要多少流量
實驗時間開多長沒有概念
解決問題：
為了驗證某一個功能特性，一個實驗需要開多少流量。
一個實驗需要開多長時間

二、基礎概念1、研究對象總體X：研究問題某個數量指标。2、入手點個體：總體中的一個元素xi 樣本：一部分個體Xi3、工具--統計量

樣本量要怎麼取合适（AB實驗背後的秘密）1

4、抽樣分布

标準正态分布N(0, 1)
Ka方分布
t-分布
F-分布

5、抽樣定理簡單介紹幾個

樣本量要怎麼取合适（AB實驗背後的秘密）2

樣本量要怎麼取合适（AB實驗背後的秘密）3

樣本量要怎麼取合适（AB實驗背後的秘密）4

6、參數估計通俗的說：樣本參數去估計總體的參數。舉個：

樣本均值估計總體均值，
用樣本比例去估計總體比例，
用樣本方差估計總體方差

（1）分類：點估計和區間估計

點估計通俗的說：用樣本的統計量的值直接作為總體參數的估計值。
區間估計通俗的說：在點估計的基礎上，給出總體參數估計的一個區間範圍。

（2）置信區間和置信水平通俗的說：區間估計中，樣本統計量構造的總體參數的估計區間，稱為置信區間。舉個：

100個樣本，每一個樣本構造一個置信區間，100個樣本構造的總體參數的100個置信區間中，有95%的區間包含了總體參數的真值，5%則沒有包含。

大樣本下，樣本均值的置信區間：

樣本量要怎麼取合适（AB實驗背後的秘密）5

（3）總體均值的區間估計原理大樣本下，根據中心極限定理，可以得到的樣本均值的抽樣分布。

樣本量要怎麼取合适（AB實驗背後的秘密）6

7、假設檢驗我們來看一下一個簡單的假設性檢驗的例子：根據水稻長勢，估計平均畝産310kg，收割時，抽取10塊地，測平均畝産320kg，如水稻産量服從正态分布N(u, 144)，問所估計平均畝産是否正确？（a = 0.05，Z0.05 = 1.645，Z0.025 = 1.96）分析：當方差已經的情況下，使用Z檢驗；未知的時候，使用t檢驗

樣本量要怎麼取合适（AB實驗背後的秘密）7

三、一個簡單并完整的ABTester例子1、背景和設置

背景：有個web應用，接入了咱們sdk，上報各種事件埋點。
确認優化的目标：注冊流程改版，從而提供注冊轉換率。
注冊流程的A/B測試：之前是使用了圖片校驗碼的方式，但是注冊轉化率偏低。提出設想：圖片校驗碼方式改成短信校驗碼方式，是因為降低了用戶輸入的難度從而可以提高注冊轉換率。
我們設置
核心指标：注冊轉化率
設置版本：1個對照版本（圖片校驗碼）。1個實驗版本（短信驗證碼）。
設置版本流量：總流量我們設置50%，各個版本均勻分配。
web應用引入我們客戶端分流sdk的，然後将版本代碼插入到項目中。

2、結果分析分别為兩個版本分配了25%的用戶流量，通過2個自然周左右的實驗觀察，數據顯示。結果：新版本（短信校驗碼）的注冊轉化率提升了接近10%，并且95%置信區間是[8%, 12%]，分析：說明這個實驗版本推廣到全量用戶之後，95%的概率下至少會有8%到12%的提升。決策：基于這個實驗結果，産品經理選擇将新版本注冊流程推送給全部用戶，顯著提升了注冊轉化率。四、詳細介紹樣本量計算1、注冊流程改版例子實驗運行後，用戶開始進組。1天後數據統計

樣本量要怎麼取合适（AB實驗背後的秘密）8

這就能說明：短信驗證碼的功能有效提高注冊轉換率？2天後數據統計

樣本量要怎麼取合适（AB實驗背後的秘密）9

這就能說明：圖片驗證碼的功能有效提高注冊轉換率？那麼到底，注冊流程改版對于提高注冊轉換率是否有顯著性提高呢？暫時是不能給出結論的，因為數據樣本還不夠大，不能充分說明。理論上：樣本量越多越好。現實上：1、自身樣本不夠大；2、試錯成本大。選擇樣本數量是個技術活：樣本量太小，有人罵娘；樣本量太大，還是有人罵娘。那麼問題來了：如何确定一個“最小”的樣本數量，在保證實驗“可靠性”的同時，不會浪費過多流量？2、最小樣本公式統計學裡有最小樣本量計算的公式：

樣本量要怎麼取合适（AB實驗背後的秘密）10

說明：1、n是每組所需樣本量，因為A/B測試一般至少2組，所以實驗所需樣本量為2n；2、α和β分别稱為第一類錯誤概率和第二類錯誤概率，一般分别取0.05和0.2；3、Z為正态分布的分位數函數；4、Δ為兩組數值的差異，如注冊轉換率50%到60%，那麼Δ就是10%；5、σ為标準差，是數值波動性的衡量，σ越大表示數值波動越厲害。從而可知：實驗兩組數值差異Δ越大或者數值波動性σ越小，所需要的樣本量就越小。3、方法一：假設兩個轉換率方差相等條件：假設兩個轉換率的方差（可變性）相等。上面公式轉換為：

樣本量要怎麼取合适（AB實驗背後的秘密）11

說明：1、e1和e2是真實的注冊轉換率。2、e 是合并方差估計量。3、α是顯著性水平（通常α = 0.05） 4、β是期望功效（通常β = 0.8） 5、Zβ和Zα/2針對給定參數的臨界值α和β 固定值：α = 0.05時，Zα/2 = 1.96。β = 0.8時，Zβ = 0.84。【注冊流程改版例子】具體計算過程：（1）兩個版本權重相等的情況這裡使用合并估計量作為方差。

樣本量要怎麼取合适（AB實驗背後的秘密）12

如果我們不假設兩個轉換率的方差相等，則公式會略有不同，後邊給出代入公式，得到最終的樣本的公式：

樣本量要怎麼取合适（AB實驗背後的秘密）13

我們來真實計算一下：1、注冊轉換率e1為50%，e2為60% 2、假設最小标準值為0.8的期望功效 3、顯著性水平α為0.05

樣本量要怎麼取合适（AB實驗背後的秘密）14

因此。每組（對照組和實驗組）的最小樣本量為385。（2）兩個版本的注冊轉換率權重不等的情況這種情況下，第一步，假設各組大小相等，計算總樣本量；然後，可以根據兩組實際比率k來調整此總樣本量大小N，而修改後的總樣本大小N '，可以通過下面公式來計算：

樣本量要怎麼取合适（AB實驗背後的秘密）15

以上兩組中，每個樣本的樣本大小分别為N '/（1 k）和kN '/（1 k）。4、方法二：使用假設性檢驗适用範圍：

假設性檢驗本身可以對單個總體參數或者兩個總體參數進行。
假設的内容可以是雙側檢驗。比如參數是否等于某個值，還可以參數是否大于或者小于某個值。

AB實驗背景下，我們通常使用的是雙總體雙側檢驗。具體實施原假設：μ1=μ2 備擇假設：μ1≠μ2構造統計量條件：兩個樣本間相互獨立且樣本量大我們實際進行兩總體均值差是否為0的雙側檢驗

樣本量要怎麼取合适（AB實驗背後的秘密）16

實際計算中，總體方差可以用樣本方差代替，原假設的背景下u1 - u2 = 0，所以計算統計量z，所需要的數據都可以依據樣本得到。還有假設兩組的總體方差相等的情況，實際上，AB實驗中并不常見。上圖是概率密度曲線：

黃色是AA實驗的均值差的分布，藍色是AB實驗（以指标提升為例）的均值差的分布。
兩個紅箭頭分别标識 -1.96*指标标準差 1.96指标标準差
power 即藍色曲線在紅色（右）箭頭右側的面積。
delta是上圖藍色的中軸位置，即 AB實驗（以指标提升為例）的均值差的期望。

得出power的計算公式 power = 1 - norm.cdf( norm.ppf(1 - α / 2) - np.sqrt( sampleperversion * (delta * 2) / 2 * ( metric_variance * 2 ) ) )其中：cdf 累積分布函數，是概率密度函數的積分，能完整描述一個實随機變量X的概率分布。ppf 分位點函數 metric_variance 指标方差 delta 均值的差反推出樣本量

sampleperversion = 2 * (norm.ppf(1 - α / 2) - norm.ppf(β)) * 2 * metric_variance / (delta * 2)

其中：ppf 分位點函數 norm.ppf正态分布的累計分布函數的逆函數，即下分位點。

alpha 默認5%，其中norm.ppf(1 - α / 2) = 1.96，norm.ppf(β)為映射值。

metric_variance 指标方差。

delta 均值的差。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活愛耳日是幾月幾日
1、全國愛耳日節日時間：3月3日。2、為貫徹預防為主的衛生工作方針，每年的“愛耳日”确定一個主題，在... 2023-07-03
生活衣服有油怎麼辦
1、用洗潔精：洗潔精具有溶解油漬的作用，這時我們可以在有油污的區域滴上适量的洗潔精然後輕輕搓洗即可。... 2023-07-03
生活水裡加什麼拖地更幹淨不容易有灰
1、水裡+食鹽+洗潔精+花露水，準備一盆溫水，倒入适量食鹽，目的是讓地闆不易留下水漬，然後加入幾滴洗... 2023-07-03
生活網購的快遞拆開包裝後包裝上的快遞單應...
1、網購的快遞拆開包裝後，包裝上的快遞單應該撕掉或抹掉信息，防止個人信息外洩。2、用牙膏塗抹：把牙膏... 2023-07-03
生活哪三種人不能喝蒲公英泡水
1、體質偏寒，蒲公英本身就是寒性植物，因此寒性體質的人不适宜吃，也就是怕冷不能吃生冷食物的人要注意，... 2023-07-03
生活蛇精臉是什麼意思
1、蛇精臉，其實是和常說的錐子臉相比較起來出現的一種更加誇張的臉型，下巴出奇的尖，簡直能拉來耕地，因... 2023-07-03
生活讓貓自願洗澡小妙招
1、可以從小給貓洗澡，洗澡時可以先把腳浸濕，然後慢慢的浸濕身體，同時要注意水溫、環境安靜，熟悉的主人... 2023-07-03
生活祛痘痘的生活技巧
1、牙膏，白醋等消炎法。像珍珠粉，牙膏，眼藥水，牙膏，白醋，精油等都是對抑制痘痘，消炎美膚起到很好效... 2023-07-03
生活衣服上有很重的機油味怎麼辦
1、将衣服浸入大約60℃的熱水中，片刻後取出，撒上少量堿粉及等量洗衣粉，用手搓洗。而後，用清水漂洗，... 2023-07-03
生活秋分節氣的含義
1、秋分中的分即為半，秋分時全球晝夜等長，秋分之後北半球各地晝漸短夜漸長，南半球各地晝漸長夜漸短。2... 2023-07-03
生活臨時身份證有效期多久
1、臨時居民身份證的有效期限為三個月，有效期限自簽發之日起計算。公民在申請領取、換領、補領居民身份證... 2023-07-03
生活飛機上拉杆箱最大尺寸
1、飛機上拉杆箱最大尺寸不得超過20×40×55厘米，托運行李體積不能超過40×60×100厘米。因... 2023-07-03
生活仙人球有什麼作用什麼特點
1、觀賞：仙人球為常見的室内盆栽仙人球類植物。株形奇特，花大形美，色彩潔白素雅，再加上習性非常強健，生長快，開花容易，易生子球，繁殖容易，因而栽培十分普遍。它是一種大衆化、适合家庭栽培的觀賞植物。2、淨化空氣：仙人球為景天酸代謝途徑，仙人球的氣孔白天關閉，晚上打開，吸收二氧化碳并放出氧氣，可改善室内空氣質量，起到淨化空氣的作用。對二氧化硫、氯化氫、一氧化碳、二氧化碳及氮氧化物有吸收作用。仙人球：仙 2023-07-03
生活女人喝雪菊有什麼好處
1、瘦身美容：身體廢物影響作為雪菊，有利于蜂窩組織減肥和減少。2、營養心肌：包含菊花酒、野菊花内酯、... 2023-07-03
生活怎麼設置來電閃光燈
1、首先先打開手機設置,下滑找到系統應用。2、然後再點開找到電話,然後點擊電話就能看到“點擊來電狀态... 2023-07-03
生活 ppt如何做前後順序
1、打開要設置自定義播放順序的幻燈片文件，準備開始設置，之後點擊菜單欄中的“幻燈片放映”。2、之後在... 2023-07-03
生活經典英文qq昵稱
1、intimacy（親密）2、Aurora（極光）3、Bayoflight（光之灣）4、smysl... 2023-07-03
生活西南風怎樣才能釣到魚
1、選擇西南風晴天出釣，風力最好小于4級。2、選擇北岸向陽處，最好的水深在1.2~1.5米左右，這個... 2023-07-03
生活做好的饅頭怎麼保存
1、将饅頭放涼後，用保鮮膜将饅頭一個個包裹起來，這麼做饅頭就不會裸露在外面了。再将包裹好保鮮膜的饅頭... 2023-07-03
生活夏天蚊子自制滅蚊神器
1、首先準備一個空的塑料瓶。2、然後用剪刀剪下塑料瓶頭部。3、剪完後就成了兩部分了。4、然後将底部倒... 2023-07-03
生活芥菜絲做法
1、新鮮的芥菜頭洗淨。2、切細絲。3、撒上鹽腌制30分鐘至1小時。4、攥出水分。5、攥出來的湯汁留着... 2023-07-03
生活銅币黑斑用什麼方法去除
1、一般用味精水泡，一盆清水，放上适量的味精，然後把銅圓放進去泡。味精水帶弱酸性，腐蝕沒那麼厲害。慢... 2023-07-03
生活深冬一般指什麼時候
1、深冬指的是大寒。大寒為一年中最冷的時候，公曆1月5日和該月的20日左右為小大寒。2、冬季，是四季... 2023-07-03
生活生姜長白毛怎麼處理
1、盡快扔掉。生姜因發黴出現的白毛，不僅外部有黴菌，其内部也都是黴菌，削去外部可見的菌絲部分，也無法... 2023-07-03
生活冰箱怎麼洗最好的方法
1、抽屜貨架清洗首先為确保安全，拔掉冰箱電源插頭或關掉斷路器開關。雖然塑料貨架和抽屜在低溫時也可以用... 2023-07-03
生活十字繡怎麼洗
1、工具：清水一盆、洗潔精。2、把準備好的盆放入清水，以十分之一的比例放洗潔精攪拌均勻，将十字繡放入... 2023-07-03
生活毛車座墊怎麼清洗方法
1、清潔方法。輕微污染，請用清潔毛巾蘸1%濃度的專用清洗劑輕輕擦拭污染處并用同樣的方法用清水清潔，然... 2023-07-03
生活狗狗打架的時候為什麼用嘴不用手
1、狗狗是沒有鎖骨的，這種生理特點是有助于它們奔跑和跳躍，但也導緻前肢不夠靈活。所以，沒鎖骨的狗狗在... 2023-07-03
生活初次添加客戶的第一句話
1、見客戶時，衣着整潔、大方自信、跟客戶打招呼時，聲音要宏亮。2、見到客戶時，要利用從大到小的“問題... 2023-07-03
生活金魚花葉片的養殖方法
1、光照。金魚花喜光，除了夏季的光照太強需要适當遮擋外，平時養護時要多曬太陽，光照充足有利于植株長勢... 2023-07-03

tft每日頭條

> 生活

> 樣本量要怎麼取合适

樣本量要怎麼取合适

相关生活资讯推荐

热门生活资讯推荐

网友关注