怎樣選擇量化産品-tft每日頭條

怎樣選擇量化産品

職場更新时间:2025-07-31 03:43:45

怎樣選擇量化産品（策略産品經理必讀系列-第十二講AA）1

一、綜述AA 和 AB Test實驗

實驗機制其實一共是有兩種的，AB Test和AA Test。

AB Test：

A為實驗組，B為對照組。A對比B得出本次實驗的效果結論。很多文章說AB Test隻能是單一實驗變量，其實AB Test也可以有多變量。

比如在推薦系統裡分别優化了一版召回模型排序模型。希望同時觀察這兩個模型疊加後的效果，那麼實驗組就會存在兩個變量，對照組就為原先的召回排序模型。當然這種情況比較少見，如果兩個變量CD之間會相互産生影響，一般是第一個變量C先做AB Test實驗，确定效果正向後，将實驗全量後再對第二個變量D進行AB Test實驗。兩個變量疊加在一起很難去分别評估每個變量對實驗效果造成的影響。

AA Test：

除了AB實驗，其實還有AA實驗。

AA實驗就是實驗組和對照組的實驗配置完全一樣，主要為了測試本次實驗效果的波動性。在保證AA實驗随機分流的情況下，理論上AA實驗效果之間的差異應該是很小的，但如果實驗效果差異很大，說明本次實驗變量本身的效果波動就較大，原先AB 實驗的效果也不夠置信。

不過現實中我們很少做AA實驗，當我們發現AB實驗效果比較波動時一般的做法就是多觀察一段時間，等待實驗效果穩定。如果長時間試驗效果還是很波動，就需要确定實驗分流是否存在問題，正常一個變量隻要不是随機産生結果，實驗效果一定是穩定的，不管是穩定正向還是負向。

同時AB Test實驗确定A實驗效果正向後，我們會将A實驗策略在線上推全，但仍然會在線上再保留一個對照組繼續觀察一段時間，比如推全的流量是95%，剩餘5%再繼續作為對照組持續觀察一段時間，這種一般叫做“Hold Back”。因為AB Test實驗階段一般都是小流量實驗，A組5%流量，B組5%流量。我們需要再觀察一下在大流量的情況下A組的實驗效果是否仍然和小流量實驗時一緻。

二、AB Test實驗完整機制

下面我們詳細地介紹AB Test實驗的每一個步驟。

怎樣選擇量化産品（策略産品經理必讀系列-第十二講AA）2

2.1 第一步确定實驗目的

做實驗一定有目的，我們本次做實驗的目的是什麼？是希望驗證新模型的對于用戶點擊效果還是驗證新交互樣式的對于用戶停留時長的效果？目的明确了才能決定後續的實驗變量、觀察指标、分流維度和實驗類型以及如何綜合評估實驗的效果。

2.2 第二步确定實驗變量

實驗目的明确後也就确定了實驗的變量，本次實驗是希望隻觀察推薦系統裡新召回模型的效果，那麼實驗組A就是新召回模型，實驗組B就是老召回模型。元氣森林推出了6款不同口味的新飲料，針對不同口味又有三款不同的容量，以及兩款不同的包裝樣式，元氣森林希望測試哪一款最受用戶歡迎。

怎樣選擇量化産品（策略産品經理必讀系列-第十二講AA）3

那麼在這個實驗中就會存在三個變量“口味”、“容量”和“包裝樣式”，最終就需要 6 * 3 * 2=36 組實驗，不需要專門的對照組，每組既是實驗組也是其他組的對照組。

2.3 第三步确定實驗觀察指标

實驗目的和變量确定以後下一步就是明确通過哪些指标來衡量實驗的效果。比如Part2.2裡面測試推薦系統新召回模型的效果，該試驗觀察的指标主要是點擊率CTR，但同時還需要去關注用戶浏覽深度和CVR的變化。所以在實驗中我們會有一個核心的觀察指标，但也會有很多其他輔助觀察指标。

當這些指标之間效果出現反向時，比如新召回模型上線後實驗組對比對照組CTR 3%，但浏覽深度-0.3%，CVR-1.5%。這時就需要綜合評估該模型的效果，一般需要算法拉上業務方綜合評估，該推薦場域主要的KPI是CTR還是CVR，或者二者的占比是。最終決定該模型要不要推全量。同時實驗觀察指标确定以後也需要确保線上有對應的埋點，不然無法統計實驗效果。

2.4 第四步确定分流維度

實驗組和對照組的流量基于什麼來進行随機分流，是基于用戶維度還是請求維度。

怎樣選擇量化産品（策略産品經理必讀系列-第十二講AA）4

用戶維度：

在用戶層面将實驗組流量和對照組流量區分開，位于實驗組的用戶接下來的一段時間都是在實驗策略裡；不管新策略的用戶體驗是好還是差；

請求維度：

在請求層面将實驗組流量和對照組流量區分開，單個用戶打開該模塊時不同時間不同請求時，可能是新策略也可能是舊策略，一個用戶既可以體驗到新策略又能體驗到舊策略；

兩種分流維度決定适用的實驗場景不一樣：基于用戶維度的适用于所有涉及到用戶接觸到樣式、交互、視覺效果等變化的實驗。一方面不希望影響到太多用戶，另一方面樣式等變化用戶需要适應一段時間後才能反饋出真正的效果；基于請求維度的适用于所有的模型策略實驗，接近于底層的策略均可按照請求維度進行分流。

比如推薦系統、搜索引擎等的策略優化；适用于“請求維度”的實驗也可以用“用戶維度”進行分流，但是反過來不适用。

這裡面還有幾個點需要注意：

基于用戶維度分流實驗中的異常ID：

當我們将X%的用戶固定分到實驗流量中，如果裡面有某些用戶ID行為異常活躍，這些異常ID對于實驗策略的反饋可能會影響到整體實驗效果的評估。

比如某些用戶ID一天登陸APP上百次，點擊推薦模塊上千次，那麼這些數據就将會影響到整體效果。當然這種用戶ID一般是外部爬蟲ID或者作弊ID，需要反作弊部門識别出來剔除掉。還有另外一種處理方式就是将效果進行平均化，計算公式如下圖：

怎樣選擇量化産品（策略産品經理必讀系列-第十二講AA）5

即使經過平均化我們仍然可以發現對于實驗效果還是産生了一定影響，當然實驗用戶量龐大的情況下會對異常值更加稀釋。不過這種異常ID最好的方式就是從實驗結果中剔除掉。

實驗組和對照組的流量比例：

本身實驗組和對照組的流量不存在固定比例，或者什麼比例是合适的。但是需要保證實驗組和對照組的流量都是充分的，實驗結果都是置信的。實驗組10%流量，對照組1%流量都可以，隻要1%流量實驗階段可以積累足夠的數據即可。

Hash分桶：

上面一直介紹基于用戶和請求維度來分流，那麼一個用戶或者請求到底是歸到實驗組裡還是對照組裡了。一般我們都是基于Hash算法，為每個用戶（user-id）或每次請求（request-id）生成一個hash值，然後将位于指定範圍的hash值分向一個桶。實驗開始前确定哪些桶屬于實驗組，哪些屬于對照組。

2.5 第五步确定實驗類型

第五步也是最關鍵的一步也就是确定實驗類型了，實驗類型從大的方向來說分為兩種：物理實驗和分層實驗。兩種實驗對應的是兩種分流方式：互斥和正交。我們用下圖來表示差異：

怎樣選擇量化産品（策略産品經理必讀系列-第十二講AA）6

物理實驗：

最開始做實驗的方式都是物理實驗的方式，當一部分被分到了實驗A中以後，該部分流量就無法在被其他實驗使用，如上圖“域一”，實驗之間的流量是互斥的，三組實驗加起來的流量總和是15%。這種分流方式導緻同時線上實驗數很有限，如果每組實驗5%流量，同時隻能做20組實驗。但是像淘寶字節這種大公司，同時線上幾百上千個實驗很正常，這種做實驗的方式肯定不滿足需求。

分層實驗：

谷歌提出了一種新的實驗分流方式（原文《Overlapping Experiment Infrastructure:More, Better, Faster Experimentation》）：正交。每個獨立實驗為一層，層與層之間流量是正交的，一份流量穿越每層實驗時，都會再次随機打散，如上圖“域二”，上一層實驗對下一層不會産生任何影響，因為流量被均勻随機打散了，每一層實驗的流量都是85%。分層實驗的個數理論上是無限的。

聯合層實驗：

分層實驗理論上層與層之間需要将流量随機打散，但有些情況下我們希望将層與層之間的策略聯動，比如上圖D-1和E-1的策略聯動，D-2和E-2的策略聯動，D-3和E-3的策略聯動，這個時候就需要将D-1實驗标簽和E-1實驗标簽關聯起來，确保經過D-1的流量全部打到E-1的實驗桶裡面。

适用場景：

物理實驗适用于任何場景，但此種實驗方式實驗數量上限有限，公司一般會切出部分域專門做物理實驗，剩餘流量做分層實驗。有些場景隻能做物理實驗，不能和其他實驗摻雜在一起，尤其是涉及到系統性能評估等的實驗，需要排除一切外在影響确保實驗不受任何幹擾。分層實驗可以同時做大量線上實驗，适合那些業務之間彼此獨立沒有影響的場景，如果層與層之間的實驗是有影響的，此種情況建議在同一層進行實驗。

2.6 第六步上線實驗&查看實驗效果

實驗上線：

當我們将實驗所有準備工作都确定完以後，就是在實驗平台上線實驗了。實驗平台會下發實驗組和對照組的實驗标簽，後續根據該實驗标簽查看對應實驗的效果；

實驗觀察時長：

正常情況下都需要觀察3個工作日左右，尤其對于那種實驗效果前期比較波動的需要觀察更長的時間。但如果實驗效果長期波動不穩定就需要确定實驗的分流方式是否存在問題。

以上就是對AA & AB Test的全面介紹，歡迎大家溝通交流～

本文由 @King James 原創發布于人人都是産品經理。未經許可，禁止轉載。

題圖來自 Unsplash，基于 CC0 協議

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

職場事業單位服務期辭職怎麼操作
近日，蕭山一姑娘在蕭内網App發帖說：她是公立醫院一名事業編制人員，現在想辭職，但是領導不批，要等6個月後再次提交辭職信才能離職。現在的問題是，好不容易争取到offer的新單位在等她入職，但這邊又沒辦法一走了之……姑娘還說，新單位需要解除合... 2023-01-04
職場職場生存八大基本常識
職場生存八大基本常識?1、說話永遠隻說5分，剩下的五分既是神秘感，也是保護自己的最好手段，我來為大家科普一下關于職場生存八大基本常識?下面希望有你要的答案，我們一起來看看吧!職場生存八大基本常識1、說話永遠隻說5分，剩下的五分既是神秘感，也... 2022-11-04
職場小遊戲種類
一款“用腳交朋友”的雙人遊戲。《隻隻大冒險》隻用前三關就勾起了我同事購買的欲望。這款遊戲來自國内團隊NExTStudios，由bilibili與NExTStudios聯合發行。他們上一次合作的成果是《Unheard-疑案追聲》。那是一款非常... 2022-12-15
職場 58同城找工作被騙300元
10月5日，榆陽區小美(化名)報警稱：她在58同城網站提交簡曆後，随即接到一陌生電話，對方表示她的簡曆相當符合他們的要求，讓小美添加微信号詳談。小美添加對方微信号後，對方向她簡單介紹了工作内容，就給她發布了第一個工作：點擊對方發送的鍊接,下... 2022-11-18
職場璀璨方便面的做法
璀璨方便面的做法?洗幹淨鍋燒水至水沸騰放入方便面的調料，我來為大家科普一下關于璀璨方便面的做法?下面希望有你要的答案，我們一起來看看吧!璀璨方便面的做法洗幹淨鍋燒水至水沸騰。放入方便面的調料。方便面煮至七分熟時撈出裝碗。剩下的湯續煮,火腿,... 2022-06-08
職場 oppo回應員工失誤
近日，在職場社交軟件脈脈中有OPPO員工爆料稱，OPPO違法解除勞動合同，并強制取消門禁将員工趕出公司。該名員工稱，他因多次晚上10點多下班，沒有進行加班從而被迫離職，并且不給年終獎。目前，該員工已起訴OPPO公司。還有一名成都分公司的員工... 2022-11-24
職場面試怎麼自我介紹比較好
面試怎麼自我介紹比較好?面試怎麼高情商的自我介紹，在找工作的時候，人們經常都是要通過面試的自我介紹，這是企業選拔人才的最常見的一種方式高情商的自我介紹方式更能吸引人，下面介紹面試怎麼高情商的自我介紹面試怎麼高情商的自我介紹，我來為大家講解一... 2022-11-15
職場發展下線525人多達14層
文昌法院開庭審理首例組織、領導傳銷活動罪案件現場3月30日，文昌市人民法院刑事審判庭法官彭曉志當庭敲響法槌，被告人謝某健涉嫌犯組織、領導傳銷活動罪案件正式開庭審理。該案是《修正案（七）》新增設的一項罪名，是文昌法院受理的首例該類犯罪案件。公... 2022-12-09
職場品質管理的六大标準
來源|制造業之窗全文總計5099字，需閱讀13分鐘，以下為正文：一、堅持三不原則1、不接受不合格品不接受不合格品是指員工在生産加工之前，先對前傳遞的産品按規定檢查其是否合格，一旦發現問題則有權拒絕接受，并及時反饋到前工序。前道工序人員需要馬... 2023-01-03
職場汽車發動機工作原理及實物介紹
衆所周知，發動機是汽車的心髒，還是有很多人不太懂這個心髒的運行方式原理。接下來我簡單分析一下該原理過程。發動機運轉方式從我們坐上汽車，一鍵啟動或者鑰匙啟動開始，其實是鑰匙門的導通，閉合了蓄電池電路，蓄電池通電後給電給到起動機的繼電器，起動機... 2022-11-30
職場公司員工滿意度調查問卷怎麼寫
對于HR來說，往往對滿意度調查問卷模闆感到頭疼，今天就分享給大家一份“企業員工滿意度調查問卷模闆”，适用于設計企業滿意度調查統計問卷，大家可以結合自己企業的實際情況參考生成自己的問卷。企業員工滿意度調查問卷模闆您好，本問卷用以幫助公司了解到... 2022-12-27
職場日本的職場生活科普
近年來有很多外國人赴日工作、留學和生活，相信大家會發現，日本人無論是在職場還是生活中，性格都相對比較内斂，有時因為文化和思維方式的差異，一不小心就有可能碰觸到别人的“禁忌”。那麼作為在日外國人，在職場以及日常生活中該如何與日本人相處呢？今天... 2023-01-16
職場管理學中怎麼理解領導理論
管理學中怎麼理解領導理論?所有管理學著作中都離不開對管理學基本理論的理解，其中包含：計劃，組織，領導，激勵……，現在小編就來說說關于管理學中怎麼理解領導理論?下面内容希望能幫助到你，我們來一起看看吧!管理學中怎麼理解領導理論所有管理學著作中... 2022-11-18
職場候鳥保護區日常巡護
候鳥保護區日常巡護?來源：科技日報科技日報訊（記者葉青實習生孫耀雄）“近幾年，我國通過禁捕立法、宣傳等，大力推進對海龍科魚類的保護工作，生物資源群體恢複效果初見成效目前在我國的深圳灣、北部灣、海南島等附近海域，常能見到海龍科魚類的身影”5月... 2023-02-03
職場校長解讀基礎教育工作要點
6月12日，市長李建輝帶領市直有關部門負責人實地調研職業教育工作并召開座談會。副市長陳惠黔一同參加。資料圖：2017年6月16日，莆田市市長李建輝參觀北京市海澱區尚麗外國語學校李建輝一行先後來到莆田科技職業技術學校汽車實訓基地、莆田職業技術... 2022-12-09
職場幾點能查教資面試成績
幾點能查教資面試成績?2022年上半年中小學教師資格考試（面試）結果、考試合格證明于6月15日開放，開通時間為上午10時，教資面試成績查詢方式：①中國教育考試網；②中國教育考試網小程序，，今天小編就來說說關于幾點能查教資面試成績?下面更多詳... 2022-10-15
職場王者榮耀國服雅典娜獻祭流教學
王者榮耀：獻祭流雅典娜上職業比賽，優勢巨大，解說：打排位别用王者榮耀中有不少的套路，比如程咬金斷三路兵線，太乙真人刷錢流、雅典娜獻祭流等等，每個套路都讓人非常惡心，但是要說起這些套路最讓人煩的，那肯定就是雅典娜的獻祭流。在排位中說好聽點叫... 2023-03-20
職場情緒對工作而言是一種奢侈的負累
情緒對工作而言是一種奢侈的負累?有很多小夥伴問嘚吧嘚，為什麼我努力幹活，升職加薪的速度就是比不上小我三四歲的新人？明明我在正常溝通，領導卻突然跟我翻臉，甚至讓我穿小鞋？，我來為大家科普一下關于情緒對工作而言是一種奢侈的負累?下面希望有你要的... 2022-10-09
職場買的人壽保險想退保怎麼辦理
買的人壽保險想退保怎麼辦理?2022年2月11日，農安居民徐女士向華商報-二三裡資訊（爆料熱線：15004304018）反映，她在中國人壽保險股份有限公司農安支公司（以下簡稱中國人壽農安公司）任職業務員期間給自己和孩子一人購買了一份重疾險，... 2022-10-15
職場陶行知教育思想培訓會聽後感
陶行知先生将一生奉獻于教育事業，他以身作則，倡導并踐行了愛的教育。陶行知先生提到教師影響着學生的命運，而學生作為祖國未來的希望，影響着國家和民族的發展。由此可見，教師特别是班主任在教育事業中的地位與作用。班主任身兼多份職責，是教師、班級管理... 2023-01-03
職場為三年後的自己寫一份職業規劃
無論是男性還是女性，無論在體制内還是體制外，無論在北上廣深還是在家鄉小鎮，我們每個人都要面對職場、走進職場，可以說，我們的職業生涯影響了我們的一生，貫穿着我們的生命。在職場裡，我們都彷徨無助過、迷茫痛苦過；在職場裡，我們都精神昂揚過、躊躇滿... 2023-01-13
職場新居之約陳曦知道楊光真相
跳槽進籯家的陳曦，在進來之初就和公司的葉總提出“絕不容忍家裝行業的黑幕！”，本以為有了葉總的保障之後，不會再碰到剔除設計之外的一些亂七八糟的事情了，但事情的發展卻仍舊沒有脫離利益趨勢下的人性行為。聽聞劉大爺的口述之後，陳曦還有些不大敢相信，... 2023-03-01
職場如何快速處理工作數據
編輯導語：組件，是許多B端設計師在日常的工作議題，組件仍有很多使用不當的情況。那麼該如何讓相關方都能夠正确地使用組件、理解規範呢？本文本着更好記和更好用的原則，講述組件的使用規範，希望對你有所幫助。組件是很多B端設計師在日常工作中繞不開的話... 2022-11-05
職場廣州最低基本工資什麼時候調整
11月26日，廣東省人民政府官方網站發布發布《廣東省人民政府關于調整我省最低工資标準的通知》（以下簡稱為《通知》），明确從12月1日起，對全省全日制就業勞動者月最低工資标準和非全日制就業勞動者小時最低工資标準進行調整。此次調整仍保持四類标準... 2022-12-27
職場事業單位面試怎麼備考
84.7，面試第一，上岸！以我的經驗來說，面試拿高分需要做到這兩點：應對考官的提問，回答要落地靠譜；答題要帶有風格，不泯然衆人。而這兩點要做到，那備考前期對面試情況需了解、日常積累需注重、答題思路需掌握、大量練習需跟上，能做到這幾點考試基本... 2023-03-07
職場仙劍夢幻版試煉窟攻略
《仙劍幻境》ARPG手遊主打萬人國戰。想要在國戰中力克敵國，搶殺敵方首領，除了作戰策略合理外，玩家的個人微操能力也是不容忽視的因素之一。想要将角色發揮到極緻，首先要知己知彼，不僅要熟悉自己職業的特性，還要對其他3個職業有深入了解，這樣才能在... 2022-10-21
職場急辭工扣20%是扣底薪還是當月工資
來源：勞動法寶網我想要離職，很急着走，公司卻以年底不能離職為由，不允許急辭工，離職也沒有工資，那樣我要怎麼辦？單憑你說急辭工還不能判斷是否會被扣工資，你得分情況來，首先得看你處于什麼時期，試用期還是正式員工？其次，公司方是否有違法的行為，如... 2023-03-20
職場加班到深夜發朋友圈的文案
1.加量不加價。2.隻要幹不死，就往死裡幹。3.現在加的班，是還以前逃課時欠的債。4.隻要錢到位，玻璃都幹碎。5.生活生活，生下來就要幹活。6.月亮不上班我上班，太陽️上班我不下班。7.每天都在給公司做慈善8.就想問問頭發還能不能保住9.确... 2022-11-02
職場工作放假說說心情短語
工作放假說說心情短語?等了好久終于等到今天，我放假啦，今天小編就來聊一聊關于工作放假說說心情短語?接下來我們就一起去研究一下吧!工作放假說說心情短語等了好久終于等到今天，我放假啦。在哪裡，老子放假了。作業小三，請你自重，我是個有暑假的人。耶... 2022-08-22
職場什麼樣的人适合當健身教練
半島全媒體記者葛夢傑每天上午8點到晚上10點，這是私人健身教練任海恩上班的時間，對于已經是兩個孩子父親的他來說，即便與孩子們同住一個屋檐下，一個月真正能和他們見面的次數卻屈指可數。“因為公司離家比較遠，早晨我出門的時候孩子們還沒起，晚上回去... 2023-01-19

tft每日頭條

> 職場

> 怎樣選擇量化産品