tft每日頭條

 > 生活

 > 精準營銷模型有哪些

精準營銷模型有哪些

生活 更新时间:2024-11-19 17:20:43

随着移動互聯網的普及以及人工智能技術的不斷發展,精準營銷的理念正逐步滲透到各行各業以及人們生活的方方面面。但是如何通過數據挖掘出“營銷敏感人群”,而不把成本浪費在“本來就會轉化”的那部分人身上,成為智能營銷時代的關鍵挑戰。增益模型(uplift model)是目前解決這一痛點最好的方法之一,本文将試圖通過該模型探讨智能營銷的底層邏輯。

精準營銷模型有哪些(如何用增益模型)1

背景:問題先行

假設我們現在要搞一個優惠券促銷活動,通過曆史數據預測了兩類用戶發券購買率和無券購買率的結果(見下圖),接下來我們想要對用戶發放優惠券,這時會面臨一個必須要解決的問題:給哪類用戶發放優惠券能夠使總收益最大化呢?

精準營銷模型有哪些(如何用增益模型)2

01 什麼是增益模型(uplift model)

想要知道應該給哪一類用戶發放優惠券,我們需要搞清楚哪一類用戶對優惠券刺激最敏感,換言之,也就是需要對用戶進行分類,了解每一類用戶的特點。在營銷活動中,對用戶進行主動幹預稱為treatment,例如發放優惠券是一次treatment。根據是否對用戶進行幹預以及幹預結果,我們可以将用戶分為以下四類:

精準營銷模型有哪些(如何用增益模型)3

  1. Persuadables:基本隻有在發券才會購買的人群,即優惠券敏感人群;
  2. Sure things:無論是否發券,都會購買,自然轉化人群;
  3. Lost causes:無論是否發券都不購買,這類用戶難以刺激,直接放棄;
  4. Sleeping dogs:與Persuadables相反,對營銷活動比較反感,不發券的時候可能會購買,但發券後不會再購買。

對發放優惠券這種有成本的營銷活動,我們不可能對所有用戶都發放補貼,這個成本是任何企業都無法承受的。考慮到每個用戶對價格的接受程度是不一樣的,根據“營銷四象限人群”分布,我們希望模型觸達的是營銷敏感的用戶,即通過發放優惠券促進用戶購買,而對于其他用戶,最好不要發券,這樣才能最大程度的節省成本。

我們再來看背景中的小例子,用戶2發券後購買率(1.6%)明顯高于用戶1(1.2%),似乎我們應該對用戶2發放優惠券,更能刺激其産生購買。但事實真的是這樣嗎?

假設用戶1和用戶2各1000人,不發券産品價格是100元,發放優惠券後價格是80元,我們可以有四種方案:用戶1和2都發放優惠券、用戶1和2都不發放優惠券、1發2不發、2發1不發。我們分别來計算一下這四種方案帶來的總收益:

精準營銷模型有哪些(如何用增益模型)4

  1. 都發券:1000*1.2%*80 1000*1.6%*80=2240元
  2. 都不發券:1000*0.7%*100 1000*1.4%*100=2100元
  3. 1發2不發:1000*1.2%*80 1000*1.4%*100=2360元
  4. 2發1不發:1000*0.7%*100 1000*1.6%*80=1980元

通過計算四種方案的收益,我們發現實際情況和預想的并不一樣,給發券購買率更高的用戶2發放優惠券反而收益是最低的,這是為什麼呢?

我們來進一步分析一下,除了發券購買率之外,我們還能知道這兩類用戶在沒有優惠券情況下的自然購買率,根據這兩個數據能夠計算出發放優惠券所帶來的增量效用。用戶1的發券購買率雖然低,但在沒有優惠券刺激情況下的購買率更低,即優惠券所帶來的增量反而是比用戶2更高,而我們做營銷活動的目的是最大化總體的收益,本質是最大化優惠券的增量,因此我們應該向用戶1發放優惠券。

精準營銷模型有哪些(如何用增益模型)5

通過這個小例子,我們能夠得到一個結論:響應模型(reponse model)能夠預測用戶的購買概率,但是該模型不能告訴我們這批人是否因為發放優惠券而産生購買,這樣我們就無法區分營銷敏感(Persuadables)和自然轉化(Sure things)這兩類人群。也就是說響應模型(reponse model)很有可能會誤導我們做出錯誤的決策。

精準營銷模型有哪些(如何用增益模型)6

而增益模型(uplift model)要做的就是幫助我們找到這些營銷敏感人群,準确判斷營銷幹預所帶來的“增量提升”,從而促使營銷推廣效率的最大化,而不是把營銷預算浪費在“本來就會轉化”的那部分人身上。如果用一句話總結增益模型(uplift model):通過用戶分群的方法對用戶進行精細化運營的一種科學手段。

精準營銷模型有哪些(如何用增益模型)7

為了幫助大家更好的理解增益模型,我們構造這樣一個場景:假設有N個用戶,Yi(1)表示我們對用戶i幹預後的結果,比如給用戶i發放優惠券後(幹預)用戶下單(結果),Yi(0)表示沒有對用戶幹預的情況下用戶的輸出結果,比如沒有給用戶i發放優惠券(幹預),用戶下單(結果)。如下圖所示:

精準營銷模型有哪些(如何用增益模型)8

那麼,用戶i的因果效應(causal effect)的計算如下:

精準營銷模型有哪些(如何用增益模型)9

增益模型的目标就是最大化這個增量,即有幹預策略相對于無幹預策略的提升,簡單講就是幹預前後結果的差值。實際使用時會取所有用戶的因果效應期望的估計值來衡量整個用戶群的效果,稱為條件平均因果效應(Conditional Average Treatment Effect, CATE)。

上式中Xi是用戶i的特征,所謂的conditional指基于用戶特征。

(2)式是理想的增益模型計算形式,實際上,對一個用戶i我們不可能同時觀察到使用策略(treatment)和未使用策略(control)的輸出結果,即不可能同時得到Yi(1)和Yi(0)。因為對某個用戶,我們要麼發優惠券,要麼不發。所以,我們可以将(2)式修改為:

其中Yi(obs)是用戶i可以觀察到的輸出結果,Wi是一個二值變量,如果對用戶i使用了策略,Wi=1,否則Wi=0。

在條件獨立的假設下,條件平均因果效應的期望估計值是:

上式要滿足條件獨立(CIA)的條件,即用戶特征與幹預策略是相互獨立的。

增益模型要優化τ(Xi),值越高越好。然而一個用戶不能同時觀察到使用幹預策略和不使用幹預策略的結果,因此τ(Xi)是難以直接優化的。但如果通過AB實驗,可以獲得使用幹預策略和不使用幹預策略兩組人群,如果兩組人群的特征分布一緻,可以通過模拟兩組人群的τ(Xi)得到個體用戶的τ(Xi)。因此增益模型依賴AB實驗的數據。

需要說明的一點是,增益模型(uplift model)是一組用于相同目的的建模方法的總稱。下面就給小夥伴們介紹三種常用的增益模型建模方法。

02 常用uplift建模方法

2.1 雙模型(Two Model, T-Learner)

模型公式1:

精準營銷模型有哪些(如何用增益模型)10

建模過程:

以優惠券發放為例,目标是用戶是否下單。訓練時取實驗組的用戶訓練,正樣本是下單用戶,負樣本是未下單用戶,預測結果是每個用戶下單的概率。類似地,對照組也可以使用另一個模型預測出每個用戶下單的概率。兩個組的用戶下單概率求平均,即可得到:

兩者相減即得到τ(X)。預測時,對用戶分别使用G(T)和G(C)預測,兩個模型預測的分數相減即得到預測用戶i的τ(Xi),最後根據τ(Xi)的高低決定是否發券。

精準營銷模型有哪些(如何用增益模型)11

模型優點:

  1. 簡單直觀,容易理解
  2. 可以複用常見的機器學習模型(LR、Tree Model、NN)

模型缺點:

  1. 雙模型打分誤差累積
  2. 隻是模拟了τ(Xi),沒有真正優化τ(Xi)

2.2 差分響應模型升級版(One-Model, Approach)

模型公式2:

精準營銷模型有哪些(如何用增益模型)12

建模過程:

差分響應模型的訓練數據和模型都是各自獨立的,可以分别在訓練數據層面上打通以及在模型層面上打通,得到升級版的差分響應模型。

在實驗組和對照組的用戶特征中,加入與T有關的特征,實現數據層面的打通,即實驗組和對照組合并,使用同一個模型訓練。預測時将同一樣本特征進行多次輸入,每次隻是改變不同的T值。這是阿裡大文娛提到的一種方法。

精準營銷模型有哪些(如何用增益模型)13

模型優點:

  1. 模型訓練數據,模型學習更充分
  2. 避免雙模型打分誤差累積
  3. 通過一個模型可以對multiple – treatment進行建模,實用性更強

模型缺點:

  1. 基礎模型仍是響應模型,對uplift建模是間接的,模型效果還有提升空間
  2. 無法滿足用戶特征與條件策略獨立的假設

2.3 Class TransformationMethod

另外一種更嚴謹的可以實現實驗組對照組數據打通和模型打通的方法叫做class transformation method,可以直接優化τ(Xi)。

模型公式

定義一個變量G∈{T, C},G=T表示有幹預,即實驗組(treatment),G=C表示無幹預,即對照組(control)。uplift分數τ可以表示為:

精準營銷模型有哪些(如何用增益模型)14

為了統一表示實驗組和對照組都下單的情況(Y=1),再定義一個變量Z,Z∈{0, 1}:

精準營銷模型有哪些(如何用增益模型)15

下面證明優化(5)式相當于優化P(Z=1∣X)。

假設幹預策略G與用戶特征X相互獨立,即G獨立于X:P(G∣X)=P(G),(5)式可以轉寫為:

精準營銷模型有哪些(如何用增益模型)16

注意到P(G=T)和P(G=C)是可以通過AB實驗控制的,在随機化實驗中,如果實驗組和對照組的人數是相等的,那麼P(G=T)=P(G=C)=1/2,即一個用戶被分在實驗組(有幹預策略)和被分在對照組(無幹預策略)的概率是相等的。

在該假設下,(6)式可以改寫為:

精準營銷模型有哪些(如何用增益模型)17

由(7)式可得:

精準營銷模型有哪些(如何用增益模型)18

(8)式就是要計算的uplift score,此時隻有Z一個變量,可以直接對Z=1建模,相當于優化P(Z=1∣X),而不需要分别對實驗組P(T)和對照組P(C)單獨建模。而P(Z=1∣X)可以通過任何分類模型得到,所以這個方法稱為Class Transformation Method。

實際上,Z=1就是實驗組中下單的用戶和對照組中未下單的用戶,因此可以直接将實驗組和對照組用戶合并,使用一個模型建模,實現了數據層面和模型層面的打通。預測時,模型預測的結果就是uplift score,這點與差分響應模型不同。

精準營銷模型有哪些(如何用增益模型)19

該方法需滿足以下兩個假設:

  1. G與X相互獨立
  2. P(G=T)=P(G=C)=1/2,實踐中并不一定能嚴格滿足
03 如何評估uplift模型

根據uplift模型的定義,uplift score得分越高,代表該用戶增益就越大。但因為增益模型中不可能同時觀察到同一用戶在不同幹預策略下的響應,因此無法直接計算上述評價指标。增益模型通常都是通過劃分十分位數(decile)來對齊實驗組和對照組數據從而進行間接評估,而不是在一個測試集上直接評估。

接下來主要給家介紹三種主要的評估方法。

3.1 uplift 柱狀圖

測試集上,實驗組和對照組的用戶分别按照uplift由高到低排序,劃分為十等份,即十分位(decile),分别是Top 10%、Top 20% …… Top 100%用戶。分别對實驗組和對照組中每個十分位内的用戶求E[Y(T)∣X(T)] 和E[Y(C)∣X(C)],即預測分數的均值,然後相減,作為這個十分位bin内的uplift,繪制柱狀圖,如下圖:

精準營銷模型有哪些(如何用增益模型)20

這種方法隻能定性分析,無法計算出一個具體的值來整體評價模型的好壞。

3.2 Qini曲線(Qini curve)

可以在uplift bars的基礎上繪制曲線,類似AUC來評價模型的表現,這條曲線稱為Qini curve,計算每個百分比的Qini系數,最後将這些Qini系數連接起來,得到一條曲線。Qini系數計算如下:

精準營銷模型有哪些(如何用增益模型)21

ϕ是按照uplift score由高到低排序的用戶數量占實驗組或對照組用戶數量的比例,如ϕ=0.1,表示實驗組或對照組中前10%的用戶。

精準營銷模型有哪些(如何用增益模型)22

如上圖,藍色是随機曲線,橙色是Qini曲線,Qini曲線與随機曲線之間的面積作為評價模型的指标,面積越大,表示模型結果遠超過随機選擇的結果,與AUC類似,這個指标稱為AUUC(Area Under Uplift Curve)。可以看到,當橫軸等于0.6時,對應的縱軸大概是0.0052(uplift score),表示當uplift score等于0.0052時,可以覆蓋前60%的用戶數量,這部分用戶就是營銷活動的目标用戶(persuadables)。

Qini系數分母是實驗組和對照組的全體用戶數,如果兩組用戶數量差别比較大,就會導緻結果指标失真。另一種累積增益曲線可以避免這個問題。

3.3累積增益曲線(Cumulative Gain curve)

累積增益曲線計算如下:

精準營銷模型有哪些(如何用增益模型)23

該公式中各符号含義與Qini系數符号含義相同。與Qini系數相比,累積增益的分母是百分比ϕ下的實驗組或對照組人數,并乘以nt(ϕ) nc(ϕ)作為全局調整系數,避免實驗組和對照組用戶數量不平衡導緻的指标失真問題。

04 uplift精準營銷流程

最後,我們通過下面這張圖直觀的總結一下,在實際工作中是如何通過uplift模型進行精準營銷的:

精準營銷模型有哪些(如何用增益模型)24

本文由 @知了數據分析 原創發布于人人都是産品經理。未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是産品經理平台僅提供信息存儲空間服務。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved