首先我們都知道标簽本身會有很多分類,但是從它的實現規則來看,大緻可以分成以下幾類:
(1)基于統計類的标簽
顧名思義,這類标簽是可以從用戶注冊、用戶訪問、消費類數據中統計得出,是最為基礎的标簽類型,例如,性别、城市、App 使用時長、周均啟動次數、月均消費金額等字段構成了用戶畫像的基礎。
(2)基于規則類的标簽
該類标簽基于用戶行為及确定的規則産生,在實際開發标簽過程中,該類标簽的規則由運營人員和數據人員共同協商确定。如,距今 90 天内交易次數 > 3,是“交易活躍”标簽的定義和口徑;連續 12 個月内飛行航段 > 20 ,是“常旅客”标簽的定義和口徑。
(3)基于挖掘類的标簽
該類标簽為概率模型,概率是介于 0~1 之間的數值,需要通過算法挖掘産生。例如,根據一個用戶的行為習慣判斷是男性還是女性,根據一個用戶的消費習慣判斷其對某商品的偏好程度。
需要注意的是數據源的梳理和基礎規則的應用是應用挖掘類标簽的前提。如果企業的數據源沒有做規則,基礎沒打好,挖掘類标簽可以暫時不考慮。因為建立規則仿佛在搭建一個小階梯,如果這個階梯搭好,證明你的數據質量和存在應用提升空間,你再往上提一階是比較合理的方式,因為這裡會涉及到成本的投入和人員的應用能力,這是個循序漸進的過程,包括我們給客戶服務的時候都會給他強調存在階梯式遞進的過程。
另外,圖中的用戶自然屬性、用戶交易數據、用戶資産數據、用戶行為特征、第三方來源數據是基于數據源或具體的業務場景做的标簽分類,事實上,最終呈現的标簽,一般都是以業務視角的,标簽與應用場景,以及統計的屬性源會都有關聯。之所以這樣做,是因為這樣的标簽是以用戶視角定義的,讓用的人知道這個标簽代表了什麼含義,而不是了解通過什麼方式抽取的。
更多幹貨和案例,可以關注“神策數據”公衆号了解~
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!