tft每日頭條

 > 科技

 > 标簽識别分類标準有哪些

标簽識别分類标準有哪些

科技 更新时间:2025-02-08 16:30:04

标簽評分是标簽治理的一個重要措施,通過打分可從各個維度評估标簽,掌握标簽真實使用情況,進行标簽持續優化,助力業務運營。那麼,要如何進行标簽評分呢?一起來看一下吧。

标簽識别分類标準有哪些(大量标簽如何進行系統治理)1

本篇是「标簽畫像系列」的第四篇,此前我們已經介紹過了标簽畫像體系建設方法論、标簽體系設計與加工、标簽加工與落庫,這次我們來介紹一下「标簽評分」

标簽評分是标簽治理的一個重要措施,通過給标簽打分,可清晰直觀地從各個維度評估标簽,掌握标簽真實使用情況,進行标簽持續優化,助力業務運營。同時,也能幫助數據團隊判斷哪些标簽更應該投入計算與存儲資源,合理規劃集群資源。

一、為何要進行标簽評分

經過前期标簽體系設計、标簽加工,标簽終于可以上線,讓業務人員使用,發揮價值了!

随着标簽上線一段時間後,我們開始關心每天占用計算資源與存儲空間,跑出來的上百個标簽,業務同學真的用到了多少,業務收益是否能覆蓋數據成本呢?标簽上線後,其質量怎麼樣,是否存在老規則不适用、需要持續優化的情況?

帶着這一問題,我們需要用一種方法來評估标簽上線後的使用情況,标識各個标簽的價值。參考電影評分、花呗評分等形式,我們決定也給标簽打個分、排個序,簡單明了。

二、标簽評分模型

标簽評分模型,經過考慮我們選取了5個維度作為評分入參:

标簽識别分類标準有哪些(大量标簽如何進行系統治理)2

标簽總評分= a* 标簽使用度評分 b * 标簽關注度評分 c * 标簽質量評分 d * 标簽持續優化讀評分 e * 标簽安全度評分

其中标簽使用度、标簽關注度、标簽質量、标簽持續優化度作為核心維度,标簽安全度可根據實際情況考慮是否納入。a、b、c、d、e是權重,總和為100%。

1. 标簽使用度評分

标簽使用度,用以評估标簽被分析、外部系統的使用情況。

在袋鼠雲标簽産品中,标簽有這幾種使用場景:

  • 标簽引用:如原子标簽被衍生标簽應用、衍生标簽被組合标簽引用等,基于該場景,計算“标簽引用次數”指标。
  • 标簽分析:标簽在标簽圈群、群組畫像、群組對比、顯著性分析等畫像分析功能中被分析的情況,計算“标簽分析次數”指标。
  • 标簽調用:标簽通過數據API被外部應用查詢的次數,計算“标簽調用次數”指标。

基于以上3個指标,我們首先采用Sigmoid函數将指标轉化為評分,再将各個指标的評分加權彙總成标簽使用度評分。

标簽識别分類标準有哪些(大量标簽如何進行系統治理)3

2. 标簽關注度評分

标簽關注度,用以評估被搜索、查看、收藏的情況。

袋鼠雲标簽産品中,标簽關注度與以下場景有關:

  • 标簽搜索:标簽在标簽市場被用戶搜索的情況,計算“标簽搜素次數”指标。
  • 标簽查看:标簽被點擊查看基礎信息、分析頁面等的次數,計算“标簽查看次數”指标。
  • 标簽收藏:收藏該标簽的用戶數,計算“收藏用戶數”指标。

以上3個指标可反映标簽的關注熱度,我們依然采用Sigmoid函數将指标轉化為評分,再将各個指标的評分加權彙總成标簽關注度評分。

标簽識别分類标準有哪些(大量标簽如何進行系統治理)4

3. 标簽質量評分

标簽質量,用以評估用戶被打标情況,反映标簽規則的合理性。

當我們定義了标簽和标簽值,經過計算之後,标簽值打在用戶身上的很少,那說明我們的規則執行不合理。比如我們定義了“活躍度”這個标簽,分為“高活躍、中活躍、低活躍度”等,但真實被打上的這個标簽的用戶,低于70%,還有很大一部分比例是空值,未打上該标簽,說明我們制定的标簽值規則有漏洞,需要完善。

系統将計算每個标簽的“标簽覆蓋度”,将覆蓋度歸一化為分數,轉化成評分。

标簽識别分類标準有哪些(大量标簽如何進行系統治理)5

4. 持續優化度評分

持續優化度,用以評估标簽上線後,是否後續再去優化該标簽。

在客戶的生命周期中,不斷有新用戶流入、沉默用戶流失。公司戰略調整、産品發布等都會影響客戶行為,這些變化我們需要以數據的方式呈現,所以我們需要不斷根據業務調整、客戶變化調整我們的标簽策略,以追求可通過标簽直接地、迅速地反映客戶情況,指導業務運營。

持續優化度,我們通過“标簽優化次數”指标來評估,指标簽上線後标簽被編輯再次發布的的次數。我們同樣采用Sigmoid函數将指标轉化為評分。

标簽識别分類标準有哪些(大量标簽如何進行系統治理)6

5. 安全度評分

标簽安全度,不能反映标簽的熱度,但也将其作為了标簽評分的一個維度,可根據企業情況考慮是否納入。

在袋鼠雲标簽産品中,标簽安全相關的策略有:

  • 标簽的可見度:标簽可編輯、可查看的用戶範圍
  • 标簽使用是否需要申請授權:标簽發布後,其他人使用該标簽,是否需要申請審批
  • 标簽是否進行行級權限控制:上面我們控制了标簽的列權限,行級權限反映該标簽是否設置了行級權限
  • 标簽是否脫敏:标簽是否進行脫敏

根據标簽的安全度策略配置情況,我們也采用評分的方式來評估。

基于以上5個維度的評分,我們根據前面提的公式加權彙總,得到總評分。

标簽識别分類标準有哪些(大量标簽如何進行系統治理)7

三、标簽評分的應用

基于标簽評分,為了更加直觀的讓标簽管理員、業務人員查看熱門标簽、沉默标簽等,通過排行榜的方式呈現:

1)熱門标簽排行榜

基于标簽的使用度、關注度、持續優化度3個角度來計算标簽的熱門評分,展示TOP N的熱門标簽。

标簽識别分類标準有哪些(大量标簽如何進行系統治理)8

熱門标簽說明這些标簽被經常使用,我們需要持續關注這些标簽的正常運行、質量,保障業務使用。

2)沉默标簽排行榜

熱門的标簽的反向排序便是沉默标簽,沉默标簽說明這些标簽使用率很低,可考慮定期下線,節省集群資源。

标簽識别分類标準有哪些(大量标簽如何進行系統治理)9

3)綜合排行榜

綜合排行榜便根據标簽的綜合評分進行排序,從标簽使用度、關注度、持續優化度、質量、安全等幾個維度評估,全面評估标簽。

标簽識别分類标準有哪些(大量标簽如何進行系統治理)10

4. 标簽使用度、關注度、持續有優化度、質量、安全分榜單排行

用戶可根據自己更加關注的維度,查看标簽使用度、關注度、持續優化度、質量、安全各個子維度的排行榜。同時,可查看各個标簽的具體指标,如使用度維度,可查看各個标簽的當前引用次數、分析次數、調用次數,針對具體指标具體分析,滿足不同的标簽分析場景。

标簽識别分類标準有哪些(大量标簽如何進行系統治理)11

标簽評分模型上線後,我們需要根據實際情況調整不同維度的權重,符合自身實際情況。當經過一段時間的應用,大家認可這套評估邏輯之後,便可以将靜态化的評分展示轉化為動态化的告警、自動化治理等,可設置标簽質量告警、評分告警,自動通知标簽管理員、責任人等。

以上便是在産品中應用的評分邏輯,希望對大家有所幫助,也可提出不同思路優化評分模型,達到更好的标簽治理效果。

本文由 @木研 原創發布于人人都是産品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議。

該文觀點僅代表作者本人,人人都是産品經理平台僅提供信息存儲空間服務。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved