本文重點介紹了如何根據業務過程來定義原子指标,根據原子指标和修飾詞的結合來定義相關派生指标,同時做好指标的規範命名。
指标作為業務和數據的結合,是數據統計的基礎,也是量化業務效果的依據。如何避免指标統計使用過程中出現的指标名稱混亂,指标不唯一?同時做好數據有序地和有結構地分類組織和存儲,避免底層數據的重複建設,數據統計來源的不唯一?
本文重點介紹了如何根據業務過程來定義原子指标,根據原子指标和修飾詞的結合來定義相關派生指标,同時做好指标的規範命名。
1. 背景介紹
指标是指将業務單元細分後量化的度量值,它使得業務目标可描述、可度量、可拆解。而指标體系的搭建是最為重要的,将直接影響「産生→處理→存儲→計算→應用」的全流程。而在實際的使用過程中出現了以下問題:
- 對于同一業務場景,各部門會用不同的指标來衡量;
- 對于同一指标的計算,不同的時間點去統計,統計來源和方式會有差異。
具體來說,要做到以下幾點:
- 規範維度和量度命名,确保唯一性,命名規則要盡量做到明确、通用、易懂;
- 對确認維度或量度,統一計算口徑,避免歧義;
- 涵蓋盡可能多的核心維度和量度,以此為基礎推動數據建設,确保指标字典裡覆蓋的維度都可區分,指标都可統計;
- 基于指标字典,将核心維度和量度注入元數據中心,接入指标提取工具,後續實現不需要寫sql即可完成自助查詢及分析需求,搭建數據自助分析的基礎。
因此要提供标準化的、共享的、數據服務能力,降低數據互通成本,釋放計算、存儲、人力等資源,以消除業務和技術之痛。
數據體系架構如下:
- 業務闆塊:如果業務産品比較多,且彼此之間的指标或者重疊性比較少的,可單獨分開。
- 規範定義:設計出一套數據規範的命名體系。
- 模型設計:以維度建模理論為基礎,基于維度建模總線架構,構建一緻性的維度和事實。
數據體系架構
2. 指标的規範定義
指标的規範定義,以維度建模作為理論基礎,構建總線矩陣,劃分和定義數據域、業務過程、維度、度量/原子指标、修飾類型、修飾詞、時間周期、派生指标等。
指标的規範定義
(1)數據域
指面向業務分析,将業務過程或者維度進行抽象的集合。其中,業務過程可以概括為一個個不拆分的行為事件,在業務過程之下,可以定義指标;維度,是度量的環境,如買家下單事件,買家是維度。為了保障整個體系的生命力,數據域是需要抽象提煉,并且長期維護更新的,但不輕易變動。
(2)業務過程
指企業的業務活動事件,如,下單、支付、退款都是業務過程。其中,業務過程不可拆分。
(3)時間周期
用來明确統計的時間範圍或者時間點,如最近30天、自然周、截止當日等。
(4)修飾類型
是對修飾詞的一種抽象劃分。修飾類型從屬于某個業務域,如日志域的訪問終端類型涵蓋無線端、PC端等修飾詞。
(5)修飾詞
指的是統計維度以外指标的業務場景限定抽象,修飾詞屬于一種修飾類型,如在日志域的訪問終端類型下,有修飾詞無線端、PC端等。
(6)度量/原子指标
原子指标和度量含義相同,基于某一業務事件行為下的度量,是業務定義中不可再拆分的指标,具有明确業務含義的名稱,如支付金額。
(7)維度
維度是度量的環境,用來反映業務的一類屬性,這類屬性的集合構成一個維度,也可以稱為實體對象。維度屬于一個數據域,如地理維度(其中包括國家、地區、省市等)、時間維度(其中包括年、季、月、周、日等級别内容)。
(8)維度屬性
維度屬性隸屬于一個維度,如地理維度裡面的國家名稱、國家ID、省份名稱等都屬于維度屬性。
(9)派生指标
派生指标=1個原子指标 多個修飾詞(可選) 時間周期。可以理解為原子指标業務統計範圍的圈定。如原子指标:支付金額,最近1天海外買家支付金額則為派生指标。
派生指标又分以下三種類型:
事務型指标:是指對業務活動進行衡量的指标。例如,新增注冊會員數、訂單支付金額,這類指标需要維護原子指标以及修飾詞,在此基礎上創建派生指标。
存量型指标:是指對實體對象(如商品、會員)某些狀态的統計,例如商品總數、注冊會員總數,這類指标需要維護原子指标以及修飾詞,在此基礎上創建派生指标,對應的時間周期一般為“曆史截止當前某個時間”。
複合型指标:是在事務性指标和存量型指标的基礎上複合成的。例如,浏覽UV-下單買家數轉化率。
複合型指标的規則:
- 比率型:創建原子指标,如CTR、浏覽UV-下單買家數轉化率、滿意率等。例如,“最近1天店鋪首頁CTR”,原子指标為“CTR”,時間周期為“最近1天”,修飾類型為“頁面類型”,修飾詞為“店鋪首頁”。
- 比例型:創建原子指标,如百分比、占比。例如,“最近1天無線支付金額占比”,原子指标為“支付金額占比”,修飾類型為“終端類型”,修飾詞為“無線”。
- 變化量型:不創建原子指标,增加修飾詞,在此基礎上創建派生指标。例如,“最近1天訂單支付金額上1天變化量”,原子指标為“訂單支付金額”, 時間周期為“最近1天”,修飾類型為“統計方法”,修飾詞為“上1天變化量”。
- 變化率型:創建原子指标,例如,“最近7天海外買家支付金額上7天變化率”,原子指标為“支付金額變化率”,修飾類型為“買家地域”,修飾詞為“海外買家”。
- 統計型(均值、分位數等):不創建原子指标,增加修飾詞,在此基礎上創建派生指标;在修飾類型“統計方法”下增加修飾詞,如人均、日均、行業平均等。例如,“自然月日均UV”,原子指标為 “UV”,修飾類型為“統計方法”,修飾詞為“日均”。
3. 指标管理的功能實現
為了實現指标管理,需考慮的底層信息:
指标管理功能設計
部分前台界面展示:
原子指标功能界面
派生指标功能界面
4. 數據的使用框架
在對指标進行規範定義與管理的基礎上,可以此推動底層事實表以及維表的建設,保證數據統計的數據源唯一以及計算口徑統一。同時,通過指标和修飾詞的結合,便于業務人員進行自助分析與使用數據,降低數據獲取的效率,從而産生有價值的結論,輔助決策,充分發揮數據的價值。
數據分析使用框架
總結
本文總結了如何基于業務來劃分業務過程,從而涉及對應的原子指标,在與維度結合的基礎上創建派生指标,建設成規範統一的數據指标體系。以此推動數據統計來源的唯一性,并接入指标提取工具,後續業務完成自助查詢及分析需求,搭建數據自助分析的基礎。
本書部分内容根據阿裡巴巴數據技術以及産品部的《大數據之路 阿裡巴巴大數據實踐》讀書筆記而展開,歡迎大家一起交流。
本文由 @ 時之沙 原創發布于人人都是産品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!