tft每日頭條

 > 生活

 > 統計中dp與ep的關系

統計中dp與ep的關系

生活 更新时间:2024-07-06 18:22:48

如今,互聯網中的數據倉庫,已不單單是數據開發工程師的責任,随着業務的發展和細分,對産品經理提出了更高的要求。

開發工程師往往不能夠第一時間深入理解業務,或者說理解的不夠透徹,完全交給數倉工程師開發的數據倉庫,不但時間過長(需要理解時間成本),而且不能很好的支持業務。這就需要數據産品經理參與數倉的開發中。不但要參與數據的建模和邏輯的梳理,還要做好數據的管理和規劃。

本文不讨論數據建模的過程,隻聊聊在數據的管理和規劃中,數據産品經理應承擔的工作内容和職責。

一、數據的源頭-生産端

互聯網公司,往往依托用戶的行為,來搭建用戶的相關行為模型進行分析,所以關于用戶行為上報的數據,是最基礎的數據也是最重要的數據。隻有合理、規範的上報,數據才會産生價值。那麼如何做好埋點,并且怎樣管理好埋點呢?

1.如何做好埋點

簡單來說:需要的數據進行埋點,以交互為底、業務價值為依據、時間為起點、需求為最終目标進行埋點的設計。

統計中dp與ep的關系(DPM在數倉建設中的作用)1

交互為底

任何交互的元素都要考慮是否需要進行埋點

業務價值為依據

考慮這個交互是否有實際的業務意義,來判斷是否需要埋點

時間為起點

記錄此處事件的真實發生時間

需求為最終目标

需求就是’誰對什麼做了什麼‘

2.埋點管理

一個埋點對應一個标識,通常一款産品包含數百個埋點,也會随着業務和産品的變化,埋點需要增删修改等,所以對埋點管理也是一個重要的步驟。

埋點管理的内容大緻包含如下:

統計中dp與ep的關系(DPM在數倉建設中的作用)2

1)埋點、埋點含義、觸發場景

埋點文檔中必須寫出埋點上報時機,同時描述準确;

2)參數、參數名稱、參數值類型

參數裡記錄的是針對埋點行為,所包含的信息,埋點行為不同,對應的信息也不同,所以不能作為公共字段記錄在數據表中,會以json形式,記錄在字段中,分析時需要使用具體的信息,可通過函數解析出來(get_json_object)。

3)元信息、備注信息

備注信息的意義就是解釋說明,例如文檔中隻記錄了物品和怪物的id,具體的名稱沒有記錄,是因為日志中存儲漢子易出現亂碼,僅記錄id即可達到分析需求,并且減少數據量。

4)元編碼、編碼表

同時,埋點文檔中,除了第一頁sheet表中展示埋點文檔外,其後幾頁需要寫出含多個枚舉值參數的編碼表,方便數據人員進行分析對照。

5)業務宣講

埋點文檔設計完成後,即可提交至研發同學,進行宣講。用戶行為分析是基于埋點完成,其重要性不言而喻,所以後期埋點驗收也需要産品經理的參與,确保埋點的準确性。

3.埋點方案

統計中dp與ep的關系(DPM在數倉建設中的作用)3

如圖,目前業内幾種埋點方案類型的比較。參考不同類型埋點的特點,在具體的功能場景時,根據具體情況選擇對應方案,進行埋點方案的設計。

二、數據字典

所謂數據字典,就是用來描述數據指标的一個公司内部的埋點規範。它将數據定義、結構、數據類型、數據邏輯、數據源等進行了一個彙總的文檔。那麼它的生産與管理過程是怎樣的呢?

統計中dp與ep的關系(DPM在數倉建設中的作用)4

1.字典收集

收集環節是需要對數據字典進行一個詳細的定義。需要知曉在業務分析中,數據的使用方關注哪些數據指标、歸因包含哪些維度。單純的從業務産品去思考,會存在缺失,通過與産品/運營同學的交流,可以使字典的内容更加完善。

2.标準建設

主要包含兩步,新标準的制定和舊标準的修改。新标準除了收集業務方的需求和建議外,還要參考一下業内最新的标準,這樣可以滿足業内的特定需要。

3.标準更新

如果舊标準與現有業務存在沖突,那麼就需要積極的與舊标準的業務方溝通,進行因地制宜的協同與調整。

三、業務數據管理

業務數據是企業運營各個環節的共用實體,連接企業的各個系統,如果存在業務數據不一緻,上有無法對接運營系統,下遊無法進行數據分析和整合,各個系統間的數據無法進行關聯,對企業的運營支持就很有限。

那麼如何做好這些業務數據的管理呢?

統計中dp與ep的關系(DPM在數倉建設中的作用)5

部門數據主責

各個部門主責自己的業務數據,編碼數據與主數據一緻

數據定義明确

數據屬性定義、标準、規範等統一維護

維護流程統一

各個部門在申請新的産品時,按照統一申請流程進行填寫或修改,流程由數據産品經理統一負責編寫與更新

數據共享及時

雖然業務數據不常變化,但是如有變化,實時性非常高,主要主動告知下遊的變化情況

數據狀态可控

數據的增加、修改、删除、凍結等,需要數據産品經理對數據的版本進行管理

數據屬性完備

每款産品,每個數據的屬性描述,進行統一的梳理

統計中dp與ep的關系(DPM在數倉建設中的作用)6

埋點全鍊路協同流程

寫在最後

以上就是數據産品經理在數倉開發過程中,對數倉的工作内容和職責,主要是集中在數據管理這裡,這是一項非常繁瑣且重要和有挑戰性的工作。如果中間的歧義産生較多,那麼就會反饋到業務上來,當進行更深層的業務邏輯分析時,會産生更嚴重的問題。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved