五葉草利用阿裡雲MaxCompute,為某世界500強快消品零售巨頭搭建了企業級數據倉庫。依托其強大的海量數據處理能力,有效降低了時間人力成本,提升了工作效率,使客戶可以将更多的精力投入到業務升級中去。
阿裡雲MaxCompute
MaxCompute,具有強大的海量數據處理能力,能夠有效降低時間人力成本,提升工作效率,使客戶可以将更多的精力投入到業務升級中去。
五葉草大數據有限公司是南京高新區阿裡巴巴創新中心基地本地運營商,是南京首家大數據、雲計算、人工智能、物聯網專業孵化培訓基地。阿裡雲數加(大數據平台)金牌合作夥伴,阿裡雲職業認證培訓體系課程授權合作夥伴和指定運營商。其業務包括:五葉草指數咨詢服務、大數據行業解決方案、大數據職業認證培訓、阿裡雲大數據實驗室、五葉草大數據私董會、大數據項目孵化加速、大數據生态投資基金、大數據衆智生态集市等。
由于部分子系統未打通、業務邏輯繁雜,客戶的業務分析工作主要在線下人工完成,分析時間長、統計口徑不一、數據質量參差不齊。
利用MaxCompute,五葉草為某世界500強快消品零售巨頭搭建了企業級數據倉庫。在将數據存儲在MaxCompute後,依托其強大的海量數據處理能力,原先需要花數小時更新的報表隻在10分鐘左右即可完成,有效降低了時間人力成本,提升了工作效率,使客戶可以将更多的精力投入到業務升級中去。
2.基礎數據層
所有清洗、整合、運算工作應當放在基礎數據層,避免對同步表裡數據進行操作。以增量更新基礎表為例,通過使用下面的方法,五葉草實現了每天增量更新數據到全量基礎表的新分區,當天增量與昨天全量合并,數據存在沖突時優先保留增量記錄
其中dwd_dummy_data為全量基礎表,存放昨天的全量數據;ods_dummy_data為增量同步表,存放今天的增量數據。
由于數據更新之後插入了新分區,保留的基礎表原始數據就為後面數據比對提供了極大的便利。客戶部分數據源是由其他第三方維護的,出現過本月客戶及該第三方協商對上月數據進行了修改,但是沒有将該操作提前告知五葉草,最終導緻上月月報結果與客戶BI部門統計有出入。通過與客戶提供的數據比對,五葉草發現與原始數據不一緻的地方,在測試環境中對曆史數據複現了相同的操作,并重跑了之後的任務,最終上月月報結果與客戶BI部門結果一緻。
3.多維數據層、數據應用層
在基礎數據層,通過清洗、整合、運算得到的表為基本的維度表、事實表。需要面向業務,計算出業務指标後生成一張多維度表,并最終展現給客戶。根據進銷存、人貨場财等分析思路,可以沿着某一方向深挖下去,下面展示了幾張從人、場、貨三個方向可以分析得出的多維度表,以及所需的基礎數據。五葉草同時也在打通更多的數據通路。
雲栖社區場景研究小組成員:董黎明,仲浩。
本文為雲栖社區原創内容,未經允許不得轉載。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!