總的來說:數倉分層是為了解耦。
經典的數倉分層:
下面這些層次英文縮寫可能在其他公司叫法不一樣,但是大體上分為以下幾個層次:
ODS:抽取的原始業務數據,結構一般和原始業務數據庫表結構或者抽取的業務日志數據結構保持一緻。一句話:從業務系統增量抽取,數據不做清洗轉換,與業務系統數據模型保持一緻。
DWS:根據ODS層,增加一些維度信息,過濾一些異常數據。為DW層提供來源明細數據,提供業務系統細節數據的長期沉澱,為未來分析類需求的擴展提供曆史數據支撐。
DW:模型層,根據DWS層數據,按各個業務需求,以某個維度ID進行粗粒度彙總聚合。此層一般會根據數倉涉及的業務發展或者主數據的建立等,抽象出一些公用的聚合彙總模型
APP:應用層/指标層/報表層,每個公司的叫法不一樣,一般指根據特定的某個應用或者報表進行的數據指标開發彙總。
數倉為什麼分層:
數據倉庫分層原因可以概括為以下4個方面:
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!