簡述數據庫與數據倉庫的需求分析?data warehouse(可簡寫為DW或者DWH)數據倉庫,是在數據庫已經大量存在的情況下,為了進一步挖掘數據資源、為了決策需要而産生的,它是一整套包括了etl、調度、建模在内的完整的理論體系數據倉庫的方案建設的目的,是為前端查詢和分析作為基礎,主要應用于OLAP(on-line Analytical Processing),支持複雜的分析操作,側重決策支持,聽且提供直觀易懂的查詢結果比較流行的有:AWS Redshift,Greenplum,Hive等,現在小編就來說說關于簡述數據庫與數據倉庫的需求分析?下面内容希望能幫助到你,我們來一起看看吧!
data warehouse(可簡寫為DW或者DWH)數據倉庫,是在數據庫已經大量存在的情況下,為了進一步挖掘數據資源、為了決策需要而産生的,它是一整套包括了etl、調度、建模在内的完整的理論體系。數據倉庫的方案建設的目的,是為前端查詢和分析作為基礎,主要應用于OLAP(on-line Analytical Processing),支持複雜的分析操作,側重決策支持,聽且提供直觀易懂的查詢結果。比較流行的有:AWS Redshift,Greenplum,Hive等。
1.2主要特點
特性 |
數據倉庫 |
事務數據庫 |
适合的工作負載 |
分析、報告、大數據 |
事務處理 |
數據源 |
從多個來源收集和标準化的數據 |
從單個來源(例如事務系統)捕獲的數據 |
數據捕獲 |
批量寫入操作通過按照預定的批處理計劃執行 |
針對連續寫入操作進行了優化,因為新數據能夠最大程度地提高事務吞吐量 |
數據标準化 |
非标準化Schema,例如星型Schema或雪花型schema |
高度标準化的靜态schema |
數據存儲 |
使用列式存儲進行了優化,可實現輕松訪問和高速查詢性能 |
針對在單行型物理塊中執行高吞吐量寫入操作進行了優化 |
數據訪問 |
為最小化I/O并最大化數據吞吐量進行了優化 |
大量小型讀取操作 |
數據分層,每個企業根據自己的業務需求可以分成不同的層次,但是最基礎的分層思想,理論上數據分為三個層:數據運營層、數據倉庫層、數據服務層。基于這個基礎分層之上,再提交信息的層次,來滿足不同的業務需求。
2.1數據運營層(ODS)DW數據分層,由下到上為DWD,DWB,DWS。
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!