tft每日頭條

 > 科技

 > 數據倉庫定義簡介

數據倉庫定義簡介

科技 更新时间:2025-01-13 03:34:44

  數據倉庫定義簡介(數據倉庫系列1-什麼是數據倉庫)(1)

  Data Warehouse

  什麼是數據倉庫? 數據倉庫(DW)是用于從不同來源收集和管理數據,以提供有意義的商業洞察力過程。數據倉庫通常用于連接和分析來自異構源的業務數據。數據倉庫是BI系統的核心,是為數據分析和報告而構建的。

  它是技術和組件的混合體,有助于戰略性地使用數據。它是企業對大量信息的電子存儲,旨在用于查詢和分析而不是事務處理。它是一個将數據轉化為信息并及時提供給用戶以發揮作用的過程。

  決策支持數據庫(數據倉庫)與組織的操作數據庫分開維護。但是,數據倉庫不是産品而是環境。它是信息系統的架構構造,可為用戶提供當前和曆史決策支持信息,這些信息在傳統的操作數據存儲中難以訪問或呈現。

  很多人都知道,一個由 3NF(第三範式) 設計的庫存系統數據庫有很多相互關聯的表。例如,關于當前庫存信息的報告可以包括 12 個以上的連接條件。這會迅速減慢查詢和報告的響應時間。數據倉庫提供了一種新設計,可以幫助減少響應時間,并有助于提高報表和分析查詢的性能。

  數據倉庫系統也被稱為以下名稱:

  決策支持系統 (DSS)行政信息系統管理信息系統商業智能解決方案分析應用數據倉庫數據倉庫的曆史 數據倉庫有利于用戶了解和提高其組織的績效。随着計算機系統變得更加複雜并且需要處理越來越多的信息,存儲數據的需求也在不斷發展。然而,數據倉庫并不是什麼新鮮事。

  以下是數據倉庫發展過程中的一些關鍵事件——

  1960 年 - 達特茅斯 (Dartmouth) 和通用磨坊 (General Mills) 在一個聯合研究項目中,開發術語維度和事實。1970 年 - 尼爾森和 IRI 引入了用于零售銷售的維度數據集市。1983- Tera Data Corporation 推出專為決策支持設計的數據庫管理系統數據倉庫始于 1980 年代後期,當時 IBM 員工 Paul Murphy 和 Barry Devlin 開發了業務數據倉庫。然而,真正的概念是由 Inmon Bill 給出的。他被認為是數據倉庫之父。他撰寫了有關倉庫和企業信息工廠的構建、使用和維護的各種主題的文章。

  數據倉庫如何工作? 數據倉庫用作中央存儲庫,信息來自一個或多個數據源。數據從事務系統和其他關系數據庫流入數據倉庫。

  數據可能是:

  結構化的半結構化非結構化數據 數據經過處理、轉換和攝取,以便用戶可以通過商業智能工具、SQL 客戶端和電子表格訪問數據倉庫中處理過的數據。數據倉庫将來自不同來源的信息合并到一個綜合數據庫中。

  通過将所有這些信息合并到一個地方,組織可以更全面地分析其客戶。這有助于确保它考慮了所有可用信息。數據倉庫使數據挖掘成為可能。數據挖掘正在尋找可能導緻更高銷售額和利潤的數據模式。

  數據倉庫的類型 三種主要類型的數據倉庫 (DWH) 是:

  1. 企業數據倉庫(EDW):

  企業數據倉庫 (EDW) 是一個集中式倉庫。它為整個企業提供決策支持服務。它提供了一種用于組織和表示數據的統一方法。它還提供根據主題對數據進行分類的能力,并根據這些部門提供訪問權限。

  2. 運營數據存儲:

  當數據倉庫和 OLTP 系統都不支持組織報告需求時,操作數據存儲(也稱為 ODS)隻不過是所需的數據存儲。在ODS中,數據倉庫是實時刷新的。因此,它被廣泛用于日常活動,例如存儲員工的記錄。

  3. 數據集市:

  數據集市是數據倉庫的一個子集。它專為特定業務線而設計,例如銷售、财務、銷售或财務。在獨立的數據集市中,數據可以直接從來源收集。

  數據倉庫的一般階段 早些時候,組織開始使用相對簡單的數據倉庫。然而,随着時間的推移,開始使用更複雜的數據倉庫。

  以下是使用數據倉庫 (DWH) 的一般階段:

  離線操作數據庫:

  在這個階段,數據隻是從一個操作系統複制到另一個服務器。這樣,複制數據的加載、處理和報告不會影響操作系統的性能。

  離線數據倉庫:

  數據倉庫中的數據定期從操作數據庫更新。Datawarehouse 中的數據被映射和轉換以滿足 Datawarehouse 目标。

  實時數據倉庫:

  在此階段,每當操作數據庫中發生任何事務時,都會更新數據倉庫。例如,航空公司或鐵路訂票系統。

  集成數據倉庫:

  在此階段,當操作系統執行事務時,數據倉庫會不斷更新。然後,數據倉庫生成傳遞回操作系統的事務。

  數據倉庫的組成部分 數據倉庫的四個組件是:

  負載管理器:負載管理器也稱為前端組件。它執行與将數據提取和加載到倉庫相關的所有操作。這些操作包括為進入數據倉庫準備數據的轉換。

  倉庫管理員:倉庫管理員執行與倉庫中數據管理相關的操作。它執行諸如數據分析以确保一緻性、索引和視圖的創建、非規範化和聚合的生成、源數據的轉換和合并以及歸檔和烘焙數據等操作。

  查詢管理器:查詢管理器也稱為後端組件。它執行與用戶查詢管理相關的所有操作操作。此數據倉庫組件的操作是直接查詢适當的表以安排查詢的執行。

  最終用戶訪問工具:

  這分為五個不同的組,例如 1. 數據報告 2. 查詢工具 3. 應用程序開發工具 4. EIS 工具,5. OLAP 工具和數據挖掘工具。

  重點學習數據倉庫 (DWH),也稱為企業數據倉庫 (EDW)。數據倉庫被定義為一個中央存儲庫,其中的信息來自一個或多個數據源。數據倉庫的三種主要類型是企業數據倉庫 (EDW)、操作數據存儲和數據集市。數據倉庫的一般狀态是離線操作數據庫、離線數據倉庫、實時數據倉庫和集成數據倉庫。Datawarehouse 的四個主要組件是負載管理器、倉庫管理器、查詢管理器、最終用戶訪問工具 參考: guru99

  ,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved