CDA數據分析師 出品
編輯:Mika
數據倉庫是商業和數據科學中最熱門的話題之一。
但是,如果你是該領域的新手,你可能想知道:
好的,首先讓我們看到定義。
單一數據源是什麼意思。
在信息系統理論中,單一數據源是在一個地方構造全部最佳質量數據的實踐。
讓我們看到一個簡單的例子。
你肯定遇到過這種情況,當你在處理文件,并且創建不同的版本,這時你怎麼給文件命名?
當你完成後,你通常會在結尾加上"最終版"。這導緻一堆帶有擴展名的文件,比如,"最終.最終 最終.最終.最終”,或者是我的最愛——"真正最終版最終版"
如果你是這樣,那你不是一個人。
看來即使是公司,也可能永遠都不知道最新或最合适的文件在哪裡。
但是如果你知道有個地方,會始終擁有單一的數據源,這就太有幫助了,不是麼?
數據倉庫就可以滿足這種需求。
01、數據倉庫是什麼?那麼到底什麼是數據倉庫呢?
指的就是公司存儲其寶貴數據資産的地方。當中包括客戶數據、銷售數據、員工數據等。
簡而言之,數據倉庫是公司事實上的單一數據源。通常創建它是為了将其主要用于數據報告和分析目的。
02、數據倉庫有哪些特征?數據倉庫有幾個定義特征,即 :
讓我們快速地分别看看。
這意味着數據倉庫中的信息會圍繞某些方面。因此,它永遠不會包含所有公司數據,不隻會包含相關的主題。
例如,競争對手的數據不需要出現在數據倉庫中。但是,自己的銷售數據肯定會在。
對應于開頭的例子,在命名方面,每個數據庫、每個團隊,甚至每個人都有自己的偏好。
這就是為什麼要開發通用标準,以确保數據倉庫在任何方面都能選擇最佳質量的數據。這與主數據治理有關,但這是另一個話題了。
與以下事實有關,數據倉庫也包含曆史數據。
如前所述,我們主要使用數據倉庫進行分析和報告。這意味着我們需要知道五到十年前發生的事情。
意味着數據僅按原樣錄入數據倉庫。一旦存入,就無法更改或删除。
這裡再次涉及到将數據用于數據分析這一事實。通常,它會以某種方式進行彙總或細分,為了便于分析和報告。
好的,以上就是關于數據倉庫的介紹了。謝謝收看,祝好運。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!