數據庫與現實的倉庫有什麼區别-tft每日頭條

數據庫與現實的倉庫有什麼區别

科技更新时间:2026-07-28 00:07:42

在知乎上看到這麼個問題：

數據庫與數據倉庫的本質區别是什麼？

其實，我很反感本質這個詞。因為本質這個詞，抽象，模糊，不好定性。回答者好心傾囊相授，看的人卻以一句“ 你沒有明白我的意思，你說的本質和我說的，不一樣！我的意思是……”。

要說本質，就要有分門别類的标準，要把抽象細化下來，這非常考驗人的形象與歸納思維。人與人之間，理解有偏差，談話中對方跟不上，就容易造成誤解。這種事情太多了。

那麼我把這個題目改一改，問，數據庫與數據倉庫的應用區别是什麼？這樣就好多了。至少，我們明确了在應用這個方向上，讨論“本質區别”。但事實上，這樣問也不夠好，還是模糊。這相當于問，“咖啡店與星巴克的區别是什麼”。是不是很奇怪，有誰會問這麼二的問題呢？

所以我說，問題本身就不夠明确。為什麼，你往下看就知道了。

既然談到了應用，那主體肯定是人，隻有人，才是應用的驅動體。站在人的角度來看，兩者的區别就會清晰很多。

首先，我們來看下，數據的應用有哪些。

第一種應用，我買了電影票：

這類應用，特點都是實時交互，我付了款，立馬得到服務。比如購物，餐飲，交通等等。我們稱之為 OLTP，也就是傳統上所說的“關系型事務數據庫”應用。

第二種應用，我用記賬本：

這類應用，通常會涉及很長一段時間的數據讀取，最終的數據呈現會以多種維度組織，實時性不高，但維度一定不止一位。這類應用屬于數據倉庫的數據分析細分領域，也稱之為 OLAP。

理解了這兩類應用後，我們進一步歸類。無論是 OLTP 還是 OLAP，其實都是數據庫應用，都要以數據庫作為存儲和處理基礎。

OLAP 數據倉庫技術，不過是數據庫應用中的一種。但數據庫和數據倉庫是否一定要以關系型事務數據庫作為基礎呢，不是的。我們接着往下分析。

數據庫

剛才我們談到應用，繼而談到應用的主體，人。那麼談人的時候，有有必要從人經曆的曆史，來看人的發展。以下是半個世紀來，人們在使用數據庫上的曆史節點。

剛開始，人們在應用數據需求上，使用各類不同的數據模型，有 Network Model, Hierarchical Model,還有 Relational Model.

比較好理解的是，Hierarchical Model ：

有一對多的層級關系，最适合用來記錄上下級關系的數據。比如部門組織架構，會計分錄，工業制造常用的BOM(物料清單)等。

接下來，特殊應用就是網絡模型(Network Model):

20世紀50年代的計算機應用水平，還沒有互聯網概念。以現在發達的社交網絡來理解網絡模型，最合适不過。對，就是平常我們所說的社交網絡。

人與人之間的聯系，就像一張網。兩兩認識的朋友，早晚也會成為朋友，用6度人脈來解釋，就是你要認識王XX，也隻要找到關鍵的6個人帶你。

領銜數據庫發展潮流，霸榜半個世紀的理論，是關系型數據庫

1970 年開始，關系型數據庫論文《大型共享數據庫數據的關系模型》在ACM發表了。由此打開了關系型數據庫霸榜的序幕。

從1973年開始，數據庫廠商都開始以 IBM System R 為藍本，開發自己的商用版本。比如 Oracle, IBM DB2, SQL Server , PostgreSQL 等等。

以 NoSQL,NewSQL 展開數據庫新時代序幕

随着手機，尤其是智能手機，智能平闆，互聯網應用的發展，關系型數據庫在處理這些應用上逐漸吃力，因此 Redis, MongoDB, ElasticSearch 逐漸有了市場。

他們的操作語法，看似和關系型數據庫沒有相似之處，但在組成架構上卻還有些異曲同工，目的是把原來在關系型數據庫中不好處理的部分，經過結構規範化，存儲優化，索引優化等技術，使得這些非關系型結構化的數據處理，變得更加高效。

并不是說，傳統的應用中就沒有今天互聯網時代的應用，也有的。比如網站的打日志，全網搜索等。

但那個時代并沒有那麼多流量，沒有那麼多人來訪問應用，所以使用關系型數據庫存儲和處理這些數據還綽綽有餘。但在流量爆發的今天，數據量早已不是當年可比。要存儲和處理這些大數據，必須采用新新技術。

比如MongoDB的數據分片，可以把用戶操作日志放入操作日志集群中，把搜索日志放入搜索集群中；而用戶的搜索，可以單獨放入 ElasticSearch 中，使得搜索這種高吞吐量的操作不再占用寶貴的 OLTP 服務器資源。

這些都是傳統的關系型數據庫在處理今天互聯網應用上逐漸吃力的表現。

功能上的缺陷，使得關系型數據庫丢失了一部分市場。可真正讓廠商焦慮的，是處理 OLTP 事務上的瓶頸。這才是關系型數據庫真正感到無力的地方。

比如淘寶每年的雙十一，OceanBase 最高峰值達到每秒 6100 萬。然而，傳統的數據庫，依據Oracle 的 TPC-C 打榜數據，隻有 300萬，完全支撐不住。當然這是 Oracle 2009年的數據，現今的 O 記雲，能達到多少 QpmC，我們也不知道。

所以我說，真正讓傳統的RDBMS廠商感到恐慌的，應該是大吞吐量事務處理的無力。

至此，所有的應用，我們都可以稱之為數據庫應用。當然，也包括數據倉庫。20世紀70年代以來，市場上占據主導地位的，還是關系型數據庫。

使用關系型數據庫搭建數據倉庫，完全順其自然，也合情合理。Kimball 與 Inmon 最初的數據倉庫理論，都以關系型數據庫作為底層存儲架構。

但 Google 的大數據三駕馬車出現後，情況開始變了。

FileSystem, BigTable, MapReduce 的出現，使得大吞吐量的數據倉庫不再遙不可及，原先的RDBMS解決方案是利用時間差，來解決複雜查詢的效率問題，但在數據量和吞吐量達到單台服務器容量極限後，再多的數據量也就難以負載了。

Google三駕馬車的出現，使得多台，甚至千台數據庫服務共同計算變成可能。一個人的力量是有限的，但一群人的力量就不可估量了。機器也是一樣，關鍵在于調度。

先讨論早期的數據倉庫技術及産品

剛才談到，關系型數據庫技術，早期用來服務銀行，航空等行業。這些應用主要的功能是處理數據的輸入與輸出。能夠把數據做到準确，安全，一緻，就已經達标了。這系列應用，我們稱之為 OLTP(在線聯機事務處理)

但，随着輸入的增多，輸出就成為了瓶頸，最重要的就是數據分析變得吃力，響應需要等待很長時間，而且有時候結果甚至都出不來，還嚴重拖慢了數據輸入的功能。

因此，全世界都意識到，大量數據的分析，應該和數據的輸入系統，也就是業務系統分開來治理。這，就是數據倉庫思維的啟蒙。

進一步将數據模型優化成關系型數據模型與多維度數據模型概念的，是Kimball. 他的多維度數據模型雖然可以用關系型數據庫實現，但數據結構的組織，已經完全不同于OLTP的使用規範，而是更接近于 OLAP，也就是在線聯機分析處理。

正因為有了多維度數據模型，OLAP才有了新的産品。新的非關系型OLAP産品，與OLTP的關系型數據庫，完全就不是一個架構了。比如 SQL Server Cube, Hyperion Essbase,DB2 OLAP Server 等等.他們采用了一種叫做稀疏性矩陣的技術。

以分布式數據庫作為數據倉庫技術的新起點

半個世紀以來，數據庫世界一直都是關系型數據庫的天下。那麼多的業務系統都建立在RDBMS上，那麼順理成章，數據倉庫也以RDBMS為基建了。這樣一來，無論是硬件成本，還是人力成本，都可以減少到最少。

但摩爾定律一定是支配着信息産業的發展，每過18個個月翻番的，不僅僅是計算機硬件性能，對軟件也提出更高的要求，數據庫就更加嚴苛了。大家回憶下半年前，你們的數據庫有多大，再想想現在你們的數據庫有多大，就明白了。

所以，大小型機，受制于單台資源，在日益增大的數據面前，毫無應招之力，隻能讓步于分布式數據庫。以Hadoop的橫空出世為起點，數據倉庫終于不再以RDBMS馬首是瞻，紛紛投奔分布式的非關系型數據庫。

跟RDBMS如出一轍，Hadoop一戰成名之後，後起之秀就越來越多，也越來越猛。原本 Hive 這樣的非實時數據倉庫，已經取得了很大的市場，但随着實時數據技術的渴求與引入，Spark, Flink 這樣的分布式計算也日益得到人們的青睐。

真是“問世間，是否此山最高或者另有高處比天高。”

計算機的世界就是這樣，你追我趕，你方唱罷，我方登場。總有軟件比你更快，更好，也總有人，比你更懂SQL

分布式數據庫的技術派别

分布式數據庫，在提高系統吞吐量，降低服務器高負載，提高作業系統性能等方面，均做出了很好的優化。數據在爆量的情況下，采用分布式數據庫系統又變得自然不過了。

那麼究竟有哪些分布式數據庫呢？

其實分布式數據庫自數據庫發展以來，就沒有停過。Oracle, SQL Server 在創立之初，就有各自實現分布式數據庫的方法。不過那個時候，我們傾向于把這些叫做産品功能，比如高可用，複制，鏡像技術，或者讀寫分離。

嚴格來說，這些分布式與我們今天所說的分布式，完全不一樣。最重要的一點，商業數據庫的分布式産品，都是高度自治的，那可真的是分布式，一台數據庫服務器，與另外的分布式數據庫服務器，不共享硬盤，也不共享内存與CPU.看上去完全無關，但邏輯上還是有聯系，圍繞着同一個應用，一台服務器供寫入數據，另一台或者幾台則供查詢讀取。數據同步使用 CDC, BAT 腳本等方式完成。

但若繼續采用上面的架構，流量再翻10倍，100倍，肯定就頂不住了，因為單機作戰能力并不能無限升級，也就不能線性增長。這時，必須采用嚴格的分布式架構，使每一種數據，都落地在不同的數據庫服務器上。

這個時候， MPP 和 Hadoop 為代表的兩類分布式計算架構出現在市場，也算是應運而生了。當然這是另外的話題。
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技春季如何讓豬快速長膘
1、保溫防寒。雖說以及進入了春季，但是為了防止出現倒春寒的現象，并且春季的晝夜溫差是非常大的。所以我們在養殖的時候還是要做好保溫工作。做好保溫工作才能夠保證豬健康生長，提高豬的生長能力，促進長膘。不過我們在保溫的同時，還需要做好通風工作，提高豬舍内的空氣質量，防止質量過差影響豬的生長。2、降低密度。... 2023-07-01
科技電腦主機聲音大嗡嗡響是怎麼回事
1、最常見情況：cpu風扇灰塵太厚、風扇軸承老化導緻的電腦主機聲音大。目前大多數的cpu散熱器上都加... 2023-07-01
科技日常駕駛汽車需注意什麼
1、換擋前應将離合器踩到底，操縱變速杆時動作要輕快、準确、柔和，不可用力過猛，也不要硬拉硬推，使齒輪發響；以免變速器操縱機構受損。行駛中，不要長時間将手放在變速杆上，否則會造成變速器換擋拔叉過早磨損。2、挂倒擋時要在汽車停止狀态下進行，還需要壓縮倒擋彈簧；同樣在倒車後，要使車輛前進，也應将車停穩。3... 2023-07-01
科技巴西世界杯巴西隊國家隊球員以及球衣号
第一、内馬爾是巴西國家隊的前鋒，也是最有名的足球運動員之一，來自巴塞羅那俱樂部，内馬爾的球衣是10号。前鋒浩克的球衣是7号，弗雷德是9号。第二、阿爾維斯是巴西國家隊的後衛，同樣來自巴塞羅那，他的球衣是2号。而同樣是後衛的大衛路易斯的球衣是4号，丹特是13号，亨裡克是15号。第三、傑弗森是巴西國家隊的門将，來自博塔弗戈，球衣是1号，而門将朱裡奧塞薩爾的球衣是12号、維克托的球衣是22号。第四、費爾南 2023-07-01
科技京東自營是什麼意思
1、京東自營也就是售後和出售，是專門由京東官方負責的，是一個店家直接到買家的形式，比如說商品的服務寫... 2023-07-01
科技浏覽器打不開網頁是什麼原因
1、浏覽器打不開網頁原因可能是設置上面出了問題，還有可能我們的浏覽器的程序中有個别程序被我們誤删了。... 2023-07-01
科技主闆型号怎麼看
1、主闆購買之初，都會有一個外包裝盒，這個包裝箱的上面一般都會貼上你所購買的主闆的詳細配置信息，我們... 2023-07-01
科技小米音箱怎麼用
1、首先，在使用時，要将小米音響打開，長按開關鍵，将其打開，在打開之後，會有叮咚的聲音，并且還會伴随着閃爍的綠燈。2、小米音響打開後，要打開手機，在進入設置界面，開機藍牙。3、将藍牙打開後，會自動搜索附近的設備，當找到小米音響時點擊連接即可。4、這樣看片或聽音樂時，聲音就能從小米音響中聽到了。 2023-07-01
科技怎麼解決通話聲音變小
1、故障排查在手機設置裡面把手機鈴聲、鬧鐘鈴聲、語音通話、媒體的音量等都調到最高，然後一一嘗試，看到... 2023-07-01
科技北京四合院布局依據什麼來布局
1、四合院是以正房、倒座房、東西廂房圍繞中間庭院形成平面布局的北方傳統住宅的統稱。在中國民居中曆史最... 2023-07-01
科技微信轉賬對方賬戶異常怎麼回事
微信給别人轉賬上面顯示“對方賬戶異常”是因為對方的微信被舉報過，若是确定對方沒有問題，則可無視此條提... 2023-07-01
科技限流後怎麼恢複網速
1、檢查一下是否已經超過了當月套餐中規定的流量，超出後隻能等下個月才可以解除。2、可能需要重啟一下手機網絡即可恢複。3、還有可能是由于附近的網絡連接不穩定，導緻網速不快，還有可能是由于運行不穩定導緻的。 2023-07-01
科技虎撲怎樣看視頻直播
1、首先打開【虎撲體育】手機APP客戶端；2、在【看球】的頁面，可以看到各個比賽場次，選擇正在直播中... 2023-07-01
科技釘釘打卡怎麼清除記錄
1、先在電腦上打開釘釘PC客戶端登陸好管理員釘釘賬号，再點擊管理後台。2、用管理後台密碼登陸。3、登... 2023-07-01
科技共享單車有什麼好處
1、理論上來說，共享單車可以大幅提高城市效率。有人說自行車普及是交通的退步，因為汽車是更先進的交通工... 2023-07-01
科技專業舞台音響設備有哪些
1、調音台：有多個信道輸入，每個信道聲音可以進行單獨加工處理，而且擁有左、右聲道、混合、監聽等輸出一種聲音混合設備。是音響師、錄音師和作曲家進行音樂、聲音創作的重要設備。2、功放器：是将音頻電壓信号轉換為定額功率信号，用于驅動揚聲器發聲的設備。功放功率匹配條件是功放輸出阻抗等揚聲器負載阻抗，及功放輸... 2023-07-01
科技 lumion電腦配置
1、最低系統配置：硬盤容量最少為20GB的空閑空間，顯卡最低2000點PassMark，且配備2GB... 2023-07-01
科技 word裡面段落怎麼做
1、打開word文檔，單擊“開始”，在标題欄中會發現有“正文、标題1、标題2”這一欄，選擇“标題1”... 2023-07-01
科技 cad标注怎麼設置
以華為MateBookX，win10，cad2020為例。1、打開CAD軟件，以1000mm直線标注為例。2、選擇标注，線性命令，添加線段标注，為設置參數，标注出來數據無法看清（快捷鍵d+空格）。3、選擇标注，标注樣式命令，進入樣式菜單欄。4、點擊修改按鈕進入修改菜單，點擊箭頭與符号，箭頭選擇建築标記，大小設置為10。5、線設置尺寸界限，超出尺寸線設置為10，顔色根據自己需求設定。6、文字設定顔色 2023-07-01
科技小米家電全套價格
1、小件：智能網關，空調伴侶，智能插座，吸頂燈，智能開關，門窗傳感器，掃地機器人，智能拖把（忘學名了... 2023-07-01
科技榮威rx3保養消除步驟是什麼
1、榮威rx3保養提示消除，一般要使用榮威專用診斷儀。榮威rx3首次保養前是廠家設置好的，首次保養以後，4s店接着就會設置好下一次保養的提示。2、如果車主不是在4s店保養需要自行複位保養燈的話，需要到網上購買一個工程帳号，然後在汽車中控系統中登錄，按照操作即可使保養燈歸零。3、如果保養燈提示時，建議... 2023-07-01
科技 vivo手機hdr在哪裡打開
1、首先讓我們準備一部手機并打開，在手機主界面上找到相機圖标并打開，方法如下圖。2、我們打開了相機以後，在選項欄中找到HDR模式并點擊，點擊後就開啟了HDR模式，如圖所示。3、我們用HDR模式處理過的照片，要比不使用HDR的照片發暗一些，在有燈光曝光的部分緩和一些，這就是HDR的功能所在。 2023-07-01
科技微信怎麼發長視頻不是筆記
1、首先，我們先将微信打開點擊到“我的設定”—“收藏”。2、點擊第一個圖标，添加一個本地視頻，記住視... 2023-07-01
科技速龍x4641相當于i幾
速龍x4641相當于i32100。它的單核成績略遜色于i3，但多核性能要比i32100好，綜合性能上兩者比較接近。速龍x4641是四核處理器，屬于入門級低端CPU，單核的效率偏低，因此遊戲性能不強，無法滿足遊戲玩家的需求，且無法運行市面上的主流吃雞遊戲。 2023-07-01
科技怎麼測量小變壓器輸出多少瓦
1、用瓦特計在次級輸出側直接量測，需加負載。2、在次級輸出側分别串接電流表及負載處并接電壓表,分别看... 2023-07-01
科技電腦硬件知識學習
1、CPU品牌有兩大陣營，分别是Intel(英特爾)和AMD,這兩個行業老大幾乎壟斷了CPU市場，大... 2023-07-01
科技挖掘機如何挖溝
1、一般工地都會在地面上把溝的路線用白色的石灰畫出來。記住，你的鐵鍊要壓線，這樣會保障挖直。2、如果... 2023-07-01
科技智慧水務包括哪些内容
智慧水務通過數采儀、無線網絡、水質水壓表等在線監測設備實時感知城市供排水系統的運行狀态，并采用可視化的方式有機整合水務管理部門與供排水設施，形成“城市水務物聯網”，并可将海量水務信息進行及時分析與處理，并做出相應的處理結果輔助決策建議，以更加精細和動态的方式管理水務系統的整個... 2023-07-01
科技汽車的燈分别有什麼功能
1、前照燈。組合前照燈在汽車的前部，它主要起照明和信号作用。前照燈發出的光可以照亮車體前方的道路情況，使駕駛者可以在黑夜裡安全的行車。組合前照燈按照光源可分為：鹵鎢燈、氙氣燈，按照功能可分近光燈、遠光燈、前轉向燈、前位燈、前霧燈。2、霧燈。國家法規未強制要求，所有車型基本都配備。3、組合尾燈。組合尾燈在汽車的後部，它主要起照明和信号作用。後車燈一般由後位燈、倒車燈、制動燈、後霧燈、後轉向燈，和回複 2023-07-01
科技如何在筆記本電腦中啟動DHCP設置
1、首先打開電腦桌面左下角的Windows徽章圖标，在彈出來的菜單欄中，打開運行”選項。2、然後在彈出來的運行窗口中，點擊輸入命令services.msc”，回車确定。3、然後在彈出來的窗口中，找到DHCP服務，并點擊打開它。4、然後在服務設置的界面中，打開啟動類型”，選擇自動”，點擊下方的啟動”，... 2023-07-01

tft每日頭條

> 科技

> 數據庫與現實的倉庫有什麼區别

數據庫與現實的倉庫有什麼區别

相关科技资讯推荐

热门科技资讯推荐

网友关注