怎麼看數據庫分布式架構-tft每日頭條

怎麼看數據庫分布式架構

圖文更新时间:2026-08-01 01:35:41

導讀

與傳統關系型數據庫相比，分布式數據庫系統具有多集群、多節點、高并發等特性，這就需要分布式數據庫的 SQL 引擎能夠在滿足用戶常規的 SQL 請求以外，提供多集群、多節點協同計算的能力，從而提高查詢效率。本文将介紹分布式數據庫 ZNBase 的 SQL 引擎架構特點，以及其中各大服務組件的技術原理與工作流程。

分布式數據庫架構

目前業界最流行的分布式數據庫主要分為兩種架構。一種是以 Google Spanner 為代表的 Shared nothing 架構，另一種是以 AWS Auraro 為代表的計算/存儲分離架構。

Spanner 是 shared nothing 的架構，内部維護了自動分片、分布式事務、彈性擴展能力，數據存儲還是需要 sharding，plan 計算也需要涉及多台機器，也就涉及了分布式計算和分布式事務。

Auraro 主要思想是計算和存儲分離架構，使用共享存儲技術，這樣就提高了容災和總容量的擴展。但是在協議層，隻要是不涉及到存儲的部分，本質還是單機實例的 SQL 引擎，不涉及分布式存儲和分布式計算，這樣就和傳統數據庫兼容性非常高。

浪潮雲溪 NewSQL 數據庫 ZNBase 完美地繼承了 Spanner 的設計理念，實現了基于對等架構的分布式 SQL 引擎。

ZNBase 的 SQL 引擎

ZNBase 的 SQL 引擎在傳統的 SQL 引擎基礎上，引入了分布式的概念，通過多個集群節點協同計算更高效的執行用戶 SQL 查詢，總體架構圖如下：

怎麼看數據庫分布式架構（深入解析ZNBase分布式SQL引擎架構的五大服務組件）1

SQL 引擎靜态結構，包含五大服務

集群中每個節點 node 都獨有連接服務（Connectivity Service）、編譯服務（Compile Service）和緩存服務（Cache Service）三大服務，可以完成用戶的 SQL 查詢執行的前端準備工作。

同時，所有節點又共同組成了分布式的目錄服務（Distibuted Catalog Service）和分布式的執行服務（Distibuted Execute Service），通過這兩個服務完成了多個 node 節點的協同執行，提高了分布式 SQL 引擎的執行性能。最終将結構化數據，轉化為底層存儲可識别的 KV 編碼對，通過 Batch 批處理發送到事務層進行處理。

怎麼看數據庫分布式架構（深入解析ZNBase分布式SQL引擎架構的五大服務組件）2

SQL 引擎執行流程

下文将對這五大服務進行展開介紹。

1.連接服務 Connectivity Service

分布式數據庫 ZNBase 采用的是對等架構，集群中的任意節點都可以作為接入節點。同時，ZNBase 支持 PostgreSQL 協議，SQL 查詢可以通過各種支持 PostgreSQL 協議的驅動發送到集群。

連接服務流程如下：

用戶通過後台守護進程進行連接器管理，為每個客戶端構建新的 Executor。
當用戶從客戶端發起指令後，從客戶端接收和解包流。
執行完畢後，将操作結果打包返回給客戶端。
用戶的每一次操作，都被認為是一個單獨的事務操作。

2.分布式目錄服務 Dist Catalog Service

ZNBase 的 Dist Catalog Service 不僅實現了傳統關系數據庫的 schema metadata，包含了常用的庫、表、列、模式等數據庫元數據，而且實現了元數據信息的高可用，以及分布式訪問。元數據采用多副本存儲、分布式存儲，保證少于一半數據不可用的情況下，元數據信息仍然可用。而且每個對等節點在啟動時會直接内存化元數據路由表的第一級 Root Meta Range 數據，保證任意節點都能訪問到需要的元數據信息。

Catalog 信息發生變化時，首先會更新到元數據存儲的寫入節點，通過 Raft 協議同步到多副本。同時使得各個節點的 Catalog 緩存失效，在使用時進行異步的更新，保證各節點數據的一緻性。

3.編譯服務 Compile Service

ZNBase 的編譯服務包括了 SQL 前端和 SQL 中端功能，SQL 前端實現了傳統數據庫的 Scanner、Parser、SQL 語法、SQL 語義以及數據庫對象和權限校驗的處理，生成了 AST(抽象語法樹)。

SQL 中端實現了數據庫的優化器的功能。優化器負責給執行引擎提供輸入，它接收來自 SQL 前端解析好的 AST 樹，然後需要從所有可能的計劃中選擇代價最優的計劃提供給執行引擎。

ZNBase 的優化器是基于 Cascades 論文實現的搜索框架。從數據庫的發展曆程來看，基于 Cascades 的搜索框架已經成為了業界标準，包括商業數據庫 SQL Server 以及開源數據庫 GP/ORCA 都采用 Cascades 實現。編譯服務的整體架構如下：

怎麼看數據庫分布式架構（深入解析ZNBase分布式SQL引擎架構的五大服務組件）3

SQL 引擎編譯服務結構圖

如上圖所示，Client 端輸入的 SQL 語句通過 go-yacc 層的詞法、語法、語意義解析為 AST 語法樹，經過 Memo construction 轉換為 CBO 初始的 Memo 樹。Memo 由一些列等價的 group 組成，每個 group 表示一個邏輯等價表達式集合，Memo 本身是樹狀結構化的，可以代表查詢語句，但是又不包含大量的元數據信息，可以被緩存以提高執行效率，這點在 Cache Service 中會給出解析。構造好的 Memo 直接應用于基本的 RBO 轉換。之後，Memo 數據根據統計信息經過 CBO 優化（等價發掘和最優化Cost）選擇轉換為最優路徑的計劃。

RBO 根據指定的優先順序規則，對指定的表進行執行計劃的選擇。比如在規則中：索引的優先級大于全表掃描。

當某些 SQL 語句的寫法并不利于快速從存儲中查詢數據的場景下，RBO 會對其進行相應轉化，例：

SELECT*FROMt1,t2WHEREt1.a>4ANDt2.b>5;

如果先進行笛卡爾積再進行過濾條件時，則會産生很多不必要的元組。但是如果先過濾 t1 , t2 的關系，在進行笛卡爾積，那麼表達式的消耗将大大減少。在進行過濾時，能做到一個select算子中就做到算子中，不能的話，就在具有過濾需要的列時及時做好，比如 a.a > 5 and b.b > 10 and a.c > a.b，第一個和第二個條件都可以推到 select 算子中，在這兩個算子上面立即加一個 a.c > a.b 的過濾條件。

CBO 則基于統計信息對代價進行代價預估，得到一條較優的查詢路徑。例如：我們在做三個表連接的時候，如果有統計信息的話，我們就可以知道，哪兩個表先做連接會使接下來執行的代價更小，因為在做 hashjoin 時，我們總希望小的表先進入，然後制作成一個小的 hashtable，因為 hashtable 比較小，所以之後的大表在做 join 的時候，就會有更高的命中率。

4.緩存服務 Cache Service

ZNBase 提供了兩種類型的緩存服務，主要是用來提高數據訪問效率，減少重複消耗。

第一種是 Session 級的 Querycache，主要是緩存用戶 SQL 語句指紋對應的 Memo 樹數據結構，減少同一 Session 的 SQL 語句多次構建邏輯計劃的開銷。SQL 語句指紋含有 SQL 語句的相關 Catalog 信息和權限等校驗信息。

在重用 Memo 之前，會對 Memo 是否過期進行檢查：解析元數據所依賴的每個數據源和 schema，以便檢查完全限定的對象名是否仍解析為相同對象的相同版本，檢查和時間相關的類型的構造和比較方式，以及用戶是否仍有足夠的權限訪問這些對象。如果依賴項不再是最新的，則判定該 Memo 過期，需要重新構建。

第二種是集群級别的元數據相關 Cache。其中 Catalog 信息包含了數據庫常用的 scheme 信息和元數據路由信息。元數據路由信息由 Dist Catalog service 提供。通過元數據路由信息集群任意節點可以訪問到所有需要的元數據或者數據。

5.分布式執行服務 Dist Execution Service

ZNBase 的 SQL 引擎整體設計模型參考了 Volcano 模型[1]，Volcano 模型的提出者是 Goetz Graefe，其 1994 年發表此文，并于 2017 年獲得 Edgar F. Codd（關系模型奠基人）創新獎。

ZNBase 的分布式執行提出了一些與 Map-Reduce 類似，但與 Map-Reduce 的執行模型又完全不同的概念。

ZNBase 的邏輯計劃由優化後的 Memo 自底而上構建出一個 Plan node 樹狀結構，為後續構建物理計劃添加一些額外的表信息，列信息等。

分布式執行的關鍵思想是如何從邏輯執行計劃到物理執行計劃，這裡主要涉及兩方面的處理，一個是計算的分布式處理，一個是數據的分布式處理。

一旦生成了物理計劃，系統就需要将其拆分并分布到各個 node 之間進行運行。每個 node 負責本地調度數據處理器 data processors 和輸入同步器 synchronizers。node還需要能夠彼此通信以将輸出 output Router 連接到 input synchronizer。特别是，需要一個 streaming interface 來連接這些組件。為了避免額外的同步成本，需要足夠靈活的執行環境以滿足上面的所有這些操作，以便不同的 node 除了執行計劃初始的調度之外，可以相對獨立的啟動相應的數據處理工作，而不會受到 gateway 節點的其他編排影響。

ZNBase 的集群中的 Gateway node 創建一個 Scheduler 調度器，它接受一組 flow，設置輸入和輸出相關的信息，創建本地 processor 并開始執行。在 node 對輸入和輸出數據進行處理的時候，我們需要對 flow 進行一些控制，通過這種控制，我們可以拒絕 request 中的某些請求。

怎麼看數據庫分布式架構（深入解析ZNBase分布式SQL引擎架構的五大服務組件）4

執行 Flow 示意圖

每個 Flow 表示整個物理計劃中跨節點執行的一個完整片段，由 processors 和 streams 組成，可以完成該片段的數據拉取、數據計算處理和最終得數據輸出。如下圖所示：

怎麼看數據庫分布式架構（深入解析ZNBase分布式SQL引擎架構的五大服務組件）5

計劃執行示意圖

對于跨節點的執行，Gateway node 首先會序列化對應的 FlowSpec 為 SetupFlowRequest，并通過 grpc 發送到遠端 node，遠端 node 接收後，會先還原 flow，并創建其包含的 processor 和交互使用的 stream（TCP 通道），完成執行框架的搭建，之後開始由網關節點發起驅動的多節點計算。Flow 之間通過 box 緩存池進行異步調度，實現整個分布式框架的并行執行。

對于本地執行，就是并行執行，每個 processor，synchronizer 和 router 都可以作為 goroutine 運行，它們之間由 channel 互聯。這些 channel 可以緩沖信道以使生産者和消費者同步。

為實現分布式并發執行，ZNBase 在執行時引入了 Router 的概念，對于 JOIN 和AGGREGATOR 等複雜算子根據數據分布特征，實現了三種數據再分布方式，mirror_router、hash_router 和 range_router，通過數據再分布實現 processor 算子内部拆分為兩階段執行，第一階段在數據所在節點做部分數據的處理，處理後結果，根據算子類型會進行再分布後，第二階段彙集處理，從而實現了單個算子多節點協作執行。

小結

本文介紹了基于谷歌 Spanner 論文設計的分布式 NewSQL 數據庫 ZNBase 的 SQL 引擎架構，并詳細介紹了每個節點中的連接服務、編譯服務、緩存服務，以及系統中的分布式目錄服務、分布式執行服務五大服務組件的技術原理與工作流程。下期文章我們将介紹在原有 SQL 引擎架構的基礎上，ZNBase 團隊針對編譯服務、分布式執行服務等組件進行的一系列優化改進工作。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

圖文翡翠烏雞色跟黑髒點怎麼區分
這兩三年【翡翠】市場上又掀起了一場“小黑色風暴”。還記得10多年前，墨翠的出現也是颠覆了很多人對黑色翡翠的認知，随着媒體大勢而來的就是：墨翠的價格很快追上了最好翡翠的“天花闆”，價格也是高的驚人。墨翠的黑就是綠的根，打燈後一片綠，可不打燈時... 2023-01-02
圖文朱一龍因為哪部劇火的多
朱一龍因為哪部劇火的多?出道十年因為一部網劇火了，有網友提問，朱一龍能火多久？，接下來我們就來聊聊關于朱一龍因為哪部劇火的多?以下内容大家不妨參考一二希望能幫到您!朱一龍因為哪部劇火的多出道十年因為一部網劇火了，有網友提問，朱一龍能火多久？... 2022-10-19
圖文呼和浩特有自助辦理身份證地方嗎
8月1日，呼和浩特市公安局建成全市首個居民身份證自助辦理區并正式開通運行，這也是内蒙古自治區範圍内首個真正意義上的居民身份證全自助辦理功能區，實現了居民身份證拍照、申領、領證全流程一體化自助辦理，傾力打造全天候一站式便捷服務功能區，是呼和浩... 2022-12-15
圖文我國要構建科學規範的制度體系
昨天，市政協召開議政性主席會議，圍繞“積極對接國際高水平自由貿易協定規則，推動‘兩區’建設取得新進展”專題協商議政。市政協聯合調研組（以下簡稱調研組）提出，推動“兩區”開展國際高水平自由貿易協定規則對接先行先試要始終堅持“為國家試制度”導向... 2023-01-07
圖文内雙用不用割雙眼皮
内雙像單眼皮：多數情況下，内雙外觀表現和單眼皮一般無二，但它又不像單眼皮，因為它具備一定的雙眼皮條件。内雙像雙眼皮：内雙在單眼皮的外觀下，隐藏着不明顯的小雙眼皮，但因眼皮過腫或是過于松馳的原因，一般情況下根本看不出來。隻能在做一些特殊表情時... 2023-04-04
圖文柱狀圖上加平均線怎麼加
我們都知道在做圖表的時候，有時候為了能夠看到數據是否達标，總是會在柱狀圖或折線圖裡面添加一條直值的達标平均線，這樣可以清晰的看到數據是否達标。今天我們就來完整的講解一下圖表中如何添加平均線。如上圖，在做12月人員銷售數據的時候，添加一條紅色... 2023-02-17
圖文傳統國學經典導讀
傳統國學經典導讀?張登軍《論語》是中國傳統文化的主要源頭之一在學術界，有“不學《論語》不足以談國學，不學《論語》不足以談中華傳統文化”的說法一部《論語》，從古至今曆代學者的注釋書籍超過3000種對于這樣一部偉大經典，應該怎樣去正确認識并閱讀... 2023-01-04
圖文 917路公交一天發車時間表
注意啦！注意啦！為更好的提升懷柔區公交服務水平提高乘客出行效率11月8日起懷柔區公交又有大動作啦快來看看吧~■2019年11月8日首車起，調整916公交線路及調整916快、H55路、H56路、H61路的營業時間。具體公交線路和營業時間往下看... 2023-02-25
圖文床頭擺放的大忌
卧室床頭的擺放十分重要，這關乎家庭風水的好壞，卧室是我們休息的地方床又占招财位，床頭的擺放大有講究，床頭擺放錯了，觸犯風水禁忌，破壞家庭風水，擺放不好，不僅影響身體，還會影響全家的運勢，所以在裝修入住時，擺放床就要設計好位置，床的上方不能有... 2023-01-12
圖文雷霆峭壁全金卡怎麼獲得
魔獸世界6.1暗月馬戲團4月新增鐵人拉力賽攻略，鐵人路霸成就完成方法。火箭神兵：黃金完成方法攻略。從今年三月每月初的暗月馬戲團都會增加一個全新的比賽坐騎來供玩家完成相應的成就任務，四月則額外開放了一個競速賽：鐵人拉力賽。讓我們看看相應的成就... 2023-03-18
圖文生肖兔10月運勢紅火财氣大順
兔的人，在去年中，屬兔人的運勢進入了蟄伏期。到了18年會遇到很多時機，送上門的時機一定要把捉住。建議屬兔人選擇最好的時機，而且專心緻志去極力。因為精力是無法懈怠的，不要三心二意。到了8月的時分，作業會變得格外順利，也懂得如何與夥伴們進行溝通... 2023-01-24
圖文二人戀情再添實錘
明日七夕，今天明星們紛紛爆出戀情是在為七夕預熱嗎？今天上午，吳昕戀情曝光。沒錯，就是你想的那個吳昕，《快樂大本營》的主持人、30多歲的單身女青年，這次終于不再是節目CP了。近日，有八卦媒體在北京偶遇吳昕深夜與一白衣男子一同回家中，幾天後，兩... 2023-02-02
圖文跆拳道黑帶成績排名
三湘都市報11月11日訊（記者葉竹）由中國跆拳道協會主辦、湖南省跆拳道運動協會承辦的“匠人工坊”之千人晉段考試于10日在省體育新城的廣場上舉行，1006名身着白色道服的跆拳道練習者通過禮儀、基本姿勢、柔韌、腿法、品勢、實戰等方面的考核，正式... 2023-01-14
圖文家中如何配制磷鉀肥
家中如何配制磷鉀肥?，我來為大家科普一下關于家中如何配制磷鉀肥?下面希望有你要的答案，我們一起來看看吧!家中如何配制磷鉀肥化學肥料簡稱化肥，用化學或者物理方法制成的含有一種或幾種農作物生長需要的營養元素的肥料。化肥的運用非常廣泛，而且用量少... 2022-12-28
圖文有一種死亡叫失去希望
有一種死亡叫失去希望?從冬月廿二八君子生日以來，已經持續日更寫作五天了，今天本來想寫一篇文章，以專門紀念君子的周歲生日，但是實在又寫不了……，我來為大家科普一下關于有一種死亡叫失去希望?下面希望有你要的答案，我們一起來看看吧!有一種死亡叫失... 2022-10-14
圖文昆明藍花楹最佳拍照地
清新詩意的藍花楹5月以來，伴随着三角梅、波斯菊、紫薇等相繼開花，成都高新區的大街小巷又換上了色彩明豔的“夏裝”。細心的市民發現，天府三街的藍花楹已經盛開，姿态優雅的樹枝上綻放着藍紫色的花朵，顯得清新活潑。這也是天府三街打造花樹主題大街後迎來... 2022-12-05
圖文盤點動漫界的四大渣男
在如今的這個社會裡，渣男一詞可以說是越來越常用了，一般來說，渣男經常被妹子們用來形容那些人品和行為都非常差勁的男生。而在動漫中也是如此，并不是每個主角都是那麼的正直，溫柔，待人友善的，也是有存在着一些渣男的，一起來看看動漫中4個有名的渣男吧... 2022-11-20
圖文 oppo下半年發布
近期，互聯網商業智能服務商QuestMobile官方發布2022中國智能終端市場半年報告。QuestMobile數據顯示，智能終端市場需求持續放緩，2022年2月-6月，月總體出貨量分别為1,455萬部、2,103萬部、1,769萬部、2,... 2023-01-07
圖文世界最難找的三個神獸
一組鹿晗傻狍子的表情包，在《奔跑吧兄弟3》播放兩期之後，橫空出世，原來美少年鹿晗一點都沒有偶像包袱，比Angelababy還不要偶像包袱，鹿晗也知道自己藏不住自己的表情,不過小編想說表情确實挺傻的那麼為森莫鹿晗被叫傻狍子呢？傻狍子是個動物，... 2023-01-03
圖文大王卡變不限量套餐
自從聯通接二連三的推出各種互聯網套餐後，号稱非常“堅挺”的移動也不得不推出優惠的互聯網套餐，而電信似乎“觀望”了它們兩一段時間後，也終于有所舉動。近期中國電信表示，全新的“王中王卡套餐”即将上線，不過它的宣傳語為“大王不好了，王中王來了”，... 2022-11-24
圖文八哥跟烏鸫的區别
長安聽百舌韋鼎（南北朝）萬裡風煙異，一鳥忽相驚。那能對遠客，還作故鄉聲。去年夏天，在家門前發現了一隻死鳥。我不太認識鳥，就問大奧，他說是Amsel（德語），我用谷歌翻譯一查...翻譯寫的是“黑鳥”...英語更狠，直接就叫blackbird.... 2023-01-07
圖文如何快速成為一名外賣騎手
疫情來了之後，很多人做了“外賣小哥”，我也依賴送餐熬過了最艱難的幾個月。後來雖然有了别的工作，可休息的時候依然喜歡騎上電動車，繼續在大街小巷裡穿梭送餐。那種戶外工作的快樂，還有即時變現的收入，都會給我格外的愉悅。現在總結一下自己的經驗，送給... 2023-03-26
圖文矯正胎齡有什麼意義
什麼是胎齡評估？胎齡評估有什麼作用和意義呢？下面和小編一起來了解一下吧！一般在孕12周以後，胎兒頭部可以清晰顯示。因此從孕12周以後就可以通過B超對胎兒頭部各項指标進行測量，并以此來評估胎齡的大小。但在孕16周前和26周以後，因每個胎兒發育... 2023-02-26
圖文羽毛球最強必殺技
羽毛球是一個容易入門的娛樂活動，有拍有球就能打；但又是一個紛繁複雜的競技項目，單是吊球一項就可以細分為點吊、劈吊、收吊、攔吊等。除了入門階段的搓、勾、放、挑、高、吊、殺、擋等基礎技術外還有滑闆推球、背後接球等進階技術。在比賽中，我們不難發現... 2023-02-27
圖文管控區和封控區哪個管理更嚴格
管控區和封控區哪個管理更嚴格?石榴雲快訊4月9日晚，烏魯木齊市人民政府新聞辦公室召開新冠肺炎疫情和疫情防控工作情況新聞發布會會上，烏魯木齊市衛生健康委員會副主任常建梅就醫學觀察人員解除情況以及已劃定的封控區、管控區、防範區解除标準做進一步介... 2023-02-08
圖文飛機上帶特産沒打包可以麼
春節長假已經結束，返程之旅上許多旅客手中都大包小包拎着充滿“家鄉味”行李。四川臘肉、大連海鮮、遼甯的高粱酒、自家的腌菜等地道美食，可并不是想帶都能帶哦。南航西安分公司提醒旅客注意，以下幾類物品是旅客經常随身攜帶，但卻被明令禁止上飛機的：醬貨... 2023-01-13
圖文和田玉悟道挂件寓意
在古代，母親會為即将出嫁的女兒梳頭。“一梳梳到底，二梳白發齊眉，三梳子孫滿堂”，以祝願女兒在接下來的婚姻生活和諧幸福。“結發同心”，“以梳為禮”，古人常把三千青絲比作甜蜜纏綿的情絲。剪不斷的情絲千千結，“結發同心”，“擇一人終老”，代表了戀... 2022-12-11
圖文大逃殺手遊叫什麼
最近幾個月，“大逃殺”占據了整個遊戲圈的眼球，無數的廠商都想分得這一新穎玩法帶來的流量紅利，随之而來的是一大批打着“吃雞”、“大逃殺”、“絕地求生”标簽的遊戲，這場争奪戰，在手遊領域打得最為火熱。比如最近在TapTap的預約榜，大逃殺類手遊... 2022-12-12
圖文 yousee的漢語意思是什麼
記住：“Isee”的意思不是“我看看”Isee:我明白了√例句：NowIseethatIwaswrong.現在我知道我錯了。, 2023-02-05
圖文濃香蘑菇豬排漢堡
芝士牛排菇漢堡用牛排菇做的漢堡，竟然比肉還好吃，吮指推薦！By小單味用料牛排菇3組雞蛋2個（1個蛋黃）鹽少許黑胡椒粉少許混合芝士100克蔥蒜粉少許橄榄油少許面粉少許面包糠少許黃油一小塊漢堡胚3個生菜1顆番茄1個美乃滋100克黃芥末15克番茄... 2022-12-15

tft每日頭條

> 圖文

> 怎麼看數據庫分布式架構

怎麼看數據庫分布式架構

相关圖文资讯推荐

热门圖文资讯推荐

网友关注