tft每日頭條

 > 科技

 > 分布式數據倉庫和nosql

分布式數據倉庫和nosql

科技 更新时间:2024-08-13 02:15:22

在 I/O 2022 開發者大會首日,Google 隆重推出了名為 AlloyDB 的全托管式 PostgreSQL 數據庫。與亞馬遜雲服務(AWS)的 Aurora PostgreSQL 競品相比,Google 宣稱 AlloyDB 具有翻倍的效率。此外在相同的工作負載下,AlloyDB 的運行效率可達标準 PostgreSQL 的四倍、分析查詢的速度也快了百倍。

分布式數據倉庫和nosql(IO2022)1

熟悉 Google Cloud 生态的開發者,或許不會對全管型 PostgreSQL 數據庫服務感到陌生。

此前該公司已經為 PostgreSQL 和 Spanner 提供了 CloudSQL,且 Google Cloud 的全管理關系數據庫服務也提供了 PostgreSQL 兼容接口。

AlloyDB 的核心,仍基于标準的 PostgreSQL 數據庫來實現。隻是為了能夠充分發揮谷歌自家基礎設施的實力,開發團隊才對于其内核進行了修改、同時努力保持在最新的版本狀态。

分布式數據倉庫和nosql(IO2022)2

在 AWS 工作了很長一段事件後,Andi Gutmans 于 2020 年跳槽到了 Google、并擔任數據庫産品的主管兼工程副總裁。

他表示,盡管 Google 在幫助企業将 MySQL 和 PostgreSQL 遷移到雲端的工作中提供了很大的幫助,但還是未能充分照顧到那些想要遷移其遺留數據庫(比如 Oracle)到開源服務的部分客戶。

究其原因,是因為許多企業用到了不止一個雲服務提供商,同時希望能夠盡可能靈活地在任何地方運行。在拖延了多年後,目前正有越來越多的客戶願意投入資源來擺脫相關束縛。

随着 Postgres 的崛起(以及 MySQL 的衰落)、并逐漸成為開源關系數據庫的事實标準,Google 推動客戶向專用的高性能 PostgreSQL 服務遷移的動力也變得更加充足。

分布式數據倉庫和nosql(IO2022)3

Gutmans 補充道:許多 Google 客戶正希望将他們的關系數據庫用于分析用例,因而該 AlloyDB 開發團隊耗費了大量的精力來确保 Postgres 能夠為這部分用戶帶來更好的性能體驗。

在 AWS 工作期間,他曾帶領過 AWS 諸多分析服務的管理工作,有機會了解到數據對客戶的重要性和關鍵性、并且積攢下了深厚的技術背景。

不過随着行業風向的轉變,與之交談的不再一定是一線開發人員 —— 甚至不少客戶來自業務部門、或以分析師的身份來接洽。

在看到現實世界在如此融合的同時,他也切實感受到了用戶希望從他們的數據中獲得實時的洞察力。

分布式數據倉庫和nosql(IO2022)4

回到技術底層,可知 AlloyDB 建立在 Google 現有的基礎架構之上、可将計算和存儲剝離開來 —— 與運行 Spanner、BigQuery 和幾乎所有 Google 服務的基礎架構層類似。

除了專注于 PostgreSQL 的 AlloyDB,相關服務也已在競争中占據了相當大的優勢。然而在努力支持多個數據庫引擎 / 查詢語言的時候,你并不總能開展面面俱到的優化。

鑒于企業要求使用 Postgre 來遷移這些遺留數據,Google 最終決定在該領域做到頂尖。通過内核級的更改,該團隊已實現超過 64 個虛拟内核的線性擴展。

而在分析方面,AlloyDB 團隊也打造了一套基于機器學習的定制緩存服務來學習客戶的訪問模式。然後将 Postgres 的行格式轉換為内存中的列格式,以顯着提升執行的效率。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved