“分布式”是一種架構風格,用其實現“數據存儲”,最現實的目的是為了打開數據庫産品的性能天花闆,并保證系統的高可靠,進一步展開,“分布式數據庫”的作用主要有兩點:
支持水平擴展,保證高性能
通過增加機器節點的方式提升系統整體處理能力,擺脫對專用設備的依賴,并且突破專用設備方案的性能上限。這裡的機器節點,通常是要支持X86服務器。
廉價設備 軟件,保證高可靠
在單機可靠性較低的前提下,依靠軟件保證系統整體的高可靠,又可以細分為“數據存儲的高可靠”和“服務的高可靠”。總之,任何單點的故障,可能會帶來短時間、局部的服務水平下降,但不會影響系統整體的正常運轉。
從技術架構上劃分,目前的“分布式數據庫”主要有以下幾種:
MPP
Hadoop技術生态
Like-Mesa
不同的架構都有其各自的優勢,而用戶的複雜商業問題往往需要應用到多種架構的系統,目前市面上很少有能提供多架構的數據庫産品,已知的有億信的petabase。
PetaBase是基于開源平台基礎上開發的、具有軟件著作權的國産分布式數據庫系統産品。PetaBase被設計為全新的SQL on Hadoop解決方案,在開源SQL引擎之上進行了大量SQL功能增強和性能優化,性能提升數倍甚至上百倍,并且集成多項管理工具,使其更适合在Hadoop上進行大規模數據分析、檢索、查詢。
國産分布式數據庫
PetaBase-i 是基于開源平台基礎上開發的、具有軟件著作權的國産分布式數據庫系統産品。PetaBase-i 被設計為全新的SQL on Hadoop解決方案,在開源SQL引擎之上進行了大量SQL功能增強和性能優化,性能提升數倍甚至上百倍,并且集成多項管理工具,使其更适合在Hadoop上進行大規模數據分析、檢索、查詢。
PB級數據處理
PetaBase-i 采用MPP架構,及優化的列存儲格式,結合存儲分區、分布式緩存等技術,并針對特定SQL和函數進行性能優化,充分利用集群多節點的計算能力和内存,能支持複雜的多表JOIN。10億級數據規模以上,比傳統RDBMS數據庫快10倍以上,TB級數據規模下,比Hive快數倍甚至上百倍。PetaBase-i 動态線性擴展能力,更可滿足PB級以上大規模數據的處理。
線性擴展高彈性
PetaBase-i 支持線性擴展,具有高可伸縮性,随着集群節點數的擴充,其查詢并發能力将随節點數增加而增大。而查詢的響應時間,也會随着節點數的增多而縮短。
PetaBase-i 為主/從模式的集群架構,主節點上保存有系統元數據,但是當主節點挂掉時,整個集群都無法使用,為此,PetaBase-i 支持配置為高可用的部署模式,即将單台主節點架設為二台主節點,一台處于活動狀态,一台處理待命狀态,從而保證系統的高可用性和高穩定性。
簡單易用快速交付
作為一款通用的國産數據庫産品,PetaBase-i 兼容标準的SQL語法,提供多種應用程序接口,包括JDBC、ODBC、CLI、Thrift等,因此能支持幾乎所有的ETL工具産品。基于這些特性,用戶基于傳統數據庫開發的應用系統可無縫遷移到PetaBase-i ,從而降低企業對系統移植的轉化成本,同時讓客戶的現有數據庫開發人員擁有通過SQL就可以使用Hadoop的技術能力,加速PetaBase-i 應用項目的快速落地。
為了讓數據庫的管理更易用,PetaBase-i 提供可視化監控儀表盤、集中化集群管理、類PL/SQL Developer IDE的數據庫管理等功能,方便管理人員即時了解整個數據庫系統的整體運行和資源使用情況,便于必要時采取相應的措施。
工程化部署輕運維
相比開源軟件,PetaBase-i 具有集成化優勢,内置Hadoop基礎組件、支持多種策略的負載均衡、SQL語句和JDBC驅動雙向優化、獨有的可視化管理控制台、數據遷移工具、友好的安裝腳本等,從整體上節省軟件開銷,降低使用和運維門檻,方便、有效的保證大數據系統的落地部署,工程化實施。
批流一體化
PetaBase-i 借鑒大數據處理架構Lambda,将變化的數據并行寫到批和流處理系統内,将不同的計算邏輯分别在流和批系統中實現,并且在查詢階段合并流和批的計算視圖并展示給用戶。
其基于Hadoop開源組件打造的可以複用、簡化的大數據實時分析架構模式,架構方案即開即用,易搭建免運維,可提供TB級以上的結構化數據存儲、秒級延遲的服務能力,支持用戶以流式消費或批處理方式寫入實時數據和存量數據,并對結果視圖進行實時查詢和分析,輕松應對離線實時一體化,真正意義上滿足了用戶對不斷變化的曆史數據和實時數據的分析需求。
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!