clickhouse架構原理-tft每日頭條

clickhouse架構原理

生活更新时间:2026-07-27 09:13:08

ClickHouse是一個面向聯機分析處理(OLAP)的開源的面向列式存儲的DBMS，簡稱CK, 與Hadoop, Spark相比，ClickHouse很輕量級,由俄羅斯第一大搜索引擎Yandex于2016年6月發布, 開發語言為C

ClickHouse的特點:

開源的列存儲數據庫管理系統，支持線性擴展，簡單方便，高可靠性，

容錯跑分快：比Vertica快5倍，比Hive快279倍，比MySQL快800倍,其可處理的數據級别已達到10億級别

功能多：支持數據統計分析各種場景，支持類SQL查詢，異地複制部署

clickHouse的性能:

低延遲：對于數據量（幾千行，列不是很多）不是很大的短查詢，如果數據已經被載入緩存，且使用主碼，延遲在50MS左右。

并發量：雖然 ClickHouse 是一種在線分析型數據庫，也可支持一定的并發。當單個查詢比較短時，官方建議 100 Queries / second。

寫入速度：在使用 MergeTree 引擎的情況下，寫入速度大概是 50 - 200 M / s，如果按照 1 K 一條記錄來算，大約每秒可寫入 50000 ~ 200000 條記錄每秒。如果每條記錄比較小的話寫入速度會更快

其主要的應用場景: 用于結構良好清晰且不可變的事件或日志流分析

Web和App分析，廣告網絡和RTB，電信，電子商務和金融，信息安全，監測和遙感，時間序列，商業智能，網絡遊戲，物聯網

需要注意的是: 由于clickHouse不支持事務操作, 顧不能作為傳統數據庫來使用(OLTP),以及高請求率的鍵值訪問，Blob或文檔存儲，超标準化數據

安裝clickHouse:

添加yum源 (一行内容)

yum-config-manager --add-repo http://repo.red-soft.biz/repos/clickhouse/repo/clickhouse-el6.repo

執行安裝(一行内容)

yum install clickhouse-server clickhouse-client clickhouse-server-common clickhouse-compressor

啟動clickHouse

/etc/init.d/clickhouse-server start

啟動以後可以看到三個端口

9000端口，用于接受客戶端請求

9009端口，用于集群複制數據

8123端口，http請求端口

登錄clickHouse:

第一種方式(連接本地): /etc/init.d/clickhouse-client第二種方式(連接遠程): /etc/init.d/clickhouse-client --host=… --port=… --user=… --password=…

登錄後, 其基本操作采用類SQL的方式即可使用, 但需要注意, 在建表時候, 需要開啟多行查詢, 否則建表時候會報錯

開啟多行查詢的方式:

clickhouse-client -m 或者: clickhouse-client --multiline

————————————————

clickhouse架構原理（ClickHouse基本介紹與其他OLAP比較）1

在看Clickhouse 運行場景之前要了解技術的功能特性以及弊端是一個技術架構以及開發人員所要了解的。隻有”知己知彼”才可以”百戰不殆”,接下來我們看一下Clickhouse的具體特點；

Ø 1.真正的面向列的DBMS

Ø 2.數據高效壓縮

Ø 3.磁盤存儲的數據

Ø 4.多核并行處理

Ø 5.在多個服務器上分布式處理

Ø 6.SQL語法支持

Ø 7.向量化引擎

Ø 8.實時數據更新

Ø 9.索引

Ø 10.适合在線查詢

Ø 11.支持近似預估計算

Ø 12.支持嵌套的數據結構

Ø 支持數組作為數據類型

Ø 13.支持限制查詢複雜性以及配額

Ø 14.複制數據複制和對數據完整性的支持

#我們來看看其中的一些功能：

1.真正的面向列的DBMS

在一個真正的面向列的DBMS中，沒有任何“垃圾”存儲在值中。例如，必須支持定長數值，以避免在數值旁邊存儲長度“數字”。例如，十億個UInt8類型的值實際上應該消耗大約1 GB的未壓縮磁盤空間，否則這将強烈影響CPU的使用。由于解壓縮的速度（CPU使用率）主要取決于未壓縮的數據量，所以即使在未壓縮的情況下，緊湊地存儲數據（沒有任何“垃圾”）也是非常重要的。

因為有些系統可以單獨存儲單獨列的值，但由于其他場景的優化，無法有效處理分析查詢。例如HBase，BigTable，Cassandra和HyperTable。在這些系統中，每秒鐘可以獲得大約十萬行的吞吐量，但是每秒不會達到數億行。

另外，ClickHouse是一個DBMS，而不是一個單一的數據庫。ClickHouse允許在運行時創建表和數據庫，加載數據和運行查詢，而無需重新配置和重新啟動服務器。

2.數據壓縮

一些面向列的DBMS（InfiniDB CE和MonetDB）不使用數據壓縮。但是，數據壓縮确實提高了性能。

3.磁盤存儲的數據

許多面向列的DBMS（SAP HANA和GooglePowerDrill）隻能在内存中工作。但即使在數千台服務器上，内存也太小，無法在Yandex.Metrica中存儲所有浏覽量和會話。

4.多核并行處理

多核多節點并行化大型查詢。

5.在多個服務器上分布式處理

上面列出的列式DBMS幾乎都不支持分布式處理。在ClickHouse中，數據可以駐留在不同的分片上。每個分片可以是用于容錯的一組副本。查詢在所有分片上并行處理。這對用戶來說是透明的。

6.SQL支持

如果你熟悉标準的SQL，我們不能真正談論SQL的支持。NULL不支持。所有的函數都有不同的名字。JOIN支持。子查詢在FROM，IN，JOIN子句中被支持;标量子查詢支持。關聯子查詢不支持。

7.向量化引擎

數據不僅按列存儲，而且由矢量 - 列的部分進行處理。這使我們能夠實現高CPU性能。

8.實時數據更新

ClickHouse支持主鍵表。為了快速執行對主鍵範圍的查詢，數據使用合并樹(MergeTree)進行遞增排序。由于這個原因，數據可以不斷地添加到表中。添加數據時無鎖處理。

9.索引

例如，帶有主鍵可以在特定的時間範圍内為特定客戶端（Metrica計數器）抽取數據，并且延遲時間小于幾十毫秒。

10.支持在線查詢

這讓我們使用該系統作為Web界面的後端。低延遲意味着可以無延遲實時地處理查詢，而Yandex.Metrica界面頁面正在加載（在線模式）。

11.支持近似計算

1.系統包含用于近似計算各種值，中位數和分位數的集合函數。

2.支持基于部分（樣本）數據運行查詢并獲得近似結果。在這種情況下，從磁盤檢索比例較少的數據。

3.支持為有限數量的随機密鑰（而不是所有密鑰）運行聚合。在數據中密鑰分發的特定條件下，這提供了相對準确的結果，同時使用較少的資源。

12.數據複制和對數據完整性的支持。

使用異步多主複制。寫入任何可用的副本後，數據将分發到所有剩餘的副本。系統在不同的副本上保持相同的數據。數據在失敗後自動恢複

ClickHouse的不完美：

Ø 1.不支持事物。

Ø 2.不支持Update/Delete操作。

Ø 3.支持有限操作系統。

現在支持ubuntu,centos 需要自己編譯，不過有熱心人已經編譯好了，拿來用就行。對于Windows 不支持。

四．ClickHouse應用場景

自從ClickHouse2016年6月15日開源後，ClickHouse中文社區随後成立。中文開源組開始以易觀，海康威視,美團，新浪，京東,58,騰訊,酷狗音樂和俄羅斯開源社區等人員組成，随着開源社區的不斷活躍，陸續有神州數碼，青雲，PingCAP，中軟國際等公司成員加入以及其他公司成員加入。初始在群裡讨論技術後續有一些大型公司陸續運用到項目中，介于分享不方便問題解決，建立了相應的論壇。根據交流得知一些大公司已經運用。

#可以應用以下場景：

1.電信行業用于存儲數據和統計數據使用。

2.新浪微博用于用戶行為數據記錄和分析工作。

3.用于廣告網絡和RTB,電子商務的用戶行為分析。

4.信息安全裡面的日志分析。

5.檢測和遙感信息的挖掘。

6.商業智能。

7.網絡遊戲以及物聯網的數據處理和價值數據分析。

8.最大的應用來自于Yandex的統計分析服務Yandex.Metrica，類似于谷歌Analytics(GA)，或友盟統計，小米統計，幫助網站或移動應用進行數據分析和精細化運營工具，據稱Yandex.Metrica為世界上第二大的網站分析平台。ClickHouse在這個應用中，部署了近四百台機器，每天支持200億的事件和曆史總記錄超過13萬億條記錄，這些記錄都存有原始數據（非聚合數據），随時可以使用SQL查詢和分析，生成用戶報告。

五．ClickHouse 和一些技術的比較

1.商業OLAP數據庫

例如：HP Vertica, Actian the Vector,

區别：ClickHouse是開源而且免費的

2.雲解決方案

例如：亞馬遜RedShift和谷歌的BigQuery

區别：ClickHouse可以使用自己機器部署，無需為雲付費

3.Hadoop生态軟件

例如：Cloudera Impala, Spark SQL, Facebook Presto , Apache Drill

區别：

ClickHouse支持實時的高并發系統

ClickHouse不依賴于Hadoop生态軟件和基礎

ClickHouse支持分布式機房的部署

4.開源OLAP數據庫

例如：InfiniDB, MonetDB, LucidDB

區别：這些項目的應用的規模較小，并沒有應用在大型的互聯網服務當中，相比之下，ClickHouse的成熟度和穩定性遠遠超過這些軟件。

5.開源分析，非關系型數據庫

例如：Druid , Apache Kylin

區别：ClickHouse可以支持從原始數據的直接查詢，ClickHouse支持類SQL語言，提供了傳統關系型數據的便利。

六．總結

在大數據分析領域中，傳統的大數據分析需要不同框架和技術組合才能達到最終的效果，在人力成本，技術能力和硬件成本上以及維護成本讓大數據分析變得成為昂貴的事情。讓很多中小型企業非常苦惱，不得不被迫租賃第三方大型公司的數據分析服務。

ClickHouse開源的出現讓許多想做大數據并且想做大數據分析的很多公司和企業耳目一新。ClickHouse 正是以不依賴Hadoop 生态、安裝和維護簡單、查詢速度快、可以支持SQL等特點在大數據分析領域越走越遠。
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活雪茄常識100種
古巴有着形形色色的标簽，但對于國内老一輩的人而言，古巴的印象無疑是由大胡子卡斯特羅和遊擊偶像切·格瓦拉組成的。而在年輕一輩的眼裡恐怕就變成了滿嘴騷話的傑克船長駕駛着黑珍珠号馳騁的加勒比海。不過不管認知差異有多大也不管你是年輕還是年老作為世界... 2022-12-26
生活許嵩跟周傑倫歌曲對比
我想大多90後應該對前幾年網絡爆紅歌手許嵩都有所了解吧，當年我在初中時期也是無意間聽了他的《城府》後便開始喜歡他的，爆紅歌曲還有灰色頭像，斷橋殘雪，多餘的解釋，素顔等等，現在的許嵩寫詞造詣更上一層樓，并且改了音樂的風格，但是也依舊好聽。當年... 2023-02-20
生活什麼的臉型适合披發
一個人好不好看，歸根到底還是看五官，而發型就是幫你襯托或者是遮擋五官不完美的，一般而言，紮起頭發來，更突出臉部線條和五官，而放下頭發來，就比較柔和五官。那麼，你究竟是更适合紮起頭發還是披着頭發呢？适合紮發的臉型：臉短的KatieHolmes... 2022-12-30
生活生活中養護肝髒堅持做好五件事
肝病患者養肝、護肝都需要注意什麼？和正常人有什麼區别？第一是平衡膳食，有比較均衡的營養；比如普通的健康人，偶爾喝一點酒，可能沒有很大的傷害，而對于慢性肝病的人，建議嚴格戒酒，盡量滴酒不沾。在飲食上乙肝病人要注意低鹽低脂飲食，減少脂肪的攝入；... 2022-12-03
生活天天向上電台主播是哪一期
, 2022-12-12
生活床單和床笠的差距是什麼
床單和床笠是我們日常生活中經常見到的兩種床上用品。對于這兩者比較常用到的床上用品，相信床單對于大家來說是比較熟悉的。床單與床笠有什麼區别？下面就帶您詳細地了解一下床笠和床單的性能及優缺點。1.床笠和床單的比較什麼是床笠床笠就是直接套在床墊上... 2022-12-12
生活紅領巾的國标是什麼
紅領巾的國标是什麼?本報訊（中青報·中青網記者楊寶光）近日，國家市場監督管理總局、國家标準化管理委員會批準發布新版《紅領巾》國家标準（GB/T28846-2022）該标準由共青團中央、全國少工委會同相關單位編制，現在小編就來說說關于紅領巾的... 2023-02-20
生活北京天空出現神秘光線這到底是啥
來源：北京晚報【#北京現藍太陽專家解讀#】4月21日，北京迎來沙塵天氣。有網友發現，天上的太陽變成了藍色，就好像在火星上看到的太陽一樣。專家表示，這是由于沙塵裡的顆粒物散射和吸收了波長更長的紅光導緻紅光減少，所以太陽看起來是藍色的。提示：請... 2022-12-30
生活十二生肖每日運勢辰龍
屬龍人一生運勢綜述生肖龍在十二生肖中排名第五位，生年地支為辰土。在中國傳統文化中，龍是皇權的象征，代表高貴和尊榮，也是幸運和成功的标志。在中國古代神話中，黃帝和炎帝都是龍的兒子，作為炎黃子孫的中國人，自然也就是“龍的傳人”。一生運勢：龍年生... 2022-11-15
生活 word快速填表
說起複制粘貼，大家肯定都不陌生，但是如果需要連續的複制粘貼，那麼我們應該怎麼辦呢？在辦公時我們可能會遇到很多填表的工作，如果利用好Word中的剪切闆，就能夠快速填表，節省時間，提高效率，下面這篇文章就是分享的，如何用Word剪切闆快速填表的... 2023-01-03
生活魚排的做法
魚排的做法?食材：魚排400克、花椒面1小勺、面粉2湯匙、澱粉半湯匙、面粉2湯匙、澱粉半湯匙、鹽适量、胡椒粉少許、食用油200毫升、姜1小塊，下面我們就來說一說關于魚排的做法?我們一起去了解并探讨一下這個問題吧!魚排的做法食材：魚排400克... 2022-08-17
生活華東五省是哪幾個省
華東五省是哪幾個省?華東五省是指在一般情況下，在說華東五省時，往往說成“華東五省一市”，這“五省一市”包括浙江省、江蘇省、上海市、安徽省、江西省、福建省，我來為大家科普一下關于華東五省是哪幾個省?下面希望有你要的答案，我們一起來看看吧!華東... 2022-06-11
生活常用字詳解29
常用字範式之三十八、六畫之十二：沖：沖：從沖省。（康熙字典第303頁：“《韻會》：‘沖或省作沖’。”）。沖：繁體字寫作“沖”《說文解字》：“沖，湧搖也。從水、中。”。（水：參見四畫之三“水”）（中：參見四畫之二“中”）水、中兩範式疊加，猶注... 2023-03-25
生活韓國流感喪屍電視劇有哪些
自從《釜山行》掀起亞洲喪屍熱之後，韓國就在開發喪屍題材的道路上一去不複返。無論是電影還是電視劇，無論是現代還是古裝，無論是恐怖還是搞笑，甚至是權謀鬥争都能摻入喪屍元素。對喪屍的癡迷程度已經達到，連情人節都要看喪屍談戀愛——《奇妙的家族》。以... 2022-12-31
生活 c1增a3駕照需要考什麼
A1駕照要求很苛刻的。除身體條件外，還必須年齡必須22周歲以上。而A1是不能直接報考的。必須通過B1，B2，A3和A2來增駕的。C照是不能增駕A1的。如果想取得A1資質，可以有以下幾個途徑。增駕A1C照滿一年，可增駕B2，A3，C照滿2年可... 2023-01-21
生活清香木的盆栽養護方法
清香木的盆栽養護方法?土壤：盆栽清香木使用疏松且排水性好的土壤最佳，适合的土壤對它生長十分有利家庭養殖可以用壤土、泥炭、腐殖土混合均勻配制使用，太黏重的土壤盡量不要用，今天小編就來聊一聊關于清香木的盆栽養護方法?接下來我們就一起去研究一下吧... 2022-06-09
生活 vc産品推薦大牌
随着進出口貿易的發展，很多進口水果進入我們的視線，百香果就是其中一種。百香果原産巴西，分紫果和黃果兩大類，有“果汁之王”之稱。入藥具有興奮、強壯之效。百香果是什麼百香果是什麼呢？百香果又名雞蛋果，原産巴西，主要分紫果和黃果兩大類，外形長得像... 2022-12-20
生活 4月新番到哪看
（更多精彩，關注微信公衆号“ACG次元喵”~喵）進擊的巨人第二季首播：2017年4月1日22點整類型：動作,冒險路人女主的養成方法第二季首播：2017年4月13日00點55分類型：劇情,搞笑,日常我的英雄學院第二季首播：2017年3月25日... 2023-01-09
生活背單詞的具體步驟
考研英語大綱要求5500左右的詞彙量，而大學四六級的詞彙則是4000左右，針對大部分同學而言，其詞彙量還是達不到大綱的要求，所以我們需要在備考期間拓展詞彙，而且考研的常考點和重難點是一詞多義、熟詞僻義。考過四六級的同學，對考研詞彙量大緻能比... 2022-12-16
生活河南省殘疾人兩項補貼提高多少
大河報·大河客戶端記者蔡君彥殘疾人“兩項補貼”制度是國家專門為殘疾人制定的一項重要福利制度，在扶貧助殘工作中發揮着重要作用，那麼，河南的殘疾人“兩項補貼”制度的實施情況如何?9月18日上午，記者從省政府新聞辦新聞發布會上獲悉，目前，我省是全... 2023-03-12
生活武清今天夜間還有大風嗎
今天武清氣象部門發布重要天氣預報12日至13日武清有強降雪天氣！受暖濕氣流和冷空氣共同影響，預計12日至13日我區将有強降雪天氣，過程累計降雪量為大到暴雪，氣溫大幅下降。此次天氣過程具有降雪時間長、累計雪量大、降溫明顯、能見度低的特點。武清... 2023-04-03
生活去除口臭的有效方法吃什麼菜
吃飯時現在人生活中的頭等大事，一日三餐怎麼吃，現在人越來越講究。現代人的生活水平提高很多，吃飯已經不像以前，隻為了填飽肚子，更在意的是能否給身體帶來營養和健康。現在的大雨大肉，已經不再受人青睐，人們更喜歡一些野菜野果了，不僅因為它們能給飲食... 2023-03-23
生活保溫一體闆是什麼材料做成的
現在人們對于裝修更加注重品質和安全性，在裝修材料的選擇上也是多方對比，不知道大家有沒有聽說過保溫一體闆，那麼保溫一體闆是什麼呢?保溫一體闆和普通保溫闆有哪些區别呢?無錫裝修公司這就來跟大家詳細講解。保溫一體闆是什麼保溫一體闆，它是由保溫層、... 2022-12-19
生活盤點魔改版的奧特曼遊戲
現在二次元愛好者對各種角色的接受度真是與時俱進，怪獸娘化都能狂戳lsp們的萌點？！雖然很想說一句“人不能，至少不應該”，但看到所謂的“怪獸娘”後，不禁老臉一紅，反正我可以了！估計圓谷也get到奧迷們的“小心思”，還專門出了個《奧特怪獸拟人計... 2022-11-18
生活支付寶怎樣走向全球
支付寶生活頻道變身存量時代，品牌在公域的獲客成本逐漸增加，私域的流量價值愈發凸顯。為了成為商家的自運營陣地，支付寶逐漸打開了流量大門，向私域邁進。據報道，占據支付寶底部C位流量位的生活頻道開始灰度測試新功能。支付寶的生活頻道新增“關注”和“... 2023-02-04
生活劉邦和劉備是不是一個人
劉邦是漢朝時期的開國皇帝，公元前256年出生于沛豐邑中陽裡。劉邦并不是什麼大戶人家出生，隻是一個普普通通農家出生的人。秦朝末年，國家亂的不成樣子，陳勝吳廣也趁此機會發動農民起義，推翻秦王朝的統治。劉邦并不想要在農田裡度過自己的一生，于是在陳... 2022-12-12
生活慶國慶水上樂園
一年一度的中國柳州國際水上狂歡節又要來臨了，小夥伴們一定非常想了解狂歡節準備的怎麼樣了，作為柳州國慶假期一道标志的風景線，柳州市各部門通力合作，力求将今年的狂歡節做出精彩，做出活力。今天（7日）下午，負責籌辦此次活動的各個部門聚在一起，召開... 2023-01-04
生活競賽口号霸氣押韻簡短
競賽口号霸氣押韻簡短?揮動激情，挑戰自我，突破極限，超越自我，接下來我們就來聊聊關于競賽口号霸氣押韻簡短?以下内容大家不妨參考一二希望能幫到您!競賽口号霸氣押韻簡短揮動激情，挑戰自我，突破極限，超越自我與時俱進，開拓創新，頑強拼搏，勇奪第一... 2022-08-18
生活無人對得工整的上聯
戰争一直都是被人們所厭惡的，不論是古代還是現代，戰争都會給人們帶來巨大的災難。在初唐時期有兩位才子，他們見到天下一統之後，心中十分開心，于是出了一個十分經典的對聯，今天就讓我來為大家講一講這個故事。隋朝的隋炀帝荒淫奢侈，天下的百姓遭到了壓榨... 2022-12-17
生活為什麼種植牙價格低
為什麼種植牙價格低?來源：法治日報編者按，現在小編就來說說關于為什麼種植牙價格低?下面内容希望能幫助到你，我們來一起看看吧!為什麼種植牙價格低來源：法治日報編者按一顆種植牙少則幾千元，多則上萬元——種植牙價格昂貴，一直是困擾群衆的民生痛點。... 2022-12-06

tft每日頭條

> 生活

> clickhouse架構原理

clickhouse架構原理

相关生活资讯推荐

热门生活资讯推荐

网友关注