carbondata性能-tft每日頭條

carbondata性能

科技更新时间:2026-08-01 23:17:32

Apache CarbonData 是由華為發起并開源的一種高性能數據存儲格式，通過新的融合數據存儲方案，以一份數據同時支持多種應用場景，解決了當前業界因分析場景需求各異而導緻的存儲冗餘等問題。同時，CarbonData 通過多級索引、字典編碼、列存等特性提升 IO 掃描和計算性能，實現百億數據級秒級響應，它的出現為大數據低延時查詢提供了一種新的思路和方向。

為幫助關注 CarbonData 的開發者深入了解該技術，我們發起了一場關于 Apache CarbonData Spark 的技術交流會，并邀請了來自美國 Databricks、華為、上汽集團的行業頂尖專家，希望通過 Spark SQL 使用場景、Spark 2.2 核心特性 CBO 介紹、CarbonData 應用實踐 2.0 新技術規劃等主題内容的分享，讓 CarbonData 的使用變得更加簡單。

活動時間及地點

活動地點：上海車享大樓（一層會議廳）

活動費用：限額免費

活動日程

carbondata性能（一份數據支持多種應用場景）1

講師及演講主題

議題一：Spark SQL: Past, Present and Future

講師簡介：範文臣，來自美國 Databricks 公司，Apache Spark PMC member，Spark SQL 開發團隊成員。2013 年從浙江大學畢業後，一直在進行分布式系統相關的工作。2014 年開始接觸 Spark，并成為最活躍的代碼貢獻者之一。2015 年正式加入 Databricks，成為 Databricks 中國分部（籌建中）的第一名員工，主要負責開源社區方面的工作，例如：審查其他社區成員提交的 PR，主導 Spark SQL 一些主要功能的設計和研發，定期審計項目代碼質量等。

carbondata性能（一份數據支持多種應用場景）2

議題摘要：Spark SQL 作為 Spark 的基礎框架，已經有了廣泛的用戶基礎，并且經曆了一段漫長的開發曆史。本次議題将會帶領大家回顧一下 Spark SQL 的演進曆史，以及目前的現狀，和未來的一些展望，幫助大家更好的理解 Spark SQL 的一些設計決策以及使用場景。

議題二：CarbonData 應用實踐 2.0 新技術規劃介紹

講師簡介：李昆，Apache CarbonData committer，華為技術有限公司大數據軟件架構師。2004 年加入華為，長期從事電信協議、業務智能化、數據可視化、用戶行為分析等系統研究和開發工作。近年緻力于大數據技術研究，參與 Hadoop、Spark、Alluxio 等開源社區，2016 年作為 CarbonData PMC 成員參與 Apache CarbonData 項目孵化，尋求大數據與一站式分析平台的創新機會點。

carbondata性能（一份數據支持多種應用場景）3

議題摘要：Apache CarbonData 是一種新的高性能數據存儲，針對當前大數據領域分析場景需求各異而導緻的存儲冗餘問題，CarbonData 提供了一種新的融合數據存儲方案，以一份數據同時支持大數據分析的多種應用場景（如：“任意維度組合的數據查詢分析、快速掃描、詳單查詢、數據更新删除等”），并通過多級索引、字典編碼、列存等特性提升了 I/O 掃描和計算性能，實現百億數據級秒級響應。

CarbonData 開源後，受到全球大數據技術愛好者高度關注；截止到目前為止，全球已有 100 開發者參與了代碼貢獻，有 10 家企業上線生産系統。本次演講主要介紹 CarbonData 應用實踐以及 2.0 新技術規劃，幫助大家更好地應用 CarbonData 技術。

議題三：Spark 2.2 核心特性 CBO 介紹

講師簡介：王振華，現任華為公司研究工程師，Apache Spark 核心 Contributor， CBO 主要開發者，緻力于構建高性能大數據查詢分析平台。在此之前，博士畢業于浙江大學計算機科學與技術學院，研究方向涉及空間數據庫、信息檢索、數據挖掘。

carbondata性能（一份數據支持多種應用場景）4

議題摘要：在 Spark SQL 的 Catalyst 優化器中，許多基于規則的優化技術已經實現，但優化器本身仍然有很大的改進空間。例如，沒有關于數據分布的詳細列統計信息，因此難以精确地估計過濾（filter）、連接（join）等數據庫操作符的輸出大小和基數 (cardinality)。由于不準确的估計，它經常導緻優化器産生次優的查詢執行計劃。

在 Spark 2.2 中，在 Spark SQL 引擎内添加了一個基于成本的優化器框架，此框架計算每個數據庫操作符的基數和輸出大小。通過可靠的統計和精确的估算，能夠在這些領域做出好的決定：選擇散列連接（hash join）操作的正确構建端（build side），選擇正确的連接算法（如 broadcast hash join 與 shuffled hash join），調整連接的順序等等。在這次演講中，将展示 Spark SQL 的新的基于成本的優化器框架及其對 TPC-DS 查詢的性能影響。

議題四：CarbonData 重要特性 Partition 上汽集團實踐 CarbonData 分享

講師簡介：曹魯， Apache CarbonData 核心 Contributor， partition 主要開發者，現任上汽集團數據業務部大數據平台開發經理。目前主要專注于大數據平台架構，數據存儲、壓縮、索引以及實時流數據處理等領域的研究及應用。曾負責某金融行業公司 ETL、BI 系統開發，某互聯網電商公司的數據倉庫容量管理、性能調優等。熱衷開源技術研究，Apache CarbonData 社區貢獻者。

carbondata性能（一份數據支持多種應用場景）5

議題摘要：CarbonData 的 partition 特性将在 Apache CarbonData 1.2.0 版本裡正式發布，此特性将顯著提升大數據查詢性能。上汽集團大數據将 CarbonData 作為平台基礎組件，以應對迅猛增長的數據量，本議題将分享上汽集團在 CarbonData 項目的實踐和測試數據。

免費報名地址

掃描下方圖片二維碼 或者點擊閱讀原文，填寫報名信息并提交，我們的工作人員審核後将向您發送确認參會短信。無論你是 Apache CarbonData 忠實粉絲和擁趸者，或着在 CarbonData 的使用上有任何的疑問和想法，我們的技術專家都在現場等你！

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技洋垃圾電腦入門
電腦圈子裡面的洋垃圾，指的就是服務器CPU志強系列的CPU套裝，這些套裝被商家拿去一頓營銷策略拿來坑人才有的這麼個稱号，那麼這些所謂的洋垃圾，抛開奸商來看的話，是不是真的就是不能賣的殘次品呢？舉個例子來講，就拿目前比較熱門的E51620來講... 2023-02-14
科技聯想最近發布什麼
生于七十年代末期、八十年代的人，應該對“11”記憶猶新。沒錯，“11”就是許志平設計出來的第一代家用電腦。為了滿足家用的條件，許志平選擇孩子為突破口，将聯想第一代家用電腦定位在教育和娛樂上。然而，它隻是提出了一個美妙的概念，卻沒有将其落地的... 2023-03-09
科技心髒特殊傳導系統路線
心傳導系統包括窦房結、結間束、房室結、房室束及其分支。01窦房結1位置和形态窦房結（sinuatrialnode）多呈長梭形，也可呈橢圓形和半月形，大小為14.1mmx3.6mm×1.1mm。與成人比較，嬰幼兒的窦房結相對較大，位置略低。位... 2022-12-29
科技西方發現幻方
傳說上古伏羲氏時，有龍馬從黃河裡跳出來，背上負着河圖；有神龜從洛水裡跳出來，背上負有洛書。伏羲氏根據河圖、洛書演化成八卦。洛書便是最早的幻方，用現代數學語言解釋，就是用1~9九個數字，填在九個格子裡，使每一橫行、每一豎列以及兩條對角線上3個... 2023-03-11
科技怎樣把電腦表格橫着打印在紙上
運用電腦辦公，已經是現代社會的鮮明特點，所以有人說，不會電腦，就相當于不會寫字——文盲。電腦功能豐富強大，若能掌握一些小技巧，則更能錦上添花。這裡就分享一例。生活中，我們經常會遇到電子表格很長，即使設置了頁面橫向，仍然無法将所有列打印到一張... 2023-01-05
科技電腦上怎麼安裝excel
電腦上怎麼安裝excel?打開電腦，搜索office，并點擊下載下載完成後，打開安裝包，下面我們就來說一說關于電腦上怎麼安裝excel?我們一起去了解并探讨一下這個問題吧!電腦上怎麼安裝excel打開電腦，搜索office，并點擊下載。下載... 2022-06-16
科技清爽卡通護眼電腦壁紙
大家好，我是美圖君，點擊右上方“關注”，每天和你分享美好的壁紙和插畫頭像。敲好看的卡通場景系列電腦壁紙原圖上傳，可用于電腦/ipad橫屏設備#壁紙##電腦壁紙##誰有好看的ipad壁紙#, 2023-02-16
科技松鼠ai智适應教育學生登錄平台
導語：截至目前，學習機已經走過了三個發展階段。“小嘛小兒郎，讀書就用讀書郎”，創辦于1999年的讀書郎，陪伴了80、90後的少年時期；後來，網課平闆開始走進視野，也成為衆多硬件廠商的利潤來源；到如今，松鼠AI學習機，培養能力打地基，萬物皆可... 2023-03-20
科技礦大迎新網密碼怎麼改
礦大迎新網密碼怎麼改?為進一步提升校園網的運行與管理水平，為廣大師生提供更好的網絡服務，學校計劃于2017年2月24日至2月25日對網絡認證系統進行升級,屆時将出現有線網、無線網、VPN等服務掉線等不穩定情況，現将相關安排通知如下：，今天小... 2023-01-23
科技鄭州日産nv200最新論壇
本文是駕仕派的原創分享文章，來自特約撰稿人Jackielxx。此外，7号Demon對本文亦有貢獻。試駕車輛：NV200CVT尊貴型駕仕指數：70分早在四年前NV200導入國内市場時，鄭州日産對NV200的車型定位就是“宜商宜家”，“商”在“... 2023-02-28
科技索尼全畫幅微單相機有哪些
在如今的攝影器材領域，索尼的微單相機一直是行業的标杆産品，尤其是微單相機，市場占有率極高。索尼微單一直在所有微單相機中扮演“領頭羊”的角色。索尼微單自從2010年發布首款微單相機NEX-5開始，就持續在微單相機領域發力，在2013年推出了首... 2022-11-18
科技群晖nas218play和218+的...
作者：漣灬漪此物已服役在公司超過1年多看到論壇沒有相關的介紹正好又購入了2台就和大家分享了下有問題也可以拍磚（之前寫的小編說不能算首曬本着精（pian）益（jin）求（bi）精的精神重寫！一、購買背景公司又要弄新的廠房和辦公樓了因此需要一個... 2022-12-15
科技同程藝龍查病毒
新京報訊2月1日晚，同程藝龍上線了新型肺炎确診同行程查詢服務，同時整合了全國疫情播報數據及同程藝龍平台出行大數據，面向社會公衆提供疫情動态播報、出行熱點等信息，以大數據助力疫情防控，為即将到來的春運返程客流高峰保駕護航。同程藝龍上線的疫情查... 2022-10-22
科技天涯明月刀11月30日服務器例行維護...
天涯明月刀11月30日服務器例行維護公告?親愛的玩家：青龍亂舞區、大地飛鷹區、血海飄香區、名劍風流區、陌上花開區、天命風流區全部服務器将在11月30日6:00~9:00停機維護更新，維護完成後上述各服務器客戶端版本号不變，本次維護主要調整和... 2022-12-10
科技小米miui系統有什麼功能
使用小米手機時，MIUI系統這幾個功能要開啟，前後體驗感大不相同！小米手機在内地市場一直都有着更好的口碑以及銷量，同時産品内置的MIUI也是獨具一格，不僅系統流暢而且功能也很強大。作為一名資深米粉，今天就想來跟大家分享幾個實用性很強的功能，... 2023-01-10
科技溶解度曲線知識點彙總
例3.（2019永州）如圖所示，下列判斷正确的是（）A.Y的溶解度比X的溶解度大B.t1℃時，X、Y兩種飽和溶液的溶質質量分數都是20%C.若燒杯内有晶體析出，則燒杯中飽和溶液的溶質為YD.t2℃時，若X、Y的飽和溶液質量相等，則溶液中溶質... 2023-01-01
科技 iqooneo5獨顯芯片對比
iQOO最新上市的Neo5S手機有一個核心賣點，那就是在搭載骁龍888移動平台之餘，還搭配了一顆額外的獨顯芯片Pro。借助這顆獨顯芯片，iQOONeo5S可實現MEMC運動計算和補償技術，帶來獨有的“幀率提升”模式和“高幀低功耗”模式，依靠... 2022-11-11
科技清除浏覽記錄的方法
我們打開浏覽器上網的時候浏覽器默認會記錄你的所有訪問記錄，如果不想讓别人看到你的浏覽記錄那就要清除你的上網記錄。不同浏覽器的清除位置可能不同，但是操作上基本差不多1、IE浏覽器2、谷歌浏覽器3、國内浏覽器國内浏覽器基本上都差不多，大家都可以... 2022-12-03
科技 sd高達g世紀火線縱橫
新一期《Fami通》公布了萬代南夢宮旗下“SD高達”系列新作《SD高達G世紀火線縱橫》的更多情報，介紹了本作新加入的“能力GET”系統。《SD高達G世紀火線縱橫》中将出現部分特殊的機體，被稱為“能力持有者”（AbilityHolder），玩... 2023-01-23
科技華為低電量設置教程
華為手機由于自身就搭載了大電池和華為公司的優化才能十分強，所以續航才能自身就很優秀的。但是手機用久了以後，有時會覺得本人的手機電量總是比他人掉的快，假如發作這種狀況，不用急的去換電池。華為手機自身就内嵌一個修複功用，翻開修複一下，續航才能立... 2023-01-11
科技數據庫中的關系運算有什麼
（1）交（Intersection）關系R和關系S具有相同的關系模式，關系R和關系S的交由屬于R同時又屬于S的元組構成的集合，記作:其定義形式為：（2）連接連接分為連接、等值連接和自然連接3種。連接運算是從兩個關系R和S的笛卡爾積中選擇滿足... 2023-01-15
科技正甯縣即将開發的項目
來源：【甘肅廣電-視聽甘肅】今年以來，正甯縣把項目建設作為縣域經濟社會高質量發展的重要載體，謀劃儲備農林水利、交通能源、新型基礎設施等項目，今年實施重點項目76個、總投資280億元，目前完成投資35.2億元。記者:慶陽台秦麗麗李亞絨來源：甘... 2023-03-01
科技域名系統的域名解析
一般域名使用注冊商提供的域名解析服務雖然方便，但功能大多有限，特别是目前國内還會針對某些DNS服務器進行屏蔽，造成網站無法解析的情況出現，因此，使用第三方域名解析服務也是中國網站的必要選擇，這裡就介紹一些常見的免費域名解析服務。域名注冊商提... 2022-12-03
科技乘風破浪的姐姐們第二期誰赢了
《乘風破浪的姐姐》成為最近熱門的話題綜藝，雖然還沒有播出，但是熱度不管是《青春有你2》還是《創造營2020》都是比不上的。相對于《青春有你2》《創造營2020》這種選秀綜藝，練習生和節目組之間存在着很大的實力不對等，而這些年輕女孩們，在還沒... 2023-03-10
科技大數據下的智慧物流模式創新
CFIC導讀◆供應鍊金融已成為供應鍊研究的熱點話題。在國務院辦公廳《關于積極推進供應鍊創新與應用的指導意見》中，六個重點任務之一就是“積極穩妥發展供應鍊金融”。清華大學互聯網産業研究院副院長兼物流産業研究中心主任劉大成（資料圖）供應鍊金融已... 2023-02-01
科技為什麼安卓手機上有殺毒軟件
摘要：現在很多人會在手機上裝上許多APP便于日常的生活使用，但是有時候他們會不知不覺地裝上許多山寨APP，難免會讓手機感染到一些病毒。不過這些情況一般常見于安卓手機當中，使用iPhone手機用戶會發現，iPhone其實是不需要安裝殺毒軟件的... 2023-01-20
科技手機電不耐用怎麼換電池
随着科技的發展，手機的智能化，現在手機已經成為我們生活中密不可分的一部分了，但是手機用完一段時間後電池就變得不給力是很多人遇到的問題，小編我也遇到了這個問題，手機電量掉得很快，電量到了百分之五十左右就斷崖式掉電，然後自動關機，于是小編前段時... 2023-01-02
科技肺纖維化是嚴重呼吸系統疾病嗎
肺間質纖維化呢是由于肺泡受到了異物或者炎症的損傷以後，自己進行的一種修補，使得本來是一個非常有彈性，很好很軟的，呼吸功能的這種功這種肺泡，由于修複，由于纖維蛋白和膠原蛋白的這種滲出，使得它變硬了，彈性變差了導緻功能喪失了，所以肺間質纖維化，... 2023-01-01
科技 ai文件無法打開插圖空間不足
一、序言最近作圖經常會用到adobeillustrator軟件，作圖方便了不少。前兩天，直接雙擊保存的AI文件的時候，文件很順暢的就打開了。今天不知道怎麼回事，雙擊AI文件後，adobeillustrator軟件竟然提示“無法打開插圖，窗口... 2022-11-06
科技折疊屏手機三星w20薄荷綠色
折疊屏手機的出現，仿佛又讓我回到了那個蘋果還沒進入中國市場的時代。彼時的iPhone不僅是人們相互溝通的工具，更是一種社交貨币，能讓你在朋友聚會或是同事之間輕松的找到話題，成為萬衆矚目的焦點。折疊屏挑戰了智能手機的形态，對鉸鍊的結構設計、屏... 2023-03-11

tft每日頭條

> 科技

> carbondata性能

carbondata性能

相关科技资讯推荐

热门科技资讯推荐

网友关注