如何選擇數據倉庫開發方法-tft每日頭條

如何選擇數據倉庫開發方法

科技更新时间:2026-06-27 00:27:41

【摘要】衆所周知，數據量大了之後，性能是大家關注的一點，所以我們在業務開發的時候，特别關注性能，做為一個架構師，必須對性能要了解，要懂。才能設計出高性能的業務系統。

一、GaussDB分布式架構

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）1

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）2

所謂集群是将多台物理服務器組建成一個邏輯平台，對外展現一個集群平台的形式。

所謂分布式架構是将數據分而治之。以邏輯進行劃分，将數據存放在不同的物理節點。

CN:協調節點負責接收來自應用的訪問請求，并向客戶端返回執行結果。Coordinator負責分解任務，并調度任務分片在DataNode上并行執行。

CN：SQL語句的解析和任務規劃，把具體的任務下發給DN結構

GTM：生成和維護全局事務ID、事務快照、時間戳等需要全局唯一的信息。

DN:數據節點，負責存儲業務數據(支持行存、列存、混合存儲)、執行數據查詢任務以及向Coordinator返回執行結果。【不單存儲還負責計算】

一台物理機【2-4個DN】

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）3

Coorinator做任務的規劃分發，規劃完之後，把具體的任務抛給計算節點。

Crew3 Worker1和Crew3 Worker2就是任務樹中的葉節點就是數據的掃描任務，接受下級任務的數據輸入，向上級任務輸出數據。

Crew2 Worker1和Crew2 Worker2中間的節點就是各種數據運算任務,如Hash計算，Join操作，聚集操作和排序操作。接受下級任務的數據輸入，向上級任務輸出數據。

在非阻塞的任務流程中，上級任務不需要等待下級完成全部任務返回整體結果級才啟動，下級任務生成一條結果記錄就可以傳遞給上級。

阻塞情況下，上級任務需要等待下級任務完成所有數據處理工作。

二、調優原則與流程

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）4

說白了，就是少花錢，多辦事，資源利用最大化，比如我們在點查詢場景的時候盡量使用索引掃描。如果實在不能索引掃描，我們會讀取每一條元組和點查詢條件進行匹配。

在沒有資源瓶頸的情況下,盡量充分利用資源，比如在數據排序的時候，盡量使數據不下盤，在内存進行排序。因為在磁盤中讀寫的速度，肯定是不如内存的。

靜态調優一般架構師會根據業務特征确定集群部署方案，表定義，行列存，複制/哈希分布等設計的過程。方案和表一般确定下來，後期如果要改動，代價很大。

可能作為有經驗的人來說,收集統計信息，sql改寫，數據庫參數配置，plan hint等手段基本都做過，它屬于執行态調優。但是沒有經驗的人可能隻知道理論，不知道如何操作，久而久之，理論都忘記了。

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）5

防止單點(單個DN)數據多，導緻整個集群有效容量下降。
防止單點掃描，壓力過大。
通過，分區，索引，局部聚簇實現。（後面會有實踐操作）
選擇關聯列，做為分布列，比如用id關聯，将id做為分布列，這樣查詢的時候，避免跨計算接點的數據流動，減少網絡壓力。

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）6

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）7

局部聚簇是列存儲下獨有的手段，通過把表數據按照指定列排序後存儲，配合稀疏索引，可以實現表數據的快速掃描。【華為獨有的科技】

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）8

三、伴随場景介紹

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）9

發現一個犯罪嫌疑人，還有他的車輛，我怎麼通過數據挖掘來找到犯罪團夥的場景。

四、調優實踐

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）10

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）11

Plan Information:在sql語句執行的時候，perf語句會包含非常多的執行動作,也會消耗很多的資源，我們通過perf把這些信息都記錄下來。常用的是前2個。Plan 執行過程中每個算子的執行概要信息。比如:scan,join等。另外一個是算子，with信息。

Predicate Information: 算子信息，每條數據掃描，伴随的filter條件，join伴随的關聯字段。

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）12

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）13

會對數據類似于分區，然後進行局部排序
并通過元數據信息記錄這個區間的最大值和最小值。

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）14

CUNone:0我忽略了多少個數據段

CUSome:6我需要掃描多少個數據段

Scan的性能提升的兩個主要策略

1)減少實際IO

a)索引

b)pck

c)分區

2)Scan壓力均衡

a)調整分布列

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）15

數據批量入庫的時候，按字段做一些排序。排完序之後，再入庫。

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）16

導入表數據和統計信息。

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）17

Time:10.422ms

不包含PCK大概花了23.902ms

pck建立的場景和索引的建立場景是有點像的。

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）18

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）19

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）20

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）21

nestloop的在特定場景下，性能會非常好，比如小表join大表的時候，

hashjoin在大多數場景下，性能最優。大表join大表

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）22

hash join一般期望數據量小的表做内表,

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）23

hash join:137ms

merge join:775ms

nestloop:1137.9ms

如何選擇數據倉庫開發方法（幹貨大廠運維必備技能）24

問題總結:

1.truncate和delete快

答： truncate 整個文件都不讀 delete标記元組删除

2.PCK對入庫的數據做局部排序影響較小。

3.MPP數據庫性能瓶頸在哪些?

答:數據庫性能瓶頸在具體數據處理業務場景，分布式架構場景下，業務CPU吃滿了，瓶頸在CPU，内存吃滿了，瓶頸在内存。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技華為nova4有nfc功能嗎
1、華為Nova4手機不具備NFC功能。2、華為nova4是是華為繼nova3以後的一款産品。這也是... 2023-07-08
科技螞蟻為什麼用觸角說話
1、螞蟻的眼晴不太好用，視力很差，它們的觸角就擔任了通常眼睛扮演的角色。2、螞蟻不會叫，它們頭上的觸角，便是彼此聯系溝通的工具。你們看螞蟻們在地下黑暗的巢穴裡，縱橫交錯的地道網十分複雜，這麼多螞蟻成天忙忙碌碌地進出巢穴，尋找、搬運和貯藏糧食，還要産卵繁殖，躲避敵害，整個家庭卻井然有序，就全靠它們用觸角交流信息，溝通情況。3、原來兩隻螞蟻在互相碰觸角時，能分泌用一種化學物質，傳送給對方，這種化學信号 2023-07-08
科技保存别人qq空間照片有記錄嗎
1、保存别人qq空間照片是沒有記錄的，隻會顯示你來拜訪過他空間的信息。2、你浏覽圖片的時候其實圖片就已經下載到緩存裡面了。你隻是把圖片保存到你硬盤裡面而已，不會知道你保存了照片。3、如果是手機保存的當時，會顯示存儲路徑，根據那個路徑去手機裡找就可以了，如果不記得路徑，建議你去别人空間将此照片再保存一次，再次保存的時候切記，記住屏幕上的保存路徑，因為那個路徑隻顯示一下下。 2023-07-08
科技 wifi故障解決方法
1、關閉并重啟WIFI連接。用手機上網，手機中會保留一個由WIFI連接分配的網絡IP地址，它會被應用... 2023-07-08
科技淘寶連續包月怎麼取消
1、首先登錄手機支付寶，進入支付寶首頁。2、在手機支付寶首頁切換到“我的”選項卡，點擊“我的”進入我... 2023-07-08
科技技嘉GVN7302GI顯卡（技嘉GV
　　【中關村在線顯卡頻道】　　技嘉 GV-N970G1 GAMING-4GD 顯卡是一款針對發燒級遊戲玩家推出的高性能産品，這款顯卡采用非公版PCB方案打造，擁有超越公版顯卡的核心頻率和更高效的散熱設計，對于全新DX12特效的支持也帶來更完美的遊戲體驗。現在這款顯卡在京東商城售價2699元，更為實惠。　　【編輯點評】1.技嘉GV-N970G1 GAMIN... 2023-07-08
科技英偉達筆記本顯卡發布周期（英偉達新一...
　　新一代的八代處理器已經正式上市了，但是大家同樣期待着新一代NVIDIA的顯卡，從之前的GTX 2080到今年GTX 1180，可是老黃依舊是沒有透露新的顯卡消息。　　而現在終于有消息了，這次當“豬隊友”的是技嘉官方客服！根據一位技嘉筆記本官方客服在OverclockersUK的回應，新一代技嘉Aero 15X筆記本預計在2018年底之前會更新到新一代的... 2023-07-08
科技單反拍下雪技巧
1、首先要拍攝時間最好選擇晴天的清晨日出前後或傍晚，散射光比較能夠拍攝出雪的質感和層次。2、其次在拍... 2023-07-08
科技使用什麼軟件做片頭（片頭制作軟件有哪...
　　視頻片頭制作軟件有哪些？衆所周知，視頻的開頭是非常重要的，好的視頻開頭能吸引觀看者的眼球，讓觀看者能看完整段視頻，那麼究竟哪些片頭視頻是好的呢？很多小夥伴不知道，其實我們隻需要找到制作片頭的軟件就好了，不僅僅能知道哪些片頭熱門，還能制作自己喜歡的片頭，下面我們就來看看視頻片頭制作軟件有哪些吧！　　　　推薦一：panzoid 　　這是一個在線的制作網站... 2023-07-08
科技剛安裝完的淨水器能喝嗎（安裝淨水器後...
　　　　來源：21新健康（Healthnews21）原創作品　　作者：陳紅霞　　實習生：李芊芊　　編輯：李欣夷　　圖片來源：視覺中國　　近日，湖北武漢的李女士一家在安裝了淨水設備後，居然誤喝了三年的“軟化鹽水”一事，引起了媒體的廣泛關注。　　據了解，李女士家裡在三年前安裝了武漢益駿達舒适環境設備有限公司的淨水器，此後一直覺得水有淡淡鹹味，但直到... 2023-07-08
科技蘋果如何關掉carplay僅充電
演示機型：Iphone12系統版本：iOS141、在手機桌面點擊“設置”圖标，進入到設置界面。2、在手機的設置界面選擇“通用”選項，進入到通用菜單列表中。3、在通用界面打開“訪問限制”，進入到訪問權限菜單設置界面中。4、在訪問限制界面将“CarPlay”一欄的開關關閉，即可關掉carplay僅充電。ca 2023-07-08
科技怎麼在方格内打√号
演示機型：華為MateBookX系統版本：win10APP版本：搜狗輸入法v10.1&&word20201、第一種方法：打開word，用輸入法打出一個勾，然後選中“√”。2、然後再按一下菜單欄裡面的有方框的“A”，就可以了。3、第二種方法：在插入菜單找到“符号”，選中“其他符号”，然後點擊打 2023-07-08
科技華為mate30雙系統怎麼切換
1、首先，請确認你的手機系統升級到EMUI4.1及以上系統，随後進入：設置——用戶。2、在進入的界面中，單擊左下角的添加”，随後設置一個名稱，選擇切換用戶”。3、随後你可以進入新系統進行設置，同步數據等，這樣以後就不怕手機外借，數據被偷翻了。 2023-07-08
科技汽車遙控器怎樣換電池
1、按壓遙控器後部按鈕，取出遙控器中的鑰匙。2、用螺絲刀打開鑰匙鎖扣，并沿着開口劃開鑰匙。3、取出舊... 2023-07-08
科技國行跟美版的區别
演示機型：Iphone12系統版本：iOS14.41、銷售地不同：國行的銷售地是中國大陸；美版的銷售地為美國。2、版本不同：關于蘋果手機的衍生版本，國行隻有無鎖版；美版則是有兩種版本，一種是卡貼機版本，一種是無鎖機版本。3、充電不同：國行版的可以在關機狀态下充電；美版的則不可以，隻要接通電源就會自動開機。4、操作不同：國行的WiFi寫的是無線局域網，能夠管理APP使用數據流量或者WiFi，或者二者 2023-07-08
科技 oppor11開不了機怎辦
1、電池無電量或不足，請充電半小時後再按電源鍵看能否開機；2、電池與手機接觸松動不良，取出電池，使用棉簽擦拭電池觸點嘗試（可拆卸電池手機）；3、條件允許下，更換充電器、數據線和電池（可拆卸手機）充電半小時後開機；若以上方法均未能解決你的問題，請攜帶購機發票、保修卡和手機前往就近的OPPO客戶服務中心檢測處理。 2023-07-08
科技行車記錄儀顯示沒有sd卡怎麼辦
1、首先檢查是否插了插了外置的SD卡。2、如果插了外置的SD卡，提示沒SD卡，一個可能是SD卡不是高速存儲卡，而是C10的卡，這是更換卡就好了。3、如果是高速存儲卡，但顯示沒有sd卡，那麼是卡損壞了，換一張新卡即可解決。 2023-07-08
科技微信電話暫時無法接聽是什麼意思
以華為P40、EMUI11、微信v8.0.1為例。1、沒有嘟嘟的接通音，直接忙線中，說明對方在通話，或者有人同時且在之前撥打該電話；2、已有撥通音後忙線中，說明對方主動挂斷通話，或者對方正巧手機斷電。微信視頻通話步驟：1、登陸微信，點開一個最近聯系人或是從下方通訊錄裡找到一個用戶，準備進行視頻通話。2、微信上的視頻通話功能，如果你10分鐘之類沒有和對方發過消息的話是不無法馬上進行視頻通話的。3、按 2023-07-08
科技手機otg是什麼意思
1、手機支持OTG是指在無電腦作為中轉站的情況下，直接将手機連接U盤、讀卡器、MP3、鍵盤、數碼相機... 2023-07-08
科技 nv曆代顯卡參數（本以為是誤操作）
　　新一代的酷睿八代處理器出來了、新一代的Ryzen5平台也推出了，新一代的NV顯卡？準确的消息終于出現了！近日技嘉客服在回應網友提問時承認了新一代的筆記本将會搭載新的GPU平台。　　　　新一代的酷睿八代處理器出來了、新一代的Ryzen5平台也推出了，新一代的NV顯卡？準确的消息終于出現了！近日技嘉客服在回應網友提問時承認了新一代的筆記本将會搭載新的GP... 2023-07-08
科技 iqoo什麼手機
演示機型：iqooneo5系統版本：OriginOS5iQOO是vivo孵化的全新子品牌，獨立于vivo運營，打造全新的旗艦系列。2019年2月12日，iQOO正式公布。2月20日，iQOO手機放出了新機發布會信息，官方于3月1日，中國深圳正式召開iQOO新品發布會。2020年8月17日，iQOO手機正式發布了iQOO5、iQOO5Pro手機。性能配置：iQOO新機配備高通骁龍855處理器，搭配6 2023-07-08
科技對孩子來說什麼才是真正的陪伴
第一、不要評判孩子。對于孩子來說，真正的陪伴就是在陪伴孩子的時候，不要陪評判孩子，比如有些家長在陪伴孩子的時候，孩子喜歡玩泥巴，身上弄的稍微有點髒了，很多家長會指責孩子是髒小孩，甚至會罵孩子玩泥巴沒有出息，這樣的評判對于孩子來說是毫無理由的，也不具任何溫情的，既然要陪伴孩子，就不要總去評判孩子那些有的沒的。第二、陪伴孩子不要總讓别人代勞。對于孩子來說，真正的陪伴就是陪伴孩子的時候，千萬不要總讓别人 2023-07-08
科技 qmc0文件怎麼轉換mp3
以華為MateBookX、win10、格式工廠V4.10.0為例。打開格式工廠軟件窗口中單擊音頻選項。然後展開音頻選項中選擇單擊MP3。打開mp3對話框後再把qmc0文件格式拖到工作區中。然後在mp3對話框窗口中單擊确定按鈕。此時返回到格式工廠的界面中單擊菜單選項中的開始選項。此時我們看到正在轉換mp3格式當中。轉換完成後單擊輸出文件夾按鈕可打開轉換輸出的文件所在的路徑對話框。然後選中輸出文件後打 2023-07-08
科技反導系統深度解析（防空反導系統的絕殺...
　　出品：科普中國　　作者：嶽江鋒　　策劃：宋雅娟　　監制：光明網科普事業部　　美國國防部在1981年設立了定向能技術局來開發粒子束武器和激光武器，并從當年開始實施預算額為3.15億美元的5年開發計劃。到80年代中期，在美國提出的“星球大戰”計劃中，定向能武器首次作為主力攔截武器的構想“躍然于紙上”，主要包括空間基激光器、地面基激光器、空間粒子束武器... 2023-07-08
科技抖音求更新記錄能删嗎
演示機型：Iphone12系統版本：iOS14.4APP版本：抖音16.0.0抖音求更新記錄不能删。抖音求更新是為了能夠更好的讓粉絲和UP主互動，如果關注的人更新比較慢，或者沒有更新，即可使用這個功能，提醒他們進行更新，但一旦點了求更新，便不可删除。抖音：抖音是由今日頭條孵化的一款音樂創意短視頻社交軟件，該軟件于2016年9月20日上線，是一個面向全年齡的短視頻社區平台。2019年1月18日下午， 2023-07-08
科技怎麼檢查摩托車發電是否正常
1、取掉火花塞後用腳輕踩啟動杆，轉動太輕松沒有磁性吸住線圈鐵芯感覺的，就是磁電機磁性減退的表現。2、在停機時，打開磁電機邊蓋，用小起子靠近飛輪裡邊的磁鋼上邊，吸力較差就是磁性減退的表現。3、飛輪上磁鐵的磁性減退到一定地步的時候，就給不出足夠的點火電力，火花塞難以跳火摩托車啟動困難。4、一般的摩托車在打開大燈開關用腳快速踩一下啟動杆時，前大燈應該有略微亮一下表現，如果不亮，說明發電能力有限。不過，這 2023-07-08
科技抖音怎麼可以看到訪客
抖音怎麼查看訪客，相信很多朋友們對這個問題很感興趣，下面給大家介紹一下，希望可以幫助到大家。1、目前... 2023-07-08
科技 3dmax擠出在哪
演示機型：華為MateBookX系統版本：win10APP版本：3dmax20141、雙擊桌面上的3dmax快捷圖标，将3dmax這款軟件打開。2、在打開的界面内找到幾何體選項，并在其中找到球體選項。3、選擇球體，在頂視圖裡創建一個球體，然後再按下鼠标右鍵在右鍵菜單裡找到編輯為選項。點擊該選項，在其子級菜單裡找到轉換為可編輯多邊形選項。4、轉換為可編輯多邊形之後再在修改裡選擇多邊形選項。5、點擊做 2023-07-08
科技圓鋼鑽孔什麼機器最快
1、圓鋼鑽孔采用雙面鑽床加工最快，轉速200，進給量0.5，8小時可加工不少于600件。2、鑽孔裝置... 2023-07-08
科技電腦磁盤怎麼清理
1、方法一：雙擊打開此電腦，右鍵點擊想要清理的磁盤。點擊“屬性”選項，點擊“磁盤清理”選項，選擇回收... 2023-07-08

tft每日頭條

> 科技

> 如何選擇數據倉庫開發方法

如何選擇數據倉庫開發方法

相关科技资讯推荐

热门科技资讯推荐

网友关注