怎麼部署ovf模闆-tft每日頭條

怎麼部署ovf模闆

科技更新时间:2026-08-02 17:02:54

導語：穿梭機是緻誠與宜信基礎研發部合作開發的包含實時清洗、衍生變量計算、和數據融合入庫等功能的一體化系統。

一、簡介

一般而言，大數據處理流程主要包括數據采集、數據處理、數據存儲、數據挖掘和數據應用等環節，大數據處理流程每個環節的數據質量最終決定了大數據産品的質量。相較于傳統的軟件，大數據産品要有大量的數據規模、快速的數據處理、精确的數據分析等特點。

“穿梭機”便是用于銜接大規模的數據采集和海量的數據存儲，并在其中實現快速的數據處理的重要樞紐。本文将結合大數據處理流程介紹穿梭機在實踐當中的演進，正如穿梭機這個名字，我們希望繁雜瑣碎的數據碎片，如同穿梭時空一樣，以一個幹淨有價值的新姿态呈現到我們面前。

怎麼部署ovf模闆（Wormhole在緻誠穿梭機項目中的應用）1

二、數據的采集、處理和存儲

從大數據處理流程的第一個環節開始。數據采集，就是通過各種方式收集數據，比如異構數據庫、日志、用戶事件和公開信息等，是大數據産生的源頭。異構數據的遷移有Apache Sqoop等批量數據傳輸組件，日志收集有Logstash等日志收集組件，公開信息采集有各種爬蟲組件。

由于采集數據的方式不同，數據又可分為結構化數據和非結構化數據。比如來自Oracle、MySQL的數據，對字段和結構有着嚴格的定義，因此他們是結構化數據。而來自MongoDB、ElasticSearch的數據，通常字段不統一，結構不相同，是非結構化數據。同樣，日志和采集的公開信息，他們也是非結構化數據。

公開信息采集是我們重要的大數據來源，其更貼近互聯網的一側，我們利用公有雲來搭建數據采集中心。在系統演進過程中，采集中心已經具備了任務分級、彈性收縮、實時監控等的功能，可以合理支配資源、分配任務，使得數據采集在有限的硬件條件下盡可能高效。

怎麼部署ovf模闆（Wormhole在緻誠穿梭機項目中的應用）2

怎麼部署ovf模闆（Wormhole在緻誠穿梭機項目中的應用）3

采集完數據，第二步是對數據進行處理。由于原始數據産生自外部網站、服務接口等不确定的數據源，往往會出現數據缺失、錯位或錯誤等問題，在存儲之前，會進行數據預處理，數據預處理一般包含過濾丢棄、去除重複、歸一化、修正錯誤、結構化等數據清洗工作。在這之後，還會根據業務特點和數據種類，做進一步的處理，從而提高數據的價值性、可用性、時效性和準确性。

數據處理完成之後，根據數據的用途和結構，将其寫入合适的存儲。比如用于模糊搜索的數據，将其寫到ElasticSearch。對于格式複雜、涉及多層嵌套的數據，将其寫入MongoDB。對于大體積很少修改的數據，将其寫入HDFS。

對于數據分析和數據應用，由于不屬于穿梭機的工作範圍，本文不再展開闡述。

三、穿梭機的前世今生

雲環境資源有限，計算能力較低，大量的計算更适合于放在本地環境，但受限于雲環境和本地環境的先天隔絕，數據傳輸的時效性和數據計算的準确性是一直以來最受關注的點。

怎麼部署ovf模闆（Wormhole在緻誠穿梭機項目中的應用）4

穿梭機項目誕生之初，我們在雲上搭建了臨時的中轉數據庫，采集到的數據先實時存儲在中轉數據庫中，次日淩晨再将前一天的數據批量拉回本地數據庫，然後在本地對前一天的數據進行離線計算，最後将離線計算的結果分發到其他存儲。

怎麼部署ovf模闆（Wormhole在緻誠穿梭機項目中的應用）5

這是一條比較長的鍊路，每個環節也無法保證自身的高可用。數據保存在中轉數據庫時，數據本身已經丢失了一定的時效性。并且，由于次日才對數據做處理，很難第一時間發現數據源頭的問題，故障響應時間也因此延長。

随着系統的演進和Wormhole的加入（Wormhole 是一個一站式流式處理雲平台解決方案，詳見edp963/wormhole），業務中的痛點被逐漸的解決，時效性和準确性得到了很高的提升。

怎麼部署ovf模闆（Wormhole在緻誠穿梭機項目中的應用）6

現在，我們将采集下來的數據實時發送到消息隊列Kafka，Wormhole以Kafka為Source端，對數據進行統一的處理，處理完成後，由Wormhole寫到各個Sink端。

怎麼部署ovf模闆（Wormhole在緻誠穿梭機項目中的應用）7

從高可用上分析，依托于Zookeeper，Kafka集群本身實現了高可用，确保其作為數據管道，可以可靠地傳輸數據。Wormhole，作為運行在YARN集群上的Application，同樣保證了高可用。移除了本地中心庫，數據直接寫入業務相關存儲，消除了單點故障導緻的系統風險，所以目前數據處理的可靠性得到了保證。

從時效上分析，采集到的數據實時發送到Kafka，延遲在毫秒級，Wormhole實時處理寫入存儲，延遲在秒級。所以現在的架構，從數據采集到存儲，實現了秒級延遲。從數據的計算方式來說，原來數據是離線計算，時效是T 1甚至是T N，現在改為實時計算，時效提升為T 0，或者可以說是秒級延遲。

從架構上分析，這是一個Kappa架構。通過Kafka來保存近期的數據，每類數據保存在不同的Topic中，根據不同的業務需求來精細地控制每類數據的保留時間。當需要對某種數據重新計算或者新的計算時，就可以通過控制Flow消費數據的位置來實現，然後将結果保存在新的存儲當中。在這種架構下，我們完成了所有數據的數據清洗、數據融合和衍生變量計算等工作。

由于采集的數據多為非結構化的數據，用Wormhole實現了數據結構化。我們使用了UMS_Extension來定義數據的格式和類型，數據在真正處理之前，經過了一次字段和類型的統一，這減輕了數據處理的複雜程度。

怎麼部署ovf模闆（Wormhole在緻誠穿梭機項目中的應用）8

在數據的處理過程中，由于數據清洗過程的複雜，單一的SQL難以處理所有的情況，我們大量使用Custom Class Transformation。為此，我們開發了Custom Class框架和單元測試框架。

通過不同的繼承即可實現不同級别數據結構的轉換，使得開發人員更能專注于對數據本身的處理。

怎麼部署ovf模闆（Wormhole在緻誠穿梭機項目中的應用）9

有了很多Custom Class Transformation類，我們就需要簡單的方式對代碼進行單元測試。為此，我們基于TestNG開發了Transformation單元測試框架，使用注解即可進行方便的測試，保證了數據處理的準确性。

怎麼部署ovf模闆（Wormhole在緻誠穿梭機項目中的應用）10

最後，我們使用非關系型數據庫來保存處理好的數據，如ElasticSearch和MongoDB。使用Wormhole的Sink Schema功能，在數據輸出之前再對字段和類型做一次統一，并且支持輸出類似JSON的複雜類型，把好數據處理的最後一道關。

怎麼部署ovf模闆（Wormhole在緻誠穿梭機項目中的應用）11

至此，介紹完了緻誠穿梭機項目的前世今生。

寫在最後：

目前，得益于Wormhole實時流式處理方式，數據處理的壓力被分散開來，機器資源消耗峰值得以降低。在3個節點的集群中（單節點Xeon E5-2680，2.40GHz，64GB），在CPU使用率低于50%，内存使用率低于60%的情況下，穿梭機每天承擔着千萬級的數據處理，數十GB的數據累計。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技小米電視pro
1、小米電視5Pro的畫質可以媲美索尼三星，通過實際觀感來看，采用量子點技術的小米電視5Pro支持H... 2023-07-03
科技淘寶怎麼搜索用戶加好友
以Iphone12，ios14，淘寶9.5.0為例：打開淘寶APP，登錄後，點擊淘寶主頁面下方的我的淘寶。在我的淘寶頁面，點擊上方的消息圖标。進入消息頁面，點擊上方的＋圖标，打開列表，選擇添加好友。在添加好友頁面，輸入你要加的淘寶賬号，再點擊添加好友即可。淘寶網：淘寶網是亞太地區較大的網絡零售、商圈，由阿裡巴巴集團在2003年5月創立。淘寶網是中國深受歡迎的網購零售平台，擁有近5億的注冊用戶數，每 2023-07-03
科技電腦廣告怎麼屏蔽呢
1、下載安裝“360安全衛士”2、安裝好後，點擊打開軟件，在首頁的右下角可以看見“彈窗過濾”功能，點... 2023-07-03
科技聖安地列斯起重機任務怎麼過
1、吸住車：将吸盤移到車輛上方即可。2、移動起重機：上下左右方向鍵。3、改變視角：V字母鍵。有用處，... 2023-07-03
科技寬帶連接678怎麼辦
1、移動寬帶用戶登錄時顯示錯誤代碼678通常是線路問題導緻,可按以下操作嘗試恢複:2、重啟光貓,并把... 2023-07-03
科技控制台液壓自移開關車如何移動?
1、SS0：手動/自動切換開關選擇為手動，以及SS1：連續運行選擇開關選擇為解除連續運行。請編寫可以... 2023-07-03
科技筆記本風扇聲音大怎麼解決
1、可以通過更改系統設置進行降頻或者清理灰塵，都可以減小風扇聲音。2、鼠标右鍵點擊開始菜單，然後點擊... 2023-07-03
科技黑人牙膏怎麼查真假
1、尾部打碼不同。标注批次的鋼印打碼内都會包含“HH”真的黑人牙膏“HH”是斜體的，假的是正體的“H... 2023-07-03
科技談錢傷感情現實的句子
1、錢買不來愛情，但至少可以保障愛情。都說談錢傷感情，能傷害得了的原因，不是錢太少，就是感情太淡薄。... 2023-07-03
科技全球供應鍊的特點
1、供應鍊的特點，從供應鍊的結構模型可以看出，供應鍊是一個網鍊結構，節點企業和節點企業之間是一種需求... 2023-07-03
科技手機内存清理技巧有哪些
1、清理文件夾。手機在使用過程中會自動保存浏覽記錄，如果長時間不清理，垃圾文件會越來越多。這樣一來，手機内存的壓力增大，運行速度就越慢。想要緩解手機内存壓力就可以試試這個方法。2、清理微信聊天記錄。微信也是導緻手機内存空間不足的主要原因你知道嗎？每天都在使用微信卻很少清理聊天記錄。要知道微信中的聊天記錄越多占用的内存就大，為了釋放手機内存，最好每隔一段時間就清理一次。3、關閉照片、視頻和文件”自動 2023-07-03
科技聯想台式機進入bios設置按哪個鍵
演示機型：聯想天逸510s系統版本：win10聯想台式機進入bios設置按F2。重啟打開電腦，當電腦屏幕上出現畫面“Lenovo”的時候，并且在左下角還會看見如下字樣“PressF2toSetup”。這時迅速按下鍵盤上的“F2”鍵，即可進入BIOS設置。不同端有不同的BIOS進入方法，部分如下：PC機：AwardBIOS：按D 2023-07-03
科技怎麼做微信裡的視頻号
1、工具：微信；2、方法：首先打開微信，點選跳轉到發現頁面，視頻号在朋友圈的下面，點選進入；3、進來... 2023-07-03
科技微信步數怎麼突然沒有顯示
1、微信運動不計步的原因是公衆号設置裡的開啟記錄數據已關閉,或手機權限的限制微信讀取數據,再者是手因... 2023-07-03
科技蘋果xr可以插兩個卡上兩個微信嗎
可以，方法如下：1、首先我們需要先上百度，搜索找到帶有微信多開APP的網站。打開safari浏覽器，... 2023-07-03
科技角磨機磨石頭用啥磨片
1、角磨機磨石頭用金剛石磨片。2、金剛石磨片的專業解釋是指用于研磨機上的盤式磨具，由盤體和金剛石磨塊... 2023-07-03
科技忘記手機密碼怎麼解鎖安卓
1、第一個方法比較簡單，首先就是将手機進行關機，然後同時按下電源鍵和音量鍵。不同的手機可能會有略微的... 2023-07-03
科技華為手機桌面微信不小心滑沒了怎麼辦
1、首先，找到設置點進去，找到應用程序管理。2、在手機頂部，全部進程中找到“華為桌面”。3、可以看到... 2023-07-03
科技額定功率和實際功率的區别
1、額定功率是指用電器正常工作時的功率。它的值為用電器的額定電壓乘以額定電流。若用電器的實際功率大于... 2023-07-03
科技蘋果手機怎麼設定4G
1、首先打開手機的主頁,找到設置軟件。很多手機功能設置一般都在設置裡面,打開。2、打開之後,找到蜂窩... 2023-07-03
科技蘋果電話閃光燈在哪裡
1、蘋果手機打開，打開「設置」應用。2、接下來請在設置列表中找到「輔助功能」。3、在輔助功能列表中，... 2023-07-03
科技品質上乘的五部兒童動畫
第一、《小豬佩奇》想必大家已經如雷貫耳，這部由英國BBC播出的動畫是低幼小朋友的最愛。畫面線條簡潔，使用明快的大塊色彩，細節處理卻又極為到位，這非常符合幼兒的生長規律，他們眼中的世界就是如此簡單而美好。孩子總是可以從各種小動物中找到自己的影子。第二、《彩虹小雞》是一部國産動畫，畫面和音樂堪稱典範。七隻小雞七種顔色，走在一起就是一道彩虹，毛茸茸肉嘟嘟，真真的想捏一把。《彩虹小雞》的制作者縮短了國産動 2023-07-03
科技手機攝像頭有灰塵怎麼辦
1、沿着手機四周慢慢打開後殼。2、使用紙巾輕擦後殼攝像頭玻璃面闆。3、繼續擦拭主闆上的攝像頭，注意不... 2023-07-03
科技電腦設備管理器在哪
1、打開系統的設備管理器有好幾種方法，第一種是在桌面上對着我的電腦圖标右擊鼠标，然後在彈出的選項裡面... 2023-07-03
科技計算機語言包括哪些
1、計算機語言有C語言、C++、Java、VB、PHP等。2、計算機語言是指用于人與計算機之間通訊的... 2023-07-03
科技小米手機在哪裡設置截屏
1、首先打開并進入手機設置。2、在設置頁面，點擊進入更多設置選項。3、在更多設置頁面，點擊并進入手勢及按鍵快捷方式選項。4、在手勢及按鍵快捷方式頁面，點擊并進入截屏選項就可以設置截屏了。 2023-07-03
科技攜号轉網啥意思
1、攜号轉網，也稱作号碼攜帶、移機不改号，也就是說一家電信運營商的用戶，無需改變自己的手機号碼，就能... 2023-07-03
科技榮耀20s是5g手機嗎
1、當前榮耀系列沒有5G手機，華為支持5G的産品有HUAWEIMateX、HUAWEIMate20X... 2023-07-03
科技相機m和p代表什麼意思
1、單反相機裡的M就是手動的意義。如果選中M，光圈、快門、ISO都需要手動調整。該選項适用于攝影師具... 2023-07-03
科技重齒水泥磨減速機工作原理
1、重齒水泥磨減速機的工作原理其實就是齒輪減速機的原理，它廣泛應用于冶金、礦山、起重、運輸、水泥、建... 2023-07-03

tft每日頭條

> 科技

> 怎麼部署ovf模闆

怎麼部署ovf模闆

相关科技资讯推荐

热门科技资讯推荐

网友关注