蘇州電商雲倉方案-tft每日頭條

蘇州電商雲倉方案

圖文更新时间:2025-04-24 12:28:38

#頭條創作挑戰賽#

項目背景和架構介紹一、項目背景介紹

湖倉一體實時電商項目是基于某寶商城電商項目的電商數據分析平台，本項目在技術方面涉及大數據技術組件搭建，湖倉一體分層數倉設計、實時到離線數據指标分析及數據大屏可視化，項目所用到的技術組件都從基礎搭建開始，目的在于湖倉一體架構中數據倉庫與數據湖融合打通，實現企業級項目離線與實時數據指标分析。在業務方面目前暫時涉及到會員主題與商品主題，分析指标有用戶實時登錄信息分析、實時浏覽pv/uv分析、實時商品浏覽信息分析、用戶積分指标分析，後續還會繼續增加業務指标和完善架構設計。

二、項目架構1、實時數倉現狀

當前基于Hive的離線數據倉庫已經非常成熟，随着實時計算引擎的不斷發展以及業務對于實時報表的産出需求不斷膨脹，業界最近幾年就一直聚焦并探索于實時數倉建設。根據數倉架構演變過程，在Lambda架構中含有離線處理與實時處理兩條鍊路，其架構圖如下：

蘇州電商雲倉方案（湖倉一體電商項目）1

正是由于兩條鍊路處理數據導緻數據不一緻等一些列問題所以才有了Kappa架構，Kappa架構如下：

蘇州電商雲倉方案（湖倉一體電商項目）2

Kappa架構可以稱為真正的實時數倉，目前在業界最常用實現就是Flink Kafka，然而基于Kafka Flink的實時數倉方案也有幾個非常明顯的缺陷，所以在目前很多企業中實時數倉構建中經常使用混合架構，沒有實現所有業務都采用Kappa架構中實時處理實現。Kappa架構缺陷如下：

Kafka無法支持海量數據存儲。對于海量數據量的業務線來說，Kafka一般隻能存儲非常短時間的數據，比如最近一周，甚至最近一天。
Kafka無法支持高效的OLAP查詢，大多數業務都希望能在DWD\DWS層支持即席查詢的，但是Kafka無法非常友好地支持這樣的需求。
無法複用目前已經非常成熟的基于離線數倉的數據血緣、數據質量管理體系。需要重新實現一套數據血緣、數據質量管理體系。
Kafka不支持update/upsert，目前Kafka僅支持append。實際場景中在DWS輕度彙聚層很多時候是需要更新的，DWD明細層到DWS輕度彙聚層一般會根據時間粒度以及維度進行一定的聚合，用于減少數據量，提升查詢性能。假如原始數據是秒級數據，聚合窗口是1分鐘，那就有可能産生某些延遲的數據經過時間窗口聚合之後需要更新之前數據的需求。這部分更新需求無法使用Kafka實現。

所以實時數倉發展到現在的架構，一定程度上解決了數據報表時效性問題，但是這樣的架構依然存在不少問題，Kappa架構除了以上所說的問題之外，實時業務需求多的公司在選擇Kappa架構後，也避免不了一些離線數據統一計算的場景，針對Kappa架構往往需要再針對某層Kafka數據重新編寫實時程序進行統一計算，非常不方便。

随着數據湖技術的出現，使Kappa架構實現批量數據和實時數據統一計算成為可能。這就是我們今天聽到的“批流一體”,在業界中很多人認為批和流在開發層面上都統一到相同的SQL上處理是批流一體，也有一些人認為在計算引擎層面上批和流可以集成在同一個計算引擎是批流一體，比如：Spark/SparkStreaming/Structured Streaming/Flink框架在計算引擎層面上實現了批處理和流處理集成。

以上無論是在業務SQL使用上統一還是計算引擎上的統一，都是批流一體的一個方面，除此之外，批流一體還有一個最核心的方面就是存儲層面上的統一。數據湖技術可以實現将批數據和實時數據統一存儲，統一處理計算。我們可以将離線數倉中的數倉和實時數倉中的數倉數據存儲統一合并到數據湖上，可以将Kappa架構中的數倉分層Kafka存儲替換成數據湖技術存儲，這樣做到“湖倉一體”的構建。

“湖倉一體”架構構建也是目前各大公司針對離線場景和實時場景統一處理計算的方式。例如：一些大型公司使用Iceberg作為存儲，那麼Kappa架構中很多問題都可以得到解決，Kappa架構将變成個如下模樣：

蘇州電商雲倉方案（湖倉一體電商項目）3

這條架構中無論是流處理還是批處理，數據存儲都統一到數據湖Iceberg上，這一套結構将存儲統一後，解決了Kappa架構很多痛點，解決方面如下：

可以解決Kafka存儲數據量少的問題。目前所有數據湖基本思路都是基于HDFS之上實現的一個文件管理系統，所以數據體量可以很大。
DW層數據依然可以支持OLAP查詢。同樣數據湖基于HDFS之上實現，隻需要當前的OLAP查詢引擎做一些适配就可以進行OLAP查詢。
批流存儲都基于Iceberg/HDFS存儲之後，就完全可以複用一套相同的數據血緣、數據質量管理體系。
實時數據的更新。

上述架構也可以認為是Kappa架構的變種，也有兩條數據鍊路，一條是基于Spark的離線數據鍊路，一條是基于Flink的實時數據鍊路，通常數據都是直接走實時鍊路處理，而離線鍊路則更多的應用于數據修正等非常規場景。這樣的架構要成為一個可以落地的實時數倉方案、可以做到實時報表産生。

2、項目架構及數據分層

此項目中我們使用的數據湖技術是Iceberg構建“湖倉一體”架構來實時和離線分析電商業務指标。項目整體架構圖如下圖所示：

蘇州電商雲倉方案（湖倉一體電商項目）4

項目中的數據來源有兩類，一是MySQL業務庫數據，另一類是用戶日志數據，我們通過對應的方式将兩類數據首先采集到Kafka各自topic中，通過Flink處理将業務和日志數據存儲在Iceberg-ODS層中，由于目前Flink基于Iceberg處理實時數據不能很好保存數據消費位置信息，所以這裡同時将數據存儲在Kafka中，利用Flink消費Kafka數據自動維護offset的特性來保證程序停止重啟後消費數據的正确性。

整個架構是基于Iceberg構建數據倉庫分層，經過Kafka處理數據都實時存儲在對應的Iceberg分層中，實時數據結果經過最後分析存儲在Clickhouse中，離線數據分析結果直接從Iceberg-DWS層中獲取數據分析，分析結果存入MySQL中，Iceberg其它層供臨時性業務分析，最終Clickhouse和MySQL中的結果通過可視化工具展示出來。

3、項目可視化效果

蘇州電商雲倉方案（湖倉一體電商項目）5

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

圖文黃聖依黃聖池啥關系
黃金榮曾是在上海灘呼風喚雨的青幫大佬，他一生權勢滔天，但是晚年卻光景凄慘。而黃聖依與黃金榮都姓黃，有人說黃聖依其實是黃金榮的後代。那麼黃聖依和黃金榮的關系是什麼?真的如大家所說的那樣，黃聖依竟是青幫大佬的後人?黃金榮有後人嗎?他們還活着嗎?... 2023-03-16
圖文職工生育保險怎麼交的
職工生育保險怎麼交的?生育保險是國家通過社會保險立法，對生育職工給予經濟、物質等方面幫助的一項社會政策其宗旨在于通過向生育女職工提供生育津貼、産假以及醫療服務等方面的待遇，保障她們因生育而暫時喪失勞動能力時的基本經濟收入和醫療保健，幫助生育... 2023-03-23
圖文傅少你夫人又重生了
馬甲文江阮，被一個組織TBI強行改造基因，心髒受到了極大的負荷和創傷，會逐漸衰竭，是活不過二十五歲的。從被那地方改造之時就注定了她的命運，意味着她被世間所不容。那段時光，小啞巴是陪她一起度過，在逃出那裡後，也一直在尋找小啞巴，即使所有人都說... 2022-11-24
圖文早期武打女星有哪些
想必大家一提到香港武打明星，第一時間想到絕對是李連傑或者成龍等人吧！他們在動作片出色表現都給觀衆留下了十分深刻的印象，但是，如果要說女性當中的武打明星，想必很多人又一定會把楊紫瓊歸類其中吧！其實在香港娛樂圈還有一個人，武打場面不熟楊紫瓊，沒... 2023-03-15
圖文魔獸争霸3推薦玩的地圖
魔獸争霸3推薦玩的地圖?魔獸争霸3當年在網吧裡掀起了一股大潮，除了經典的戰役與對戰玩法，之後玩家利用遊戲内置的地圖編輯器也創造了許多經典的地圖，最經典的就是DOTA接下來讓記憶君帶你回憶十個經典的地圖吧~，我來為大家科普一下關于魔獸争霸3推... 2022-10-18
圖文奧體中心遊泳館在哪裡
今天是全國第九個“全民健身日”，湖州有多個體育場館免費開放，其中，市民對湖州市奧體中心遊泳館的首次開放十分期待。記者從湖州市體育局獲悉，奧體中心遊泳館于8月8日起試運行。當天，兒童嬉水池與訓練池按不同場次免費開放，比賽池因下水前泳客須持有《... 2023-01-14
圖文高配低價的骁龍835
目前國外很多媒體以及零售網站都是開始曝光一加手機5的詳細信息，來自geekbuying網站的消息顯示一加手機5售價為449.99美元，約人民币3100元。所以小編認為國内售價應該更低一些，比如在2999元之類的。但總而言之這些信息都能表明一... 2023-03-07
圖文八個方法鍛煉膝關節助力關節康複
八個方法鍛煉膝關節助力關節康複?膝關節由4塊骨頭交叉構成（股骨、髌骨、胫骨和腓骨），并由周圍的韌帶（髌韌帶、側副韌帶、交叉韌帶）和肌肉（股四頭肌和腘繩肌等）維持穩定，今天小編就來聊一聊關于八個方法鍛煉膝關節助力關節康複?接下來我們就一起去研... 2022-10-12
圖文痔瘡手術後拉個肚子會肛門狹窄嗎
其實很多人都會發生這樣的事情，就是覺得自己的大便變細了。如果不及時治療，久而久之會導緻身體出現問題，嚴重時會引發腫瘤，嚴重影響正常生活。肛門的改變主要是由于括約肌的協調問題，可以由專門的科室進行檢查，可以通過手指檢查和肛門測壓來判斷。如果肛... 2022-11-24
圖文推動電商新業态新模式發展
近日，商務部發布的《中國電子商務報告》顯示，2021年全國電子商務交易額達42.3萬億元，同比增速19.6%；全國網上零售額達到13.09萬億元，同比增長14.1%。和2012年1.3萬億元的網上零售額相比，過去十年，全國網上零售額增長了9... 2023-02-01
圖文人一曬就黑吃什麼好
日常生活中，我們見過很多吃的會被冠上“美容美白”的作用，但你知道嗎，有些吃的不僅不能美白，還有可能讓你“變黑”、“變黃”，甚至出現紅腫、瘙癢、水泡等一系列皮膚問題！當心讓人變黑這些食物這個季節，我們總能看到各種奇怪的新聞報道：“21歲的大學... 2023-03-08
圖文蘇聯水泥風格建築
蘇聯式建築有一種很獨特的美學，我不知道該如何定義，總之有點廢土朋克的味道，有點未來烏托邦的感覺，又恰似外星人的地球基地。那些粗線條、大塊面的鋼筋混凝土建築，透着冷峻與莊嚴。1.這是蘇聯機器人研究院位于列甯格勒（聖彼得堡）。蘇聯最尖端科技的結... 2023-02-28
圖文柴達木雅丹地貌形成過程
撰文/付嬌（中國科學院古脊椎動物與古人類研究所）本文來自《知識就是力量》雜志柴達木盆地是中國四大盆地之一，主要位于青海省海西蒙古族藏族自治州。這裡擁有世界上唯一一處水上雅丹地貌，戈壁一望無垠，鹽湖衆多，偶見野生動物穿梭其中，最重要的是富含動... 2023-02-20
圖文 147和150哪個号碼段好
大家說到170和171号段的時候，除了本身在使用的人知道自己的号碼是什麼信号機制以外，還有一些從事虛拟運營商工作的人員一看号碼就知道是什麼運營商信号機制。很多人是不清楚的。下面數據給你看懂：虛拟運營商号段：隻有170和171兩個号段區别号碼... 2023-02-12
圖文蜻蜓為啥能立在水上
蜻蜓雖然是生活在陸地上的昆蟲，整日翺翔在空中,但它們的幼蟲卻要生活在水裡,為了繁衍後代,它必須選擇在有水的地方産卵,受精卵要在水中才能孵化,于是蜻蜓用尾巴點水的方法,把受精卵排到水中,卵到了水中附着在水草上,不久便孵出幼蟲，幼蟲叫水虿在水中... 2022-12-08
圖文高山清渠幾點開播
當下劇集市場真是熱鬧，本以為古裝大戲會席卷整個暑假檔，沒想到卻是異常平靜，大家期待的《蒼蘭訣》《玉骨遙》還沒有傳出定檔的消息，隻有楊紫成毅主演的《沉香如屑》在沒有任何宣傳的情況下登錄網播平台開播，貓眼全網熱度力壓《星漢燦爛》，榮獲全網第一的... 2023-02-19
圖文我的世界紫色陶瓦
玩家找到最稀有的陶瓦山地形，是為了解鎖成就？還是為了裝*？對，這些都有。但是最重要的還是為了尋找最稀有的建材，蓋最漂亮的建築，成為服務器裡最靓的仔。然後開豪車，迎娶白富美，然後造人。咳咳咳，扯遠了。大家好，我是Minecraft講師，超凡。... 2022-12-05
圖文營業廳可以查身份證号嗎
平台信息員241報料：現在的身份證信息最不保密了，我的身份證下面竟然有這麼多聯通卡！小編數了數，竟然有十二個，而且這些号碼的歸屬地，天南海北的哪兒都有！信息員241說他本人用的号碼之前一直沒有實名認證，營業廳打電話讓他去實名認證後，聯通的工... 2023-01-26
圖文天玑12000和天玑700對比
2022年春季旗艦新品大潮還未正式到來，但眼下已經有了一些争奇鬥豔，精彩紛呈的意思。和往年的12月高通新年旗艦平台的“一枝獨秀”的情況不同，聯發科今年提前放出的年度大招——天玑9000旗艦SoC在很大程度上改變了當前安卓旗艦市場的競争格局。... 2022-12-03
圖文入駐京東自營店需要哪些條件
京東自營店是不是開在本地？京東自營店的入駐當中沒有足夠豐富知識是很難成功的，人們得将這些問題都考慮清楚才能按照規定來進行操作，下面就來跟着我們看看京東入駐當中的具體情況吧。一、京東自營店是不是開在本地？京東自營店指的是京東線上平台的入駐并不... 2023-03-26
圖文 mozilla公司
Mozilla是誰，可能沒有多少人知道；但如果提及Firefox，在互聯網上卻是鼎鼎有名，那頭火紅的狐狸不知道占據了多少用戶的電腦和手機桌面。或許是因為在網絡浏覽器上的逆襲過于成功，Mozilla所推出的FirefoxOS從一開始就備受業界... 2023-01-20
圖文剛買來的烏龜食欲超級好怎麼辦
剛快遞回來的龜，由于受到運輸途中的長途跋涉，需要靜養、消毒和能量補充。具體方法如下：1、龜到家前準備工作心愛的龜馬上就到家了，我們需要提前準備在太陽下暴曬兩天的水。這是因為自來水中含有氯，直接用自來水容易導緻烏龜腐皮、白眼、爛甲等。2、實時... 2023-02-08
圖文陳情令孟子義飾演什麼角色
2019年最令小說迷們難過的，無疑就是期待了整整一年的《陳情令》還沒有播出！那麼陳情令溫情是女主嗎？溫情飾演者是誰呢？下面就和娛樂塘主一起來了解一下吧。陳情令溫情是否是女主《陳情令》中，溫情是網傳的女一号，由孟子義飾演。網傳溫情不僅增加了很... 2023-01-12
圖文 80後小時候玩過的自制玩具
兒童節又快到啦！80後的叔叔阿姨們，快來看看這些爆款自制玩具，你小時候玩過幾個？現在你還記得怎麼制作、怎麼玩嗎？小新來幫你回憶一下吧！東南西北【1】将正方形的紙，角和角對折成三角形【2】把三角形再對折一次【3】把紙張打開，留下折痕【4】将四... 2023-02-12
圖文保密法宣傳教育簡報
編者按國家利益高于一切，保密責任重于泰山。為增強廣大婦女和家庭保密意識，提升婦女群衆防範和抵禦風險能力，築牢國家安全屏障，海南省婦聯推出“椰姐姐說保密法”系列宣傳。今天，小編帶領三亞的姐妹們和椰姐姐一起學習《保密法》，從自身做起，從點滴做起... 2023-01-21
圖文青金石多白多金
青金石（英文：Lapislazuli，來源于拉丁語），在中國古代稱為璆琳、金精、瑾瑜、青黛等。化學分子式為，屬等軸晶系。晶體形态呈菱形十二面體，集合體呈緻密塊狀、粒狀結構。因具有深豔的天藍色，上面又點綴着黃鐵礦的星點，故稱青金石。因為青金石... 2022-11-21
圖文女人上嘴唇上長小胡子
胡子對男人來說是越濃密越好，代表着男人味十足，但是，對于女性來說長胡子就是晴天霹靂。而且，有很多女性的嘴唇上會長一圈小胡子，看着很難受，但是又不敢把胡子都剃光了。看着那些沒有胡子的女性，心裡除了羨慕，也在思考為什麼自己長小胡子，别人卻不長。... 2023-01-09
圖文張紀中碧血劍為何評價高
從現在開始張紀中的《碧血劍》就是我心中最完美的武俠劇了，雖然不是最喜歡看的，但是從各方面來說，的确是最完美的。張紀中其它的劇也很好，但是往往同樣題材的，TVB拍的也很好，雙方粉絲就喜歡撕來撕去，缺點就被無限放大了。婆婆真的是上了年紀，越來越... 2023-03-12
圖文手機充話費薅羊毛
手機充話費薅羊毛?今天淩晨，電商平台拼多多被曝出現重大BUG，用戶可領100元無門檻券這一漏洞引來了大批用戶“薅羊毛”，并全部将優惠券用作話費充值，Q币充值等，今天小編就來聊一聊關于手機充話費薅羊毛?接下來我們就一起去研究一下吧!手機充話費... 2022-10-09
圖文白色陶瓷杯子喝水好嗎
敢不敢告訴小編，你每天喝水用的是什麼杯子？今天我們就來對各種杯子一一揭秘！1、不鏽鋼杯不鏽鋼杯屬于合金制品，使用不當會使其中所含的重金屬物質釋放出來，危害健康。在日常使用中，用不鏽鋼杯盛普通水倒問題不大，但不要裝酸性飲品，如果汁、咖啡、碳酸... 2023-03-26

tft每日頭條

> 圖文

> 蘇州電商雲倉方案

蘇州電商雲倉方案

相关圖文资讯推荐

热门圖文资讯推荐

网友关注