hive格式轉換函數-tft每日頭條

hive格式轉換函數

科技更新时间:2026-07-10 15:17:56

在大數據開發過程中我們常常會處理一些客戶端日志，服務端的用戶行為日志等等，這些日志通常都是JSON格式的，要對這些日志進行研究就需要用Hive把它們做成關系型表，Hive官方為我們提供了兩個函數用于處理JSON格式數據。

get_json_object(STRING json_string, STRING path)

該函數從給定路徑上的JSON字符串中抽取出JSON對象，并返回這個對象的JSON字符串形式，如果輸入的JSON字符串非法，則返回NULL

json_tuple(STRING jsonStr, p1, p2, p3 .., pn)

該函數可以接受多個标簽名稱，對輸入的JSON字符串進行處理（UDTF），相比get_json_object更加高效，通過一次調用就可以獲得多個鍵值。json_tuple函數通常要和lateral view連用，用于将一行數據拆分成多行。

下面我們通過真實場景來看下兩個函數的使用方法和區别

源表定義和初始化

如下所示為一個遊戲對局結果的log樣本

2021-05-29 GameResult {"players":[{"player_id":43455341,"rank":2},{"player_id":15278345,"rank":1},{"player_id":2689332,"rank":3}],"game_id":"111129320310391","timestamp":1622254656,"start_time":1622251256} 2021-05-29 GameResult {"players":[{"player_id":43455342,"rank":1},{"player_id":15278342,"rank":2},{"player_id":2689332,"rank":3}],"game_id":"111129320310392","timestamp":1622255656,"start_time":1622254256} 2021-05-29 GameResult {"players":[{"player_id":43455343,"rank":2},{"player_id":15278343,"rank":1}],"game_id":"111129320310393","timestamp":1622258656}

我們定義一張Hive表,并将樣本數據寫入到Hive表

CREATE TABLE stark.game_result_test ( logdate DATE, logtype STRING, content STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'; # 加載數據 load data local inpath '/home/bi/xxx/gameresult_sample.txt' into table stark.game_result_test;

查看是否導入成功

hive格式轉換函數（如何優雅的用Hive處理json格式字符串）1

然後我們分别用兩個函數處理content字段

get_json_object函數

SQL如下

hive> SELECT t.logdate,t.logtype, > get_json_object(t.content,'$.players') AS players, > get_json_object(t.content,'$.game_id') AS game_id, > get_json_object(t.content,'$.timestamp') AS timestamp, > get_json_object(t.content,'$.start_time') AS start_time > FROM ( > SELECT logdate,logtype,content > FROM stark.game_result_test > ) t;

結果如下

hive格式轉換函數（如何優雅的用Hive處理json格式字符串）2

通過該函數輕松完成了content字段的解析，但是不難發現每個字段的提取都要通過調用該函數處理json字符串完成，當json字符串中字段很多時會嚴重影響處理的效率。

json_tuple函數

同樣是針對該表content字段的處理，使用json_tuple函數SQL語句如下

SELECT t.logdate,t.logtype,players,game_id,timestamp,start_time FROM stark.game_result_test t lateral view json_tuple(t.content,'players','game_id','timestamp','start_time') a AS players,game_id,timestamp,start_time;

由于get_tuple是UDTF函數（一個輸入多個輸出），所以要和lateral view 連用把一個字段拆分成多個字段。lateral view 得到的視圖要起一個别名（本例為a）。

最終查詢結果和get_json_object函數一緻。

最後

目前為止，看起來這兩個函數能夠滿足我們的基本需求，不過細心的讀者會發現通過兩個函數提取出來的players字段我們一直沒有進一步拆分（當我們要對每個玩家的對局結果處理時是需要拆分出每個玩家的）。

players字段是一個json數組，這兩個函數顯然都無法處理，這就需要我們自定義一個UDF函數來進行處理，後續章節我會帶領大家了解一下hive的自定義UDF，并拿該函數作為樣例。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技櫃式空調如何清理
在清洗之前我們要關閉空調電源，拔去插頭，打開窗戶，保持室内空氣流通。然後取下過濾網，露出散熱片，使用專業的空調消毒劑，充分搖勻，在離散熱片約5厘米處，對準散熱片按上下順序徹底噴洗，噴洗結束後等候15分鐘左右，然後裝好過濾網，蓋上外殼，再運轉空調制冷程序15-30分鐘就可以了。 2024-01-06
科技中央空調機分為幾類
中央空調系統由冷熱源系統和空氣調節系統組成。制冷系統為空氣調節系統提供所需冷量，用以抵消室内環境的冷負荷；制熱系統為空氣調節系統提供用以抵消室内環境熱負荷的熱量。制冷系統是中央空調系統至關重要的部分，其采用種類、運行方式、結構形式等直接影響了中央空調系統在運行中的經濟性、高效性、合理性。按構造不同，... 2024-01-06
科技微波爐骨肉相連
骨肉相連在制作的時候采用的是雞腿肉和雞脆骨，一塊雞肉一塊脆骨的串起來，經過炸之後一口下去咯嘣咯嘣的響，也非常的具有嚼頭，真的是非常好吃。不過傳統制作骨肉相連的方法是在油鍋裡面炸，屬于一種油炸食品，因此很多朋友都擔心吃的過多會影響身體的健康，這也無可厚非。不過現在您想吃骨肉相連可并不一樣非要吃油炸的了... 2024-01-06
科技如何保養照相機
1、要使用優質電池，10天内不再使用照相機應将電池取出，以防電池漏液損壞照相機。2、要使用優質膠卷，劣質膠卷會使自動卷片系統損壞。3、防熱、防潮、防震、防塵，保護機器元件，延長使用壽命。4、清潔時，用專用鏡頭刷等工具清潔，忌用其他溶劑代替。5、長期不用，要使調節裝置複位，快門釋放，取出電池，放入幹燥... 2024-01-06
科技空調制冷原理
随着夏天的腳步慢慢的到來，天氣也變得越來越熱。冰淇淋，冰棍，風扇，空調等夏日必需的産品也随着氣溫的上升而銷售得越來越火熱。特别是在二十一世紀，越着現代化工業的日益發展，人們對環境破壞也日益的加重，二氧化碳等溫室氣體的排放也越來越多，從而導緻着溫室效應越來越嚴重。因此生活在現代的我們，家裡或多或少都會... 2024-01-06
科技油霧淨化器
油霧淨化器其實是屬于一種工業環保設備。在使用這種油霧淨化器的時候，将其安裝在機床，或者是清洗機等等的機械加工設備之上，吸除一些加工腔之中的油霧，因此而達到淨化空氣的效果，也是可以因此更好的保護工人身體健康的目的。希望我們要加以注重。油霧淨化器屬于是一種安裝在了CNC加工中心，或者是磨床、車床等等各類... 2024-01-06
科技增強洗衣機洗滌效果的竅門
以往大家在使用洗衣機洗衣服，總喜歡多放些洗衣粉，以為泡沫越多，洗滌效果越好。其實，這種方法是錯誤的，其實洗滌衣物時也是有許多方法的，如有不清楚的朋友可以一起了解一下。【1】應使洗衣粉全部溶解如水溫過低，洗衣機就難骓溶解洗衣粉，可先用30℃左右的少量溫水使之全部溶解。如衣物及髒，可用40℃&mdash... 2024-01-06
科技微波爐的使用
說起微波爐，它的功能可真是不少，煮飯、熱菜、做蛋糕等等，因此很多朋友都想要家裡可以擁有一台微波爐。不過也有的朋友會擔心使用的時候會産生輻射，給自己的身體帶來傷害，其實如果是您正确的使用微波爐的話，輻射是不會給您的身體帶來什麼緻癌的影響的，這一點您可以放心。不過怎樣才算是正确的使用微波爐呢？這一點恐怕... 2024-01-06
科技空調箱風機帶水問題
現象：某建築物集中空調用淋水室處理機。運行時在吊頂上和風口處均滴水。原因：空調機有淋水室，現場組合，雖有擋水闆但因風速大(3.5m/s)，在風機吸入段仍有水落下。且風機吸入口很低，能将集水吸入，并打入送風管道在水平風管中積水。沿法蘭接口漏出，通過吊頂滴下，造成破壞吊頂事故。對策：1、将擋水闆設在集水... 2024-01-06
科技滾筒洗衣機的選購技巧
滾筒洗衣機的選購技巧滾筒洗衣機的特點滾筒的最大特點就是省水、費時間，如果你想具體了解工作原理和适用範圍，可以先看下之前的“滾筒or波輪的選擇”。另外要說明的一點，滾筒和波輪的洗淨比所用的對照組是不同的，所以不能通過洗淨比來衡量滾筒和波輪之間的洗淨能力。那麼多的電機都是什麼意思... 2024-01-06
科技打印機的具體操作
第一步：将打印機連接至主機，打開打印機電源，通過主機的“控制面闆”進入到“打印機和傳真”文件夾，在空白處單擊鼠标右鍵，選擇“添加打印機”命令，打開添加打印機向導窗口。選擇“連接到此計算機的本地打印機”，并... 2024-01-06
科技家用冰箱尺寸
如果你家正準備購買冰箱，但是你又不知道應該買什麼什麼尺寸的話，那就應該要看看這篇文章了。今天要和大家說的就是關于家用冰箱尺寸的介紹。冰箱在很多人的家庭中是必備的，冰箱的作用很大，可以保存一些食物，也可以制作一些冰激淩。選擇正确尺寸的冰箱也是很重要的。首先你要知道自己想要的冰箱可以滿足你的需求，有些冰... 2024-01-06
科技電熨鬥漏水
人們的衣服穿着時間長了，難免會出現褶皺的現象，而解決這個問題最好的方法就是使用電熨鬥進行熨燙，不過現在大多數家庭使用的電熨鬥都是蒸汽式的電熨鬥，雖然在使用的時候非常的方便，但是卻很容易導緻一種情況的出現，就是電熨鬥漏水。那麼，如果是出現這種情況要如何解決呢？蒸汽式的電熨鬥正常工作需要蒸汽孔和水箱保持... 2024-01-06
科技如何清潔電視機
電視機久不清洗的危害：電視機的内部在使用一段時間後，會積滿厚厚的一層塵埃，這些髒物加速了機器的老化，增加輻射，出現雪花點，嚴重的可造成短路、燒毀元器件，甚至能引起顯像管爆炸。所以電視機的内部要每年清洗一次。【1】清洗電視機内部清洗電視機内部時，先斷電源半小時，再打開電視機的後蓋，用電吹風将積塵吹淨，... 2024-01-06
科技家具品質巧識别
随着市民生活質量的提高，對家具的選擇也越來越講究，并且，如果家具的品質較低，甚至會對健康造成影響，因此選購時需要多花一些心思，否則真是既浪費了錢财又損耗了健康。【1】有強烈刺激氣味的家具不要買選購時可拉開抽屜、打開櫃門，體驗是否刺激得讓人流淚，如果有這樣的感覺，就表明這套家具的甲醛含量嚴重超标。【2... 2024-01-06
科技電子琴使用注意事項
1、不要将電子琴直接暴露在陽光下，或在熱源附近。否則溫度太高會引起電子琴氣和機械部分的損壞。2、不要将電子琴放在潮濕的地方。3、要避劇烈震動。也不要重物壓在琴上，攜帶和搬運時候，應用柔軟材料保護鍵盤和開關。4、應避免液體，灰塵，顆粒等侵入琴内，琴鍵之間要防止細小的雜物。如發針，縫衣服針，等進入鍵盤縫... 2024-01-06
科技電子琴使用保養
電子琴既是樂器，又是結構複雜的精密電器，一台高級電子琴所有的元件數目比彩色電視機還要多好幾倍。因此，除了準确地掌握它們的機能外，還要注意平時的合理保養，隻有這樣，才能使你的電子琴常葆青春，彈奏出多彩多姿的音響來。1、使用電子琴前，應認真核對電子琴的使用電壓及頻率，是否與說明書上載明的電源電壓及頻率相... 2024-01-06
科技電熱水器功率
很多人在選擇電器的時候，一個注意的就是電器的功率，熱水器也毫不例外。今天說的電熱水器功率，其實是很多人都想知道的，電熱水器的功率其實相比儲水式電熱水器的功率是可以節省很多的。因為很多地方都沒有接通天然氣，所以隻能使用傳統的煤氣式熱水器和電熱水器。關于電熱水器，很多人都認為它的功率比較大，但是相比煤氣... 2024-01-06
科技打印機的安裝
打印機的安裝一般分為兩個部分，一個是打印機跟電腦的連接，另一個就是在操作系統裡面安裝打印機的驅動程序。如果是安裝USB接口的打印機，安裝時在不關閉電腦主機和打印機的情況下，直接把打印機的USB連線一頭接打印機，另一頭連接到電腦的USB接口就可以了。按照上面的步驟把打印機跟電腦連接好之後，先打開打印機... 2024-01-06
科技如何使熨鬥保持清潔光亮
可以用牙膏經常擦拭熨鬥的底部和其他部位，熨鬥可以保持光亮如新。也可以在每次用完以後，用幹布擦拭熨鬥一遍，每隔兩星期，在熨鬥底部塗抹一次橄榄油，這樣不僅能使熨鬥防鏽，也可以使熨鬥底部保持光滑。 2024-01-06
科技蘇打粉清洗洗衣機
以前清潔洗衣機都是買專門的洗衣機槽的洗潔劑，但前段時間看到電視節目中介紹用蘇打粉來清潔洗衣機，現在我們就來體驗吧。蘇打粉清洗洗衣機，主要分兩個步驟：第一：先将二勺蘇打粉放入洗衣機裝洗衣粉的盒中，按照正常的程序洗衣服，洗衣機工作十分鐘後就将電源切斷，讓蘇打粉液浸泡半小時，在連接電源，讓洗滌程序繼續，直... 2024-01-06
科技加濕器用什麼水
很多地方幹燥的家庭，都會準備有加濕器，加濕器的作用就是可以增大空氣的濕度，這樣就不會讓人感覺那麼難受了。有些人不懂得加濕器用什麼水會比較好，對于加水在加濕器裡面，也是有講究的。如果你不知道的話，可以看看這篇文章。加濕器首選加入的水是蒸餾水。加濕器的水分是散發在空氣中的，也是可以解除到人們的皮膚和吸入... 2024-01-06
科技電熱水龍頭
在寒冷的冬季家裡的熱水一定要足夠，不過如果是想要開開水龍頭都流出來熱水的話，這恐怕就要使用電熱水龍頭了。電熱水龍頭有着熱水器和太陽能所不能比的優勢，雖然它們也可以産生熱水，但是水管中的水卻依然還是涼的，因此需要您把水管中的水流完之後才可以有熱水使用。電熱水龍頭可以讓您打開水龍頭就有熱水使用。所謂電熱... 2024-01-06
科技燃氣熱水器不打火
現在的家庭裡，隻要是安裝天然氣的，家裡的熱水器都不會使用耗電的熱水器，畢竟電費要比燃氣費貴出很多。不過在使用燃氣熱水器的時候，很容易出現一種問題，比較讓人惱火，就是燃氣熱水器不打火的情況。為了幫你解決這個問題，在這裡就為您介紹一下燃氣熱水器不打火的可能性。燃氣熱水器不打火是非常常見的一種問題，而導緻... 2024-01-06
科技燈暖型浴霸和送風型浴霸比較
熱傳導有三種方式：傳遞、對流、輻射。對流是由冷、熱空氣的溫差使整個空間中的空氣産生流動，進而使這空間的溫度升高。送風型的浴霸就是采用這一原理。落後輻射是以光波為載體，按線性方向送出熱量。燈炮型浴霸就是采用這一原理。送風型浴霸的升溫時間較長需提前開啟，這是缺點，但降溫時間也長（如想節能，可以提前關閉）... 2024-01-06
科技加濕器原理
加濕器在一些幹燥的地方比較多見，因為幹燥的空氣對人體的皮膚是有一定的傷害，如果置身在幹燥的空氣當中，自己感覺也是會很難受的。使用加濕器的話，大家應該要先了解加濕器的原理，知道加濕器是怎樣工作的，這樣才可以更好的去了解加濕器的用法，對自己有一定的幫助。使用加濕器要注意的是要控制好空氣中的濕度，如果濕度... 2024-01-06
科技電視機冒煙起火怎麼辦
1、迅速拔下電視機電源插頭，然後用棉被等不透空氣的物體将電視機嚴嚴實實地包裹起來，這樣電視機内的火焰就會因沒有空氣而熄滅；2、若電視機外殼和内部都已燃起火焰，就可用水澆滅；3、用幹粉、1211、二氧化碳等滅火器撲救；4、撲救電視機火災時，人體應避開熒光屏的正面，站在電視機後側比較安全。滅火劑不應直接... 2024-01-06
科技縫紉機跳線
縫紉機跳線也許家居生活上我們都知道，可是我們在縫衣服飛時候，出現了縫紉機跳線該怎麼辦呢，很多女性都反應，縫紉機是屬于一種比較老試的縫紉機，一直以來，都是使用不幾天就搬出來磨合了一下還算可以，下面我們就去看看有關的介紹吧。縫紉機跳線造成的原因，其實就是因為穿線方法其實是很不正确的，按照“穿線圖”的方式... 2024-01-06
科技等離子電視如何保養
散熱大功率産生的高溫可以看作是等離子電視的頭号大敵，所以在使用中要特别注意等離子電視的散熱，并且不要長時間的暴露在射燈和太陽下。屏幕灼傷因為長時間播放固定靜止畫面而使屏幕局部受到灼傷産生畫面殘影，這是等離子電視本身特性所決定的。電壓有條件的情況下應為等離子電視提供獨立的供電線路，或者再增加一個穩定電... 2024-01-06
科技燃氣熱水器安裝
一般的家用熱水器有用電和用燃氣兩種不同，如果是家裡安裝有天然氣的話，一般都睡使用燃氣熱水器，因為它燒水速度比較快，而且天然氣的價格也比電的價格要低很多，這些因素都讓燃氣熱水器成為了家裡的主流熱水器。不過為了保證燃氣熱水器在用的時候更少的出現問題，就一定要注意燃氣熱水器安裝。燃氣熱水器因為使用的是天然... 2024-01-06

tft每日頭條

> 科技

> hive格式轉換函數

hive格式轉換函數

相关科技资讯推荐

热门科技资讯推荐

网友关注