tft每日頭條

 > 生活

 > hadoop的原理是什麼

hadoop的原理是什麼

生活 更新时间:2024-08-12 14:42:18

大數據已經滲透到各行各業,不管是金融,交通,電商,政府都,都在推行大數據,但是很多天天提大數據,尤其是對于剛學習大數據或者即将學習大數據的,肯定還對hadoop是什麼比較模糊,今天給大家總結一下什麼是hadoop


hadoop的原理是什麼(Hadoop是什麼你了解嗎)1

一、Hadoop介紹

Hadoop是Apache軟件基金會旗下的一個開源分布式計算平台。以Hadoop分布式文件系統(Hadoop Distributed File System,HDFS)和(Google MapReduce的開源實現)為核心的Hadoop為用戶提供了系統底層細節透明的分布式基礎架構。HDFS的高容錯性、高伸縮性等優點允許用戶将Hadoop部署在低廉(low-cost)的硬件上,形成分布式系統;MapReduce分布式編程模型允許用戶在不了解分布式系統底層細節的情況下并發并行應用程序。所以用戶可以利用集群的Hadoop輕松地組織計算機資源,從而搭建自己的分布式計算平台,并且可以充分利用集群的計算和存儲能力,完成海量數據的處理。

Hadoop是一個開源框架,可編寫和運行分布式應用處理大規模數據。分布式計算是一個寬泛并且不斷變化的領域。

二、Hadoop的優勢

1) 方便:Hadoop運行在由一般商用機器構成的大型集群上,或者雲計算服務上,比如EC2。

2) 健壯:Hadoop緻力于在一般商用硬件上運行,其架構假設硬件會頻繁失效,Hadoop可以從容地處理大多數此類故障。

3) 可擴展:Hadoop通過增加集群節點,可以線性地擴展以處理更大的數據集。

4) 簡單:Hadoop允許用戶快速編寫高效的并行代碼。

三、依賴工具

目前有很多工具能夠讓Hadoop更容易使用,例如Hive,可以将查詢語句轉換成MapReduce任務。但是MapReduce的複雜性和局限性(單任務批處理)使得Hadoop在更多情況下都被作為數據倉庫使用而非數據分析工具

四、總結

Hadoop框架的核心是HDFS和MapReduce。其中 HDFS 是分布式文件系統,MapReduce 是分布式數據處理模型和執行環境。掌握了這兩部分,也就掌握了Hadoop最核心的東西。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved