(1)NameSpace(命名空間)的限制
由于NameNode在内存中存儲所有的元數據(metadata),因此單個NameNode所能存儲的對象(文件 塊)數目受到NameNode所在JVM的heap size的限制。50G的heap能夠存儲20億(200million)個對象,這20億個對象支持4000個DataNode,12PB的存儲(假設文件平均大小為40MB)。随着數據的飛速增長,存儲的需求也随之增長。單個DataNode從4T增長到36T,集群的尺寸增長到8000個DataNode。存儲的需求從12PB增長到大于100PB。
(2)隔離問題
由于HDFS僅有一個NameNode,無法隔離各個程序,因此HDFS上的一個實驗程序就很有可能影響整個HDFS上運行的程序。
(3)性能的瓶頸
由于是單個NameNode的HDFS架構,因此整個HDFS文件系統的吞吐量受限于單個NameNode的吞吐量。
能不能有多個NameNode
表3-3
NameNode |
NameNode |
NameNode |
元數據 |
元數據 |
元數據 |
Log |
machine |
電商數據/話單數據 |
圖3-25 HDFS Federation架構設計
不同應用可以使用不同NameNode進行數據管理
圖片業務、爬蟲業務、日志審計業務
Hadoop生态系統中,不同的框架使用不同的NameNode進行管理NameSpace。(隔離性)
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!