首页 理论教育 Namenode与Datanode的划分方法

Namenode与Datanode的划分方法

时间:2023-06-30 理论教育 版权反馈
【摘要】:一个HDFS集群由一个Namenode和一定数目的Datanode组成,如图2-2所示。Na-menode执行文件系统的namespace相关操作,例如打开、关闭、重命名文件和目录,同时决定了block到具体Datanode节点的映射。Datanode在Namenode的指挥下进行block的创建、删除和复制。单一节点的Namenode大大简化了系统的架构。Namenode负责保管和管理所有的HDFS元数据,因而在请求Namenode得到文件的位置后就不需要通过Namenode参与而直接从Da-tanode进行。

Namenode与Datanode的划分方法

一个HDFS集群由一个Namenode和一定数目的Datanode组成,如图2-2所示。

978-7-111-43496-2-Part01-18.jpg

图2-2 HDFS集群

Namenode是一个中心服务器,负责管理文件系统的namespace和客户端对文件的访问。

Datanode在集群中会有多个,一般是一个节点存在一个,负责管理其自身节点上附带的存储。在内部,一个大文件分成一个或多个block,这些block存储在Datanode集合里。Na-menode执行文件系统的namespace相关操作,例如打开、关闭、重命名文件和目录,同时决定了block到具体Datanode节点的映射。Datanode在Namenode的指挥下进行block的创建、删除和复制。(www.xing528.com)

单一节点的Namenode大大简化了系统的架构。Namenode负责保管和管理所有的HDFS元数据,因而在请求Namenode得到文件的位置后就不需要通过Namenode参与而直接从Da-tanode进行。

为了提高Namenode的性能,所有文件的namespace数据都在内存中维护,所以就天生存在了由于内存大小的限制导致一个HDFS集群提供服务的文件数量的上限。

根据目前的文档,一个元数据(一个HDFS文件块)占用200B,如果是页面抓取的小文件,那么32GB内存能承载1.5亿个左右的文件存储(有待精确详细测试)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈