首页 理论教育 如何搭建高效的Hadoop集群

如何搭建高效的Hadoop集群

时间:2023-07-01 理论教育 版权反馈
【摘要】:选择完全分布式搭建Hadoop 集群,需要依赖ZooKeeper 分布式协调系统进行协调管理,因此,需要安装ZooKeeper 集群。表3-2角色节点划分ZooKeeper 搭建过程如下。此时,Hadoop 的配置在各个节点上已经全部完成,下面进行Hadoop 的格式化及启动。

如何搭建高效的Hadoop集群

选择完全分布式搭建Hadoop 集群,需要依赖ZooKeeper 分布式协调系统进行协调管理,因此,需要安装ZooKeeper 集群。ZooKeeper 集群的角色节点划分见表3-2。

表3-2 角色节点划分

ZooKeeper 搭建过程如下。

登录ZooKeeper 官网,下载ZooKeeper,这里选择的版本是zookeeper-3.4.5,下载地址如下:

http://archive.apache.org/dist/zookeeper/zookeeper-3.4.5/

将下载好的zookeeper-3.4.5 上传至mynode3 节点/software 路径下,进行解压

在mynode3 节点上配置ZooKeeper 的环境变量,操作如下:

在ZooKeeper 路径/software/zookeeper-3.4.5/conf 下配置zoo.cfg 文件,操作如下:

将以上配置好的信息发送到mynode4、mynode5 节点,并按照上面的方式配置ZooKeeper的环境变量:

在mynode3、mynode4、mynode5 节点上分别创建路径/opt/data/zookeeper 存放ZooKeeper数据:

在mynode3、mynode4、mynode5 三个节点创建节点ID,在每台节点配置的dataDir 路径/opt/data/zookeeper 中添加myid 文件,操作如下:

在每台节点中启动ZooKeeper 集群并验证每台节点ZooKeeper 的角色,验证ZooKeeper 是否安装成功:

完成上述步骤后,ZooKeeper 安装成功,下面安装Hadoop 完全分布式集群。

在安装好ZooKeeper 系统的集群上搭建Hadoop。首先去Hadoop 的官网下载hadoop-2.6.5,下载地址如下:

https://archive.apache.org/dist/hadoop/common/hadoop-2.6.5/

将下载好的hadoop-2.6.5.tar.gz 压缩包上传至mynod1 节点/software 路径下,解压:

解压完成之后,可以配置Hadoop 的环境变量,配置如下。

打开/etc/profile 配置Hadoop 的环境变量:

在/software/hadoop-2.6.5/etc/hadoop 路径中的hadoop-env.sh 中加入JAVA_HOME:

配置/software/hadoop-2.6.5/etc/hadoop/hdfs-site.xml 文件,配置内容如下:

配置/software/hadoop-2.6.5/etc/hadoop/core-site.xml 文件,配置内容如下:

配置/software/hadoop-2.6.5/etc/hadoop/yarn-site.xml 文件,配置内容如下:

配置/software/hadoop-2.6.5/etc/hadoop/map-site.xml 文件,配置内容如下:

配置/software/hadoop-2.6.5/etc/hadoop/slaves 文件,配置DataNode 节点信息,配置信息如下:

至此,Hadoop 的配置已经完成,现在将/software/hadoop-2.6.5 目录发送到mynode2、mynode3、mynode4、mynode5 节点上,同时,在这些节点上配置Hadoop 的环境变量,并使环境变量生效。(www.xing528.com)

此时,Hadoop 的配置在各个节点上已经全部完成,下面进行Hadoop 的格式化及启动。

·启动ZooKeeper:

·在mynode1 的NameNode 中格式化ZooKeeper:

·在每台JournalNode 中启动所有的JournalNode:

·在mynode1 上格式化NameNode:

·在mynode1 启动NameNode,同时,在mynode2 中执行同步:

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈