当前位置:   article > 正文

Hadoop集群搭建_设置yarn核心参数,指定resourcemanager进程所在主机为master,端口为18141

设置yarn核心参数,指定resourcemanager进程所在主机为master,端口为18141;指定map

8.设置HDFS参数,关闭hadoop集群权限校验(安全配置),允许其他用户连接集群

在master、slave1、slave2上操作:

修改 hdfs-site.xml 文件以设置HDFS参数:

vim hdfs-site.xml
  • 1
<property>
 <!--备份文本数量为2-->
 <name>dfs.replication</name>																
   <value>2</value>
 </property>
 <property>
 <!--namenode节点数据存储目录-->
   <name>dfs.namenode.name.dir</name>
   <value>/root/hadoopData/name</value>
 </property>
  <!--datanode节点数据存储目录-->
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/root/hadoopData/data</value>
</property>
<!-- 设置HDFS的文件权限-->
 <property>
   <name>dfs.permissions</name>
   <value>false</value>
</property>
<property>
	<name>dfs.datanode.use.datanode.hostname</name>
	<value>true</value>
</property>

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25

9.设置YARN运行环境$JAVA_HOME参数(yarn-env.sh,使用绝对路径)

在master、slave1、slave2上操作:

vim yarn-env.sh
  • 1

修改yarn-env.sh中的第23行为JAVA_HOME路径:

export JAVA_HOME=/usr/java/jdk1.8.0_171
  • 1

在这里插入图片描述

10.设置YARN核心参数,指定mapreduce 获取数据的方式为mapreduce_shuffle (yarn-site.xml)

vim yarn-site.xml
  • 1

在< configuration></ configuration>中添加如下内容 :

<property>
	<name>yarn.nodemanager.aux-services</name>
	<value>mapreduce_shuffle</value>
</property>
  • 1
  • 2
  • 3
  • 4

在这里插入图片描述

11.设置计算框架参数,指定MR运行在yarn上 (mapred-site.xml)

在master、slave1、slave2上操作:

Hadoop集群中没有mapred-site.xml这个文件,因此需要把mapred-site.xml.template复制为mapred-site.xml

cp mapred-site.xml.template mapred-site.xml
vim mapred-site.xml
  • 1
  • 2

在< configuration></ configuration>中添加如下内容 :

<!-- 指定MR运行在yarn上 -->
<property>
	<name>mapreduce.framework.name</name>
	<value>yarn</value>
</property>
  • 1
  • 2
  • 3
  • 4
  • 5

在这里插入图片描述

12.设置节点文件slaves,要求slave1、slave2为子节点

在master、slave1、slave2上操作:

还是在 /usr/hadoop/hadoop-2.7.3/etc/hadoop 路径下,修改master、slaves文件:

vim master
=== 写入 ===
master
  • 1
  • 2
  • 3
vim slaves

=== 写入 ===

slave1
slave2
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

在这里插入图片描述

13.对文件系统进行格式化

在master上操作:

hadoop namenode -format
  • 1

在这里插入图片描述

14.启动Hadoop集群查看各节点服务

在master上操作:

start-all.sh start
  • 1

然后输入 yes 即可启动:
在这里插入图片描述

15.查看集群运行状态是否正常

hadoop dfsadmin -report
  • 1

也可以查看java进程中的namenode和datanode是否启动jps

(补充)设置YARN核心参数,指定ResourceManager进程所在主机为master,端口为18141:

在master、slave1、slave2上操作:

vim yarn-site.xml
  • 1

在< configuration></ configuration>中添加如下内容 :

<!-- 指定ResourceManager进程所在主机 -->
<property>
	<name>yarn.resourcemanager.admin.address</name>
	<value>master:18141</value>
</property>
  • 1
  • 2
  • 3
  • 4
  • 5

在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/721090
推荐阅读
相关标签
  

闽ICP备14008679号