赞
踩
参考《Python+Spark 2.0+Hadoop机器学习与大数据实战_林大贵(著) 清华大学出版社》
Hadoop集群需要4台服务器才可以建立,可以进行并行处理,所以在虚拟机上创建了master、data1~data3四个服务器。
计算机master在HDFS中作为NameNode,在MapReduce2中作为ResourceManager
计算机data1~data3在HDFS中作为DataNode,在MapReduce2中作为NodeManager
安装步骤:
(在virtualBox中直接完全复制即可)
在每一台虚拟主机上设置两个网卡(在virtualBox管理器界面上的设置)
固定IP、hostname、core-site.xml、YARN-site.xml、mapred-site.xml、hdfs-site.xml
(1)编辑interfaces网络配置文件
每次开机固定IP:192.168.56.101
sudo gedit /etc/network/interfaces
设置网卡1:
设置为“NAT网卡”,通过Host主机连接外部网络,设置为eth0,并设置dhcp自动获得IP地址
设置网卡2:
“仅主机适配器”,建立内部网络。设置为eth1,并设置为static,指定固定IP
# interfaces(5) file used by ifup(8) and ifdown(8)
a
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。