Ubuntu14（64位）集群环境下安装Hadoop2.4

文章由LinuxBoy分享于2019-03-27 04:03:50热评（433）

Ubuntu14（64位）集群环境下安装Hadoop2.4

经过前边的积累，今天终于实现了集群环境下部署Hadoop，并成功运行了官方的例子。

工作如下：

两台机器：

127.0.0.1 localhost
192.168.101.130 YP-X100e
192.168.101.110 ph-v370

安装环境，请参考

配置各种配置信息，请参考

注意事项：

A：主从机的ssh设置，主机中在终端中输入

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

拷贝文件到从节点

scp authorized_keys ph-v370:~/.ssh/

刚开始我一直失败的原因是用户不一致，导致一直无法登陆ssh，后来我新建了hadoop用户，并授予hadoop文件夹的权限

useradd -m hadoop
passwd hadoop
chown hadoop:hadoop hadoop-2.4.0

重新用hadoop的用户进行操作就可以了（包括启动hadoop服务等，最好都是用这个用户）
B：执行start-dfs.sh，子节点报异常“WARNorg.apache.hadoop.hdfs.server.datanode.DataNode: Problem connecting to server:YP-X100e/192.168.101.130:9000” 这里有一个卡点，需要修改主节点的hosts文件，注释掉127.0.1.1这行，你可以在注释之前执行

netstat -an | grep 9000

你会看到9000端口被127.0.1.1占用，所以会出现异常 C：格式化文件系统的命令应该是

hdfs namenode -format

D：Hadoop的服务和Yarn的服务需要单独启动

start-dfs.sh
start-yarn.sh

E：在主节点配置好所有的配置文件，直接都拷贝到从节点即可 F：跟做单节点例子的时候不同，我在拷贝文件的时候需要制定确切的路径，如这个：

原来直接执行
$ bin/hdfs dfs -put etc/hadoop input
现在需要执行
$ bin/hdfs dfs -put etc/hadoop /user/chenph/input

G：查进程使用命令是：PS -ef | grep ‘搜索内容’，杀进程是：kill -s 9 进程号，查看防火墙是：sudo ufw status H：可访问主节点查看Hadoop的状态http://YP-X100e:50070，下图可看到，有一个活动的从节点，也就是我的虚拟机中的那个Ubuntu

推荐文章：

Ubuntu14（64位）集群环境下安装Hadoop2.4