Java之美[从菜鸟到高手演变]之eclipse连接hadoop集群,eclipsehadoop
Java之美[从菜鸟到高手演变]之eclipse连接hadoop集群,eclipsehadoop
作者:二青
个人站点:zhangerqing.cn 邮箱:xtfggef@gmail.com 微博:http://weibo.com/xtfggef
准备工具:
- Ubuntu 14.10 desktop 64 bit
- eclipse 4.3 kepler jee version
- hadoop 2.6.0
- hadoop eclipse plugin 2.6.0
3. Window -> Open Perspective -> Other -> Map/Reduce,eclipse的下方会出现如下视图:
点击右上角的蓝色大象
location name随便填入,host填写hadoop集群的master所在的IP,第一个Port填写mapred-site.xml里定义的端口,如下图一,9001,第二个Port填写里core-site.xml定义的端口,如下图二,9000。填写完重启eclipse。
4. 打开上一个设置的页面,切换到Advanced parameters标签,修改如下配置项:dfs.replication,默认是3,要根据你的Datanode的个数来定,如果你仅有2个datanode,那么就写2,如果只有一个,就写1,大于或者等于3个,写3。
hadoop.tmp.dir,这个要跟上节建立的Hadoop集群配置中core-site.xml 中的hadoop.tmp.dir设置一样,此处我们填写的是/root/hadoop/tmp。重启eclipse。
5. 我们可以看到左侧资源管理器里的DFS Locations视图
右键文件夹可以上传/下载文件或者目录。注意:如果此时报:Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission denied: error,则需要修改dfs的访问权限,编辑hdfs-site.xml文件,加入:
<property> <name>dfs.permissions.enabled</name> <value>false</value> </property>
注意:生产环境不建议这么做。
6. 运行自带word count示例新建Map/Reduce项目,进入/home/adam/hadoop/share/hadoop/mapreduce/sources目录,解压hadoop-mapreduce-examples-2.6.0-sources.jar包,将里面的WordCount.java复制到新建的项目里,点击Run Configurations配置启动参数。这里的output文件夹必须是之前没有创建的,这里会自动创建,否则报“目录已存在”的错误。
最后Run As “Run On Hadoop”即可,执行完毕后,去看hdfs上的output1目录,查看输出。
这样eclipse就连接到hadoop集群并且可以执行map/reduce任务了。
有什么问题欢迎与我联系:
作者:二青
个人站点:zhangerqing.cn 邮箱:xtfggef@gmail.com 微博:http://weibo.com/xtfggef
评论暂时关闭