【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群(第五步)(4),spark亚太


7,在SparkWorker1和SparkWorker2上完成和SparkMaster同样的Hadoop 2.2.0操作,建议使用SCP命令把SparkMaster上安装和配置的Hadoop的各项内容拷贝到SparkWorker1和SparkWorker2上;

8,启动并验证Hadoop分布式集群

第一步:格式化hdfs文件系统:




第二步:进入sbin中启动hdfs,执行如下命令:


启动过程如下:


此时我们发现在SparkMaster上启动了NameNode和SecondaryNameNode;

在SparkWorker1和SparkWorker2上均启动了DataNode:



此时访问http://SparkMaster:50070 登录Web控制可以查看HDFS集群的状况:







Spark课程都在讲什内容?

《18小时内掌握Spark》课程模块
第1堂课:Spark的架构设计
第2堂课:实战使用三种语言开发Spark
第3堂课:快速掌握Scala
第4堂课:Spark集群的安装和设置
第5堂课:编写Spark程序
第6堂课:SparkContext解析和数据加载以及存储
第7堂课:深入实战RDD
第8堂课:spark的原理和使用
第9堂课:Spark程序的测试
第10堂课:Spark的优化
第11堂课:Spark的其它主题介绍
 

我想学习Spark,怎着手开始?

可以读读Spark相关的书籍,不过这类书籍确实不是很多。Spark技术相对Hadoop,资料比较少。很多都是国外的资料,中文版的少。
不知道你的基础,建议还是参加课程学习,更快速。比自己摸索强。推荐Spark亚太研究院的《18小时内掌握Spark》这个课程。这是个入门级的课程
 

相关内容