【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群(第五步)(5),spark亚太


从控制台我们可以看见有两个DataNode,此时我们点击“Live Nodes”查看一下其信息:


从控制台中看到了我们的两个Datanode节点SparkWorker1和SparkWorker2,这正是我们预期中的!

第三步:启动yarn集群


使用jps命令可以发现SparkMaster机器上启动了ResourceManager进程:


而在SparkWorker1和SparkWorker2上则分别启动了NodeManager进程:



在SparkMaster上访问http://SparkMaster:8088 可以通过Web控制台查看ResourceManager运行状态:


在SparkMaster上访问http://SparkWorker1:8042  可以通过Web控制台查看SparkWorker1上的NodeManager运行状态:


在SparkMaster上访问http://SparkWorker2:8042  可以通过Web控制台查看SparkWorker2上的NodeManager运行状态:


接下来使用“mr-jobhistory-daemon.sh”来启动JobHistory Server:


启动后可以通过http://SparkMaster:19888 在Web控制台上看到JobHistory中的任务执行历史信息:





Spark课程都在讲什内容?

《18小时内掌握Spark》课程模块
第1堂课:Spark的架构设计
第2堂课:实战使用三种语言开发Spark
第3堂课:快速掌握Scala
第4堂课:Spark集群的安装和设置
第5堂课:编写Spark程序
第6堂课:SparkContext解析和数据加载以及存储
第7堂课:深入实战RDD
第8堂课:spark的原理和使用
第9堂课:Spark程序的测试
第10堂课:Spark的优化
第11堂课:Spark的其它主题介绍
 

我想学习Spark,怎着手开始?

可以读读Spark相关的书籍,不过这类书籍确实不是很多。Spark技术相对Hadoop,资料比较少。很多都是国外的资料,中文版的少。
不知道你的基础,建议还是参加课程学习,更快速。比自己摸索强。推荐Spark亚太研究院的《18小时内掌握Spark》这个课程。这是个入门级的课程
 

相关内容