本地开发spark代码上传spark集群服务并运行（基于spark官网文档），spark集群

文章由LinuxBoy分享于2019-03-27 07:03:53热评（516）

本地开发spark代码上传spark集群服务并运行（基于spark官网文档），spark集群

打开IDEA 在src下的main下的scala下右击创建一个scala类名字为SimpleApp ,内容如下

import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf
object SimpleApp {
  def main(args: Array[String]) {
    val logFile = "/home/spark/opt/spark-1.2.0-bin-hadoop2.4/README.md" // Should be some file on your system
    val conf = new SparkConf().setAppName("Simple Application")
    val sc = new SparkContext(conf)
    val logData = sc.textFile(logFile, 2).cache()
    val numAs = logData.filter(line => line.contains("a")).count()
    val numBs = logData.filter(line => line.contains("b")).count()
    println("Lines with a: %s, Lines with b: %s".format(numAs, numBs))
  }
}