首先我们需要下载Spark并解压。这里将下载一个已编译好的最新版本。用浏览器访问http://spark.apache.org/downloads.html,
选择包类型为 “Pre-build for Hadoop2.4 and later",然后选择”Direct Download“,点击下面链接开始下载一个名为 spark-1.2.0-bin-hadoop2.4.tgz的压缩包。(译者注:当前最新版本已是1.3.0,下载的压缩包名为spark-1.3.0-bin-hadoop2.4.tgz)
Windows如果报
Failed to initialize compiler: object scala.runtime in compiler mirror not found. 可以修改bin/spark-class2.cmd 的92~96行(当前版本为Spark1.3.0 版本不同可能会有差异)添加-Dscala.usejavacp=true,修改后的内容为: