赞
踩
本文介绍Intellij IDEA编写Spark应用程序,读取hdfs上的文件,进行文件的词频统计,项目使用maven构建。
一、安装Scala插件
依次选择File->Settings->Plugins,在Marketplace中搜索scala进行安装,安装后根据提示重启IDEA。
二、创建maven项目
1.File->New->Project,选择Maven,点next
2.输入项目的名字,设置想要的GroupId,当然也可以不设置,然后Finish
三、添加pom依赖
1.在服务器spark安装目录下输入./bin/spark-shell
,查看spark和Scala的版本
2.pom.xml文件添加代码,把spark.version和scala.version改成自己的版本
<properties> <spark.version>2.1.0</spark.version> <scala.version>2.11</scala.version> </properties> <dependencies> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_${ scala.version}</artifactId> <version>${ spark.version}</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_${
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。