赞
踩
目录
Spark Streaming会监视指定的HDFS目录,并且处理出现在目录中的文件
(1)所有放入HDFS目录中的文件,都必须有相同的格式?
(2)要增加被扫描文件时,必须使用移动或者重命名的方式,将文件移入目录
已经处理的文件,文件的内容即使改变,也不会再次处理
基于HDFS文件的数据源是没有Receiver的,因此不会占用一个cpu core
- public static void main(String[] args) {
- SparkConf conf = new SparkConf()
- .setMaster("local[2]")
- .setAppName("HDFSWordCount"
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。