赞
踩
Spark SQL源自于Shark项目,但是Shark对于Hive的太多依赖(如采用Hive的语法解析器、查询优化器等等),制约了Spark各个组件的相互集成,所以提出了Spark SQL项目。SparkSQL抛弃原有Shark的代码,汲取了Shark的一些优点,如内存列存储(In-Memory Columnar Storage)、Hive兼容性等,重新开发了SparkSQL代码。
本项目使用HBase中的表sogoulogs数据作为离线分析的数据源。
(1)File-> New -> project -> maven -> 勾选Create From archetype,向下选择scala-archetype-simple,点击next
(2)设置GroupID和ArtifactID ,点击next
(3)设置Maven相关选项,然后点击next
(4)紧接着一直Next,最后得到的工程架构如下所示
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。