赞
踩
Spark 是一种快速、通用、可扩展的大数据分析引擎,Spark 生态系统是一个包含多个子项目的集合,其中包含 SparkSQL、Spark Streaming、GraphX、MLlib 等子项目,Spark 是基于内存的大数据并行计算框架。Spark 基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将 Spark 部署在大量廉价硬件之上,形成集群。
MapReduce 的缺点与不足
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。