计算引擎Spark基本原理_计算引擎原理是什么

作者：一键难忘520 | 2024-07-01 12:49:34

踩

计算引擎原理是什么

计算引擎Spark基本原理

一、Spark主要特点
二、Spark程序基本框架
三、Spark运行模式
四、Stanalone模式
- 1.client模式
- 2.cluster模式
五、YARN模式
- 1.yarn-client
- 2.yarn-cluster
六、Spark应用程序
七、Spark配置

一、Spark主要特点

1.性能高效

内存计算引擎：Spark允许用户将数据放到内存中以加快数据读取，进而提高数据处理性能。
通用DAG计算引擎：Spark可以使得数据通过本地磁盘或内存流向不同计算单元而不是像MapReduce那样借助低效的HDFS。
性能高效：Spark是在MapReduce基础上产生的，在相同资源消耗的情况下，Spark比MapReduce快几倍到几十倍。

2.简单易用
Spark提供了丰富的高层次的API，包括sortByKey、groupByKey等。实现相同功能模块，Spark比MapReduce少2~5倍。

3.与Hadoop完好集成
Hadoop以及成为大数据标准解决方案，设计数据收集、数据存储、资源管理以及分布式计算等一系列系统。Spark作为新型计算框架，定位为除MapReduce等引擎之外的另一种可选的数据分析引擎，可以与Hadoop进行完好集成，可以与MapReduce等类型的应用一起运行在YARN集群，读取存储在HDFS/HBase中的数据，并写入各种存储系统中。

在这里插入图片描述

二、Spark程序基本框架

每个Spark应用程序的运行时环境是由一个Driver进

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/一键难忘520/article/detail/776423