搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
小惠珠哦
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
六自由度JAKA机器人基于视觉的多颜色方块抓取(色块颜色识别、坐标提取、旋转角度提取)_jaka机器人编程
2
LeetCode141:判断链表是否有环_给你一个链表的头节点 head ,判断链表中是否有环
3
.git文件夹详解
4
数据库 —— neo4j的基本语句_neo4j语句
5
docker 安装与常用指令
6
springboot整合ehcache实现二级缓存踩坑_cacheable 踩坑
7
git push origin main 报错:remote: Support for password authentication was removed on August 13, 2021_$ git push -u origin main fatal: 已取消一个任务。 remote:
8
2024高频前端面试题(含答案)(1)
9
SUSE linux的快照和恢复
10
如何在云服务器上部署gitblit_blit服务器能搭建到云服务器么
当前位置:
article
> 正文
Spark 内核解析图_tasksecheduler java
作者:小惠珠哦 | 2024-06-30 10:17:26
赞
踩
tasksecheduler java
Spark 内核调度架构
我们要学习的概念,以及下面这些角色在集群中的功能
Application
spark-submit
Driver
SparkContext
Master
Worker
Executor
Job
DAGScheduler
TaskScheduler
ShuffleMapTask and ResultTask
先来看看我们画的一张图
这个集群模式是Standalone的
Driver
:就是我们用来提交编写的Spark程序的一台机器,在Driver中最重要的一件事—创建SparkContext
Application
:就是我们编写的程序,类里面创建了SparkContext的程序
spark-submit
: 就是用来向Spark集群提交application的程序,spark-submit,其实说白了就是一个继承了AKKA Actor的actor模型,如果不继承的话,就无法与我们进行master进行通信,就不能向master注册我们编写的application
SparkContext
: 我们在创建SparkContext的过程中,最重要的3件事,其一创建DAGSechedule(有向无循环图调度者),其二创建TaskScheduler(任务调度者),三就是依照TaskSecheduler创建TaskSchedulerBackend(任务调度后端)
DAGScheduler
: DAG:有向无环图(Directed acyclic graph)在创建好程序之后,就会把各种算子交给DAGScheduler进行整体的一个调度,我们每一个Application在运行的时候,都会被DAGScheduler分成若干 个Stage,是由相关的划分算法来做的
当DAGScheduler接受到任务信息之后,就会指派相关的TaskScheduler对任务进行具体的调度,让我们taskset中的的一批task去执行具体的任务
TaskScheduler
:TaskScheduler ,就会组织,调度task进行任务执行
当worker中的 executor 启动之后,会主动反向注册到Driver,当driver收到所有的executor(一组executor)反向注册信息之后,就开始加载数据创建RDD ,将各种算子交给DAGScheduler管理【so 问题来了,driver是如何知道它收到了一组内所有的executor呢,大家还记不记得,Master接收到Driver的注册请求后,进行任务分配,通知各个worker进行接收任务,worker结合之后会做出回应给master任务接收到了,master会告诉driver,worker已经接收任务了,并且master此时此刻将任务分配计划,交给DRIVER,Driver按照这个分配计划,就可以知道是否一组内Executor是否已经全部到达】
Master
: Master主要用于集群的监控,运行资源的分配,Master在分配资源的时候,有两种分配方式,一种spreadapps,一种是非spreadapps,Master实际就是一个AKKA Actor的Actor模型接收到Driver发过来的注册通知,然后衡量任务,需要如何的资源,交给Worker进行干活,其实说白了就是让worker来启动executor进程
taskRunner
: 在我们的task分配过来的时候,executor会从线程池中抽取相应的task,把它给我封装成taskRunner,执行具体的flatmap , map ,reduceByKey等等操作
实际上,task任务分为两种,ShuffleMapTask,ResultTask,ResultTask说白了就是执行action的task,其余都是ShuffleMapTask
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/小惠珠哦/article/detail/772282
推荐阅读
article
IOS
自动化
测试
环境搭建(
Python
&
Java
)_
python
ios
自动化
测试
...
IOS的App
自动化
测试
与Android的一样,也可以用appium来进行。但是IOS
自动化
依赖苹果的osx系统、Xco...
赞
踩
article
Java
+Springboot+Mysql个性化
电影
推荐
系统
movielens
电影
数据
集 基于深度...
前台用户包含:注册、登录、注销、喜好标签、浏览
电影
、搜索
电影
、信息修改、密码修改、
电影
评分、
电影
收藏、
电影
评论、排行榜、...
赞
踩
article
Java
集合框架详谈及代码分析(
Iterable
->
Collection
->
List
、
Set
->各...
Java
集合框架详谈及代码分析(
Iterable
->
Collection
->
List
、
Set
->各接口实现类
、
Map
-...
赞
踩
article
java
7
collection
详解(一)_
java
collection
s
不能
排序
colle...
转载自:http://peiquan.blog.51cto.com/
7
518552/1288012一、综述
java
集...
赞
踩
article
Java
Python
JS
流式
编程
(链式
编程
)_
js
中也有流失
编程
吗...
Java
\
Python
\ JS
流式
编程
(链式
编程
)前言我们学习
编程
通常是从命令式
编程
起步的。比如说计算1~100...
赞
踩
article
Java——集合之
List
、Array
List
、Linked
List
_
java
.
util
.array...
Java——集合之
List
、Array
List
、Linked
List
_
java
.
util
.array
list
跟 lis...
赞
踩
article
Java
——一文便
可
搞懂
List
(Array
List
和
Linked
List
)集合...
Java
——一文便
可
搞懂
List
(Array
List
和
Linked
List
)集合
Java
——一文便
可
搞懂
List
(Arr...
赞
踩
article
Java
List
与Array
List
_
java
list
和array
list
...
Java数据结构
List
的介绍和Array
List
的使用与实现_
java
list
和array
list
java
lis...
赞
踩
article
Java
List
与Array
List
的
区别(
List
list
=
new
Array
list
()...
一般想知道
List
与Array
List
的
区别可能大部分都是看到了
List
list
=
new
Array
List
(...
赞
踩
article
java
arraylist
有
顺序
吗,
ArrayList
的add(
顺序
插入
数据)...
大致步骤:1.先将minCapacity=size+1,判断是否是第一次
插入
值,若elementData == DEFA...
赞
踩
article
Spark
Streaming
_面试题_
spark
streaming
常见面试题目...
文章目录1.什么是
Spark
Streaming
2.
Spark
Streaming
如何执行流式计算的?3.WordC...
赞
踩
article
Java
ConcurrentHashMap
高
并发
安全实现原理解析_
java
高
并发
读写 conc...
外链图片转存中…(img-eJDoQZBV-1711946947555)][外链图片转存中…(img-pKn4QpYA-...
赞
踩
article
计算机
毕业设计
近几年
参考文献
(
java
、
node
、
vue
、
mysql
....)_
vue
参考文献
近三年...
计算机
毕业设计
近几年
参考文献
(
java
、
node
、
vue
、
mysql
....)_
vue
参考文献
近三年
vue
参考文献
近三年...
赞
踩
article
Java
插入
My
sql
报错:Column
coun
t
doesn
‘
t
ma
t
ch
value
c...
2. 自动递增列的处理:如果你的表定义了一个自动递增的主键列(比如上述例子中的 `id` 列),在
插入
数据时不需要为这个...
赞
踩
article
MAC系统
安装
PHP、
Java
、
Python
、
mysql
、Composer等
环境
无权限问题的详细操作...
全称:Home
brew
,是一款
mac
及uninx系统下的软件
安装
和管理工具,通过他你可以快速
安装
和部署相应的
环境
及编程s...
赞
踩
article
Java
开发
环境安装与
配置
详细指南 -
IntelliJ
IDEA
_
java
配置
...
作为一名测试工程师,使用一个强大的集成
开发
环境(IDE)如
IntelliJ
IDEA
,可以极大地提高
开发
和测试效率。本...
赞
踩
article
Java
环境
安装详细指南...
作为一名测试工程师,设置和配置
Java
开发
环境
是日常工作中必不可少的一部分。本文将详细介绍如何在 Windows、m...
赞
踩
article
华为OD机试
C
卷
--
任务
最优调度(
Java
& JS &
Python
&
C
)...
给定一个正整数数组表示待系统执行的
任务
列表,数组的每一个元素代表一个
任务
,元素的值表示该
任务
的类型。请计算执行完所有
任务
...
赞
踩
article
spark
读取本地
文件
_
spark
读取本地
文件
...
spark
读取本地
文件
_
spark
读取本地
文件
spark
读取本地
文件
1 背景 &nbs...
赞
踩
article
【
Spark
】读取
Linux
得数据并将结果
存储
在
HDFS
上_
saveastextfile
方法
存储
到h...
读取
Linux
得数据并将结果
存储
在
HDFS
上准备工作打包运行查看结果准备工作在
Linux
上创建以下数据确保hadoop和...
赞
踩
相关标签
ios
python
java
软件测试
机器学习
人工智能
深度学习
spring boot
协同过滤
List、Set、Map
java 7
list
intellij-idea
数据结构
java arraylist有顺序吗
spark
big data
大数据
开发语言
课程设计
vue.js