搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
小小林熬夜学编程
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
CAP原理分析[3]总结-大数据之分布式系统CAP理论_纵向扩展架构和分布式系统是什么关系
2
删除数组中的0元素_删除数组零元素
3
目标检测算法DSSD的原理详解
4
Oracle批量执行脚本_oracle 执行批量脚本 多个@ 但是里面有文件夹
5
阿里 Nacos 惊爆,安全漏洞以绕过身份验证,附修复建议
6
学习疑惑:Axure9中该如何进行交互设置_axure我想要点击“新增任务”然后弹出我已经做好的新的内容,该怎么设置交互
7
详细介绍NLP文本分类_nlp文本分类算法
8
RadioButton自定义样式显示_radiobutton样式
9
计算机网络 实验指导 实验17 配置无线网络实验_网络实验wifi信号设置方法有哪些
10
2_Selenium之浏览器驱动安装_114.0.5735.16
当前位置:
article
> 正文
【Hadoop学习】HDFS上传数据、读取数据流程
作者:小小林熬夜学编程 | 2024-06-15 09:42:47
赞
踩
hdfs上传数据
1.
HDFS
上传数据
客户端通过FileSystem.create()创建文件对象,同时在HDFS中DistibutedFileSystem具体实现了FileSystem类。客户端通过Distibuted FileSystem类向NameNode发送上传文件请求,NameNode收到请求后检查要上传的目标文件及路径是否存在。
NameNode检查后向客户端发送允许上传的请求并返回DataNode节点信息和Block块信息。
客户端与DataNode中距离最近的一台节点通过FSDataOutPutStream建立连接并准备开始上传数据,与客户端建立连接的DataNode节点会与集群当中的其他节点依次建立通信连接。
客户端开始通过调用FSDataOutPutStream的create()方法向HDFS中的第一个Block写入数据。客户端在上传数据过程中会把数据切分成若干个(数据包)packets,每个packets的大小为64k;每个packets又由若干个chunk构成,每个chunk由为512bytes的数据和4位的关联校验和构成。为了防止数据传输过程中发生意外情况,通常会将数据经过dataQueued后在经由ack队列来防止意外情况的放生。
第一个DataNode在接收到数据后后通过与其他节点建立的通信通道将数据副本按照设定规则进行传输备份。
当第一个Block上传成功后,客户端将再次向NameNode请求上传第二个Block的节点。(重复3-5步)。
当所有数据均上传完成后DataNode会向NameNode发送上传完成的信息,NameNode将数据的元数据信息维护完成之后向客户端返回上传成功的回执。
2.HDFS读数据
客户端通过DistibutedFileSystem向NameNode发送下载文件的请求,NameNode收到客户端的请求后查询维护的元数据信息,找到文件所在的DataNode节点地址。
客户端收倒NameNode返回的元数据信息后与DataNode建立通信连接。
DataNode开始向客户端传输数据(传输数据过程与上传数据过程相反,以packet为单位)。
客户端将接受的到的数据放入缓冲区,然后在写入文件。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/721797
推荐阅读
article
Hadoop
分布式
集群
搭建
教程(2023
在校生
踩坑版)_
hadoop
集群
搭建
步骤
...
在
Hadoop
01节点上执行以下命令,启动HDFS和YARN:bug1:如果出现类似报错。_
hadoop
集群
搭建
步骤
ha...
赞
踩
article
oracle
direct
for
hdfs
xi下载,
ORACLE
连接
HDFS
有个专项的
解决方案
...
《
ORACLE
连接
HDFS
有个专项的
解决方案
》由会员分享,可在线阅读,更多相关《
ORACLE
连接
HDFS
有个专项的解决方...
赞
踩
article
磁盘
均衡器:
HDFS
Disk
Balancer
简介、
Disk
Balancer
功能和作用、
HDFS
...
长期运行的群集中采用循环策略时,DataNode有时会不均匀地填充其存储目录(
磁盘
/卷),从而导致某些
磁盘
已满而其他
磁盘
...
赞
踩
article
替代
ambari
方案:使用
apache
bigtop
部署
bigtop
hadoop
stack
...
替代
ambari
:下一代大数据
stack
部署方案!_
apache
bigtop
apache
bigtop
...
赞
踩
article
HDFS
读写
数据
流程...
客户端开始往 dn1上传第一个Block(先从磁盘读取
数据
放到一个本地内存缓存),以 Packet为单位,dn1收到一个...
赞
踩
article
hadoop
更换数据
目录
_
hadoop
里将
本地
目录
切换到
实验所
在
的
文件夹
...
一、扩容
本地
磁盘并挂载机器都是阿里云
的
服务器,需要现在阿里云购买磁盘。然后挂载到服务器上 1、把新加
的
磁盘挂载到了/hd...
赞
踩
article
Hadoop
——三种模式
安装
教程_简述
ha
doop
两
节点
,
三
节点
,
及
ha
模式的
安装
步骤有何不...
集群搭建本地模式本地模式,也称为是单机版本。主要是为了测试使用的,基本不需要进行配置。以下的
安装
、配置,都在1
节点
上完成...
赞
踩
article
【
Hadoop
】
--
基于
hadoop
和
hive
实现聊天
数据
统计分析
,构建聊天
数据
分析报表[17]_聊...
BI:Business Intelligence,商业智能。指用现代
数据
仓库技术、线上分析处理技术、
数据
挖掘和
数据
展现技...
赞
踩
article
[
Hadoop
]
Hadoop
生态
综合案例
_
hadoop
生态
圈
的
子项目
非常庞大
的
例子...
陌陌聊天数据分析案例需求基于Hive数仓实现需求开发建库建表、加载数据ETL数据清洗需求指标统计
_
hadoop
生态
圈
的
子...
赞
踩
article
【
Hadoop
】四、
Hadoop
生态综合案例 ——
陌陌
聊天
数据分析
_
hadoop
生态案列
陌陌
...
背景介绍
陌陌
作为
聊天
平台每天都会有大量的用户在线,会出现大量的
聊天
数据,通过对
聊天
数据的统计分析 ,可以更好的对用户构...
赞
踩
article
Hadoop
+
hive
+
flask
+
echarts
大
数据
可视化
项目之
hive
环境搭建与系统
数据
的分析...
收集linux系统信息上传hadoop平台,
hive
导入hadoop平台的信息,将信息的分析结果以
flask
接口的形式...
赞
踩
article
hive
的
load
报错
Error
: EXECUTION FAILED: Task MOVE erro...
hive
load
报错
Error
: EXECUTION FAILED: Task MOVE
error
HiveExce...
赞
踩
article
hive
查询写文件报错Failed with exception Unable
to
move
so...
今天用
hive
查询数据并导出到某个文件夹的时候,报错Failed with exception Unable
to
mo...
赞
踩
article
hive
moving
data
报错,
unable
to
move
source...,
yarn
显示...
1.报错情况有个小伙伴
hive
任务报错,moving
data
时,报错如下Failded with exception:...
赞
踩
article
Failed with exception Unable to
move
source
hdfs
:/...
Hive执行的过程报 Failed with exception Unable to
move
source
hdfs
:...
赞
踩
article
Hadoop
:
hive
log
默认
位置_
hive
默认
log
...
/tmp/当前用户名/
hive
.
log
_
hive
默认
log
hive
默认
log
...
赞
踩
article
Hadoop
Kerberos
认证...
Hadoop
Kerberos
认证_hadoop kerberos认证hadoop kerberos认证 ...
赞
踩
article
hadoop
添加
kerberos
认证
_
hadoop
配置
kerberos
认证
...
参考Cloudera官方文档:Configuring Hadoop Security in CDH3一、部署无kerbe...
赞
踩
article
【
kerberos
】
hadoop
集群使用
keytab
认证
的
逻辑
_
kerberos
hadoop
...
hadoop
集群使用
keytab
认证
的
逻辑
_
kerberos
hadoop
kerberos
hadoop
...
赞
踩
article
Hadoop
配置
Kerberos
认证_
hadoop
kerberos
认证(1),2024年最新...
环境变量相关配置非必要,如果 /etc/profile 中配置了,可以在
hadoop
配置文件中省略。ps:初始化 n...
赞
踩
相关标签
分布式
hadoop
大数据
oracle direct for hdfs xi下载
hdfs
big data
ambari
apache
性能优化
面试
系统架构
java
linux
数据库
数据分析