当前位置:   article > 正文

云计算 第六章 Hadoop 2.0 大家族_云计算第三版第六章

云计算第三版第六章

6.1 Hadoop 2.0大家族概述

6.1.1 分布式组件

1.组件简介

img

img

img

img

img

2.组件分类

img

img

6.1.2 部署概述

1.Apache社区版分布式组件部署步骤:
img
2.商业版(Cloudera或Hortonworks)部署步骤:
img
3.部署规划

集群共五台机器,cMaster为主节点,cProxy为主节点代理,其他为Slave节点,注意iClient并不属于集群,用户还须确保集群中所有机器和iClient都可以连网。

img

img

4商用版Hadoop部署
img
img
img

6.2 ZooKeeper

6.2.1 ZooKeeper简介

1.ZooKeeper工作过程

Pa产生这条消息后将此消息注册到ZooKeeper中,Pb需要这条消息时直接从ZooKeeper中读取即可。

imgimg

img

6.2.2 ZooKeeper 入门

1.ZooKeeper部署

img

2.ZooKeeper接口

ZooKeeper主要提供了Shell接口和编程接口,其中Shell接口提供了管理

ZooKeeper最常用的操作,编程接口则更加灵活,比如使用ZooKeeper实现上文所述的两进程Pa与Pb通信等。

img

img

6.3 Hbase

img

6.3.1 Hbase简介

1.Hbase数据模型
img
img
img
img
img
img
Hbase采用master/slave架构
img
img
img

6.3.2 Hbase入门

1.Hbase部署

img

2.Hbase接口
img
img
img
img
img

下面简单罗列Hbase和关系型数据库的区别:

img

6.4 Pig

6.4.1 Pig简介

1.Pig基本框架

Pig相当于一个Hadoop的客户端,它先连接到Hadoop集群,之后才能在集群上进行各种操作。Pig的基本框架如下图所示。

img

2.Pig语法
img
img
img

6.4.2 Pig入门

img

6.5 Hive

6.6 Oozie

6.7 Flume

6.8 Mahout

6.9 小结

【学习笔记合集】

【学习资料】

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/829353
推荐阅读
相关标签
  

闽ICP备14008679号