赞
踩
简单来说就是一堆数据集合(log型和db型)的整合处理,,挖掘有效价值,提供决策支持
数仓重抽离出来的以部门数据或者专题数据,也可以简单理解为迷你型数据仓库
ERP/MySQL—sqoop----->Hive/hbase----sqoop---->MySQL-------->BI
hive层就是数仓的核心部分
ODS----->DWD----->DWS----->ADS
不同公司的分层数和叫法都会有略微区别
ODS:基础数据,一般选择初始全量+按分区增量
DWD:清洗后分为维度表和事实表,生成拉链表,保留多条,但是最新一条数据有最新标识(拉链表是一个非常重要的,不
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。