课程目录:hadoop数据仓库培训
4401 人关注
(78637/99817)
课程大纲:

    hadoop数据仓库培训

 

 

 

 

Hadoop数据仓库概述
1.hadoop数据仓库与传统仓库区别
2. hadoop数据仓库架构
3. hadoop数据仓库关键模块
数据接入与存储、数据加工,数据建模,数据分析及可视化等模块
4. hadoop仓库关键点
数据质量把控
数据模型选择
OLAP引擎选择
Hadoop数据仓库:数据接入与存储模块
1. 数据接入模块关键技术
讲解sqoop,flume,kafka以及databus等常用开源技术以及它们对应的应用场景
2. 数据存储模块关键技术
讲解hdfs(不同存储格式及压缩格式对性能的影响)、hbase、kudu、hive等开源技术以及它们对应的应用场景
Hadoop数据仓库:数据加工模块
数据加工模块关键技术
讲解spark/hive及spark streaming相关技术以及对应应用场景
Hadoop数据仓库:数据建模
1. 1. Hadoop数据模型
涉及原始表,聚集表以及cube等
涉及元信息管理系统hive metastore
2. 数据模型选择原则
Hadoop数据仓库:数据分析
计算引擎的分类及对应应用场景
涉及hive,presto/impala以及kylin三类系统以及对应应用场景
Hadoop数据仓库:数据可视化
1. 自研系统
C3,Echarts等
2. 商业系统
tableau等
Hadoop数据仓库实例:某互联网公司TB及数据仓库构建案例
1. 项目背景
2. 系统架构
3. 关键技术点和特色