课程目录:Hadoop基础模块—Linux基础培训
4401 人关注
(78637/99817)
课程大纲:

      Hadoop基础模块—Linux基础培训

 

 

 

Linux

Linux简介

通过本模块理论结合实践的学习,让学员对能够:

(1)掌握Linux的基础知识,

(2)熟练掌握Linux常用Shell命令、文本编辑工具,

(3)熟练掌握Linux的安装、部署、用户和权限等知识,

(4)熟练掌握基本的性能调试、网络相关的命令。

Linux

基础知识

Linux 安装部署

Hadoop常规模块

Hadoop运维——Hadoop

Hadoop简介

通过本模块理论结合实践的学习,让学员对能够:

(1)掌握Hadoop基本原理、架构和核心组件

(2)熟练掌握Hadoop的分布式安装、部署过程和基本的运维方法

Hadoop安装部署

Hadoop运维

Hadoop核心组件——HDFS

HDFS简介、HDFS分布式文件系统原理和体系结构

通过本模块理论结合实践的学习,让学员对能够:

(1)深刻理解HDFS的工作原理和常用命令

HDFS的I/0基本操作 、HDFS常用Java API详解

HDFS中的输入输出与读写数据流、WebHDFS详解

HDFS中的常用的重要的文件存储结构

HDFS I/0操作和读写工作原理 、HDFS数据压缩机制与程序实现

HDFS集群资源管理技术精讲

Hadoop核心组件——MapReduce

MapReduce基础知识

通过本模块理论结合实践的学习,让学员对能够:

(1)深刻理解MapReduce计算模型的原理和架构

(2)掌握MapReduce编程开发和技巧

MapReduce原理

MapReduce编程

YARN平台

离线分析

Hive基础知识

通过本模块理论结合实践的学习,让学员对能够:

(1)掌握数据仓库和分析工具Hive的基本架构和使用方法,能够熟练的搭建数据仓库并进行离线数据分析需求开发

(2)掌握从RDBMS到Hadoop的导入工具Sqoop的使用

(3)掌握如何使用Azkaban构建自己的工作流

Hive使用

Sqoop/Azkaban详解

实时计算

HBase详解

通过本模块理论结合实践的学习,让学员对能够:

(1)理解海量数据实时处理的基本概念和开源产品、框架

(2)掌握列式数据库HBase的概念、架构、安装部署和基本的API访问编程

(3)掌握使用HBase进行表结构设计的方法和技巧

(4)掌握实时流框架Storm的概念、架构、安装部署和编程

(5)掌握实时计算系统的基本设计理念和设计方法

(6)掌握日志收集系统Flume等的架构、安装部署

ZooKeeper详解

Storm介绍

Storm安装

Flume介绍与使用

实战项目

案例实战(离线、实时2个不同项目)

通过本模块理论结合实践的学习,让学员对能够:

(1)巩固之前学习Hadoop知识

(2)实战中提高实操技能以达到企业用人标准

(3)检验之前学习中的不足,并根据不足制定复习计划

Hadoop模块

数据可视化方向

大数据可视化技术

通过本模块理论结合实践的学习,让学员对能够:

(1)掌握前端可视化相关技术,如、R语言等技术的简单实用

(2)掌握大数据中数据可视化的基本理念和实现方法

交互式计算Spark

Scala基础编程

Spark简介和安装部署

Spark核心机制

通过本模块理论结合实践的学习,让学员对能够:

(1)掌握Scala编程技术的简单使用

(2)掌握Spark框架的概念、架构、核心机制和使用

数据挖掘方向

Mahout简介

Mahout经典算法讲解

通过本模块理论结合实践的学习,让学员对能够:

(1)通过学习Mahout了解数据挖掘、机器学习的相关算法基于Hadoop的实现

(2)理解算法并行化实现(基于Hadoop)的流程和方法