课程目录: Spark大数据挖掘工具Mllib实战培训
4401 人关注
(78637/99817)
课程大纲:

    Spark大数据挖掘工具Mllib实战培训

 

 

 

第一讲 Spark大数据实时处理技术

  1)大数据处理技术

  2)Spark实时处理技术

  3)Spark生态系统BDAS

  4)Spark架构分析

  第二讲 Spark安装配置及监控

  1)Ubuntu环境的准备

  2)Hadoop2.X和Scala

  3)搭建Spark开发环境

  4)Idea编译和运行

  5)Spark监控管理

  第3讲 Scala编程语言和分布式计算模型

  1) Scala编程语言

  2) 操作基本数据类型

  3)Spark计算模型和RDD

  4)Transformation及Actions算子

  5)Spark MLlib矩阵向量

  第四讲 Spark MLlib线性回归和逻辑回归算法

  1)线性回归算法

  2)线性回归代码实例

  3)逻辑回归算法

  4)逻辑回归回归代码实例

  5)线性回归和逻辑回归代码实操

  第五讲 Spark MLlib贝叶斯分类算法

  1) 贝叶斯分类算法原理

  2) Spark贝叶斯分类源码

  3) Spark贝叶斯分类代码示例

  4) 贝叶斯分类代码实操

  第六讲 Spark MLlib决策树算法

  1) 决策树算法原理

  2) Spark决策树算法源码

  3) Spark决策树算法代码示例

  4) 决策树代码实操

  第七讲 Spark MLlib聚类算法

  1) K-Means聚类算法原理

  2) Spark K-Means聚类算法源码

  3) SparkK-Means聚类代码示例

  4) 聚类算法代码实操

  第八讲 Spark MLlib关联规则算法

  1) FPGrowth关联规则算法原理

  2) FPGrowth关联规则算法源码

  3) FPGrowth关联规则代码示例

  4) 关联规则代码实操

  第九讲 Spark MLlib算法

  1) 协同过滤算法原理

  2) Spark协同过滤源码

  3) Spark协同过滤代码示例

  4) 代码实操

  第十讲 Spark MLlib神经网络算法

  1) 神经网络算法原理

  2) Spark神经网络算法源码

  3) Spark神经网络代码示例

  4) 神经网络代码实操

  六、培训

  1, 了解大数据实时处理技术的相关知识。

  2,学习Spark的核心技术方法以及应用特征。

  3,深入使用MLLib在大数据挖掘和实时分析中的使用。

  4,掌握MLlib相关机器学习和数据挖掘工具的使用。