大数据计算技术培训
第一章 大数据计算技术概述
1.1 课程简介
1.2大数据计算概论(上)
1.3 大数据计算概论(下)
第二章 大数据计算系统
2.1 大数据计算系统
2.2 数据存储系统
2.3 数据处理系统
2.4 数据处理系统(续)
2.5 数据应用系统
第三章 数据采集方法
3.1 系统日志数据采集
3.2 网络数据采集
第四章 数据清洗与规约方法
4.1 脏数据类型及处理方法
4.2 数据噪声处理方法
4.3 数据集成方法
4.4 数据规约方法
4.5 数据建模方法
第五章 数据分析算法
5.1 C4.5算法
5.2 K-均值算法
5.3 SVM算法
5.4 Apriori算法
5.5 kNN算法
5.6 PageRank算法
第六章 文本读写技术
6.1 读取文本文件
6.2 读取CSV文件
6.3 写入文本文件
6.4 其他操作
第七章 数据处理技术
7.1 数据合并技术
7.2 数据转换技术
7.3 数据转换技术(续)
第八章 数据分析技术
8.1 Numpy工具包
8.2 Numpy工具包:基本运算
8.3 Pandas工具包
8.4 Python Scikit-learn
8.5 Python NLTK 自然语言处理入门
第九章 数据可视化技术
9.1 数据可视化技术
第十章 大数据计算模式
10.1 大数据计算标准
10.2 大数据计算模式
第十一章 Hadoop计算架构
11.1 Hadoop平台
11.2 HDFS分布式文件系统
11.3 HDFS分布式文件系统(续)
11.4 分布式存储模型
11.5 分布式存储架构
11.6 二次索引表
第十二章 分布式并行计算模型
12.1 并行计算模型
12.2 MapReduce计算架构
12.3 MapReduce计算流程
12.4 MapReduce算例描述
第十三章 图并行计算架构
13.1图计算问题
13.2 BSP图计算模型
13.3 图并行计算架构
13.4 图并行计算架构(续)
第十四章 流计算
14.1 流计算模型
14.2 流计算模型(续)
14.3 ACK实现机制
第十五章 内存计算模型
15.1 分布式缓存系统
15.2 内存技术
15.3 MemCloud计算架构
15.4 Spark 内存计算
15.5 Spark 内存计算