机器学习与R语言培训
一:机器学习基本理论
机器学习概述
机器学习算法分类及知识框架
机器学习相关概念
机器学习一般步骤
案例:用R实现机器学习模型预测
二:R语法基础
R语言基础语法
数据处理常用R包介绍(tidyr,dplyr,stringr,reshape2,ggplot2)
数据的存取与编辑
非结构化数据的读取
案例:用R实现MySQL数据库数据读取
三:数据清洗方法
缺失数据处理
异常值的辨识处理
不平衡数据的处理
特征提取与特征工程
案例:针对美国人群收入等数据进行数据清洗
四:线性回归与Logistic回归
线性回归与最小二乘法
Lasso回归及岭回归
Logistic回归模型
多分类Logistic回归模型
案例:运用Logistic回归模型预测学生录取情况
五:K最近邻(KNN)算法
k近邻算法原理
k近邻算法R实现
案例:运用KNN实现前列腺癌症检测
六:聚类算法
聚类算法原理
聚类算法R实现
案例:运用聚类分析进行离群点识别
七:基于决策树类型算法介绍
决策树算法
随机森林算法
八:提升算法
Adaboost算法
GBDT算法
XGBoost
案例:针对美国人群收入预测模型比较
九:SVM支持向量机算法介绍
SVM基本原理
SVM算法的R实现
十:人工神经网络
人工神经网络(RNN)
深度学习
案例:运用神经网络实现手写数字识别
十一:地图可视化:上海交通地图数据可视化实战
数据可视化基本图形选择汇总
绘制数据地图常用方法
交互式可视化实战
十二:机器学习mlr包:债务预测实战
mlr包介绍
实际问题分析及数据处理
多种分类算法模型的比较