在线民宿 UGC 数据挖掘培训
1 Pandas 数据聚合
2 TensorFlow 模型搭建
3 NLP 文本处理
4 Word2Vec 词向量训练
5 Gensim 下的 LDA 主题自动聚类
6 Stacking 集成情感分析
7 深度 GRU 情感分析
8 Flask API 搭建情感分析接口
9 百度 LBS 地理位置信息采集
10 Scikit-learn 模型搭建
11 Pyecharts 可视化
12 KMeans 下的词向量自动聚类
13 LDAvis 主题可视化
14 深度 CNN 情感分析
15 低代码下的 LitNlp 深度情感分析
16 Python 使用 POST 和 GET 进行接口请求
1
快速实现民宿整体的意见挖掘
1.Pandas数据聚合
2.数据EDA
3.贝叶斯情感分析建模
4.模型评测
5.情感极性可视化
2
利用 pyecharts 进行可视化分析
1.数据清洗
2.数据特征处理
3.数据聚合
4.pyecharts可视化
3
民宿地理位置可视化分析
1.Requests接口请求
2.基于百度LBS接口解析地理位置信息
3.地理数据聚合
4.pyecharts地理信息可视化
4
基于字典的评论主题挖掘
1.词性标注
2.主题句切分
3.TFIDF关键词挖掘
4.主题分布可视化
5
基于词向量的主题聚类挖掘
1.名词抽取
2.Word2Vec词向量训练
3.最佳聚类个数选取
4.KMeans主题聚类
6
基于 LDA 模型的评论主题挖掘
1.评价数据清洗
2.LDA主题建模
3.最佳主题数选取
4.LDAvis主题分布可视化
7
文本自动化标注和数据采样
1.特征工程
2.数据自动化标注
3.数据采样
4.采样结果评测
8
集成模型在情感分析中的应用
1.特征工程
2.情感建模
3.Stacking集成建模
4.主题情感可视化
9
深度模型在情感分析中的应用
1.数据预处理
2.词级和字符级的文本分词
3.深度情感分类模型
4.深度学习模型测试
10
部署深度情感推理模型
1.litNlp使用
2.FlaskAPI开发
3.模型部署
4.情感极性批量预测
基于 Pandas 和 pyecharts 的数据聚合和可视化分析。
主题建模实战,包括:词频排序模型下的主题词云分析、基于 Word2Vec 词向量下的 KMeans 名词聚类、LDA 主题建模。
针对数据集标签失衡问题,实验分析了不用数据采样方式对情感分析模型性能的影响。
介绍了基于 Stacking 的集成模型和深度情感分析模型在用户评论情感建模上的性能差异,
然后针对深度模型分别使用字符级和词语级进行建模来比较差异,深度模型具体有 TextCNN 和 GRU。
主要实现模型的部署,使用 Flask 框架对 litNlp 深度情感分析模型进行 RESTful API 部署,实现情感极性预测通过网络接口进行服务。