自然语言处理底层技术实现及应用培训
课程将以中文为处理对象,
逐步讲解关于中文的自然语言处理技术常用的一些底层技术,
即中文分词、词性标注、命名实体识别。
这三项底层技术也是目前能够商用,且相对成熟的技术。
1 中文分词方法
2 命名实体识别
3 条件随机场模型
4 中文词性标注
5 隐马尔科夫模型
6 长短时记忆网络
1
自然语言处理简介
1.自然语言处理发展历史
2.自然语言处理底层技术
3.自然语言处理应用技术
2
基于字典的中文分词方法
1.分词常用方法
2.正向最大匹配法
3.逆向最大匹配法
4.双向最大匹配法
1
实现逆向最大匹配法
1.中文分词概念
2.逆向最大匹配法
3
基于隐马尔可夫的中文分词方法
1.序列标注
2.隐马尔可夫模型
3.维特比算法
2
实现维特比算法
1.维特比算法
4
基于条件随机场的词性标注方法
1.词性标注
2.基于规则的方法
3.基于统计的方法
4.条件随机场
3
使用条件随机场工具进行分词
1.文本预处理
2.sklearncrfsuite使用
5
基于深度学习的命名实体识别方法
1.命名实体识别
2.循环神经网络
3.长短时记忆网络
4.BiLSTMCRF
5.TensorFlow
4
实现基于规则的命名实体识别方法
1.命名实体识别概念
2.基于规则的方法
课程将会以中文文本为研究对象,
逐步讲解自然语言处理中常用的底层技术,
并动手实现。课程主要讲解自然语言处理的底层技术,
具体来说是中文分词,词性标注以及命名实体识别。
中文分词:基于字典的方法 。
中文分词:基于隐马尔可夫模型的方法。
词性标注:基于条件随机场的方法。
命名实体识别:基于深度学习的方法。
在中文分词实验中,主要会详细介绍以下几种方法:
正向最大匹配法。
逆向最大匹配法。
双向最大匹配法。
隐马尔可夫方法。