课程名称:自然语言处理底层技术实现及应用培训

4401 人关注
(78637/99817)
课程大纲:

自然语言处理底层技术实现及应用培训

 

课程将以中文为处理对象,

逐步讲解关于中文的自然语言处理技术常用的一些底层技术,

即中文分词、词性标注、命名实体识别。

这三项底层技术也是目前能够商用,且相对成熟的技术。

1 中文分词方法

2 命名实体识别

3 条件随机场模型

4 中文词性标注

5 隐马尔科夫模型

6 长短时记忆网络

1
自然语言处理简介

1.自然语言处理发展历史

2.自然语言处理底层技术

3.自然语言处理应用技术

2
基于字典的中文分词方法

1.分词常用方法

2.正向最大匹配法

3.逆向最大匹配法

 

4.双向最大匹配法

1
实现逆向最大匹配法

1.中文分词概念

2.逆向最大匹配法

3
基于隐马尔可夫的中文分词方法

 

1.序列标注

2.隐马尔可夫模型

3.维特比算法

2
实现维特比算法

1.维特比算法

4
基于条件随机场的词性标注方法

 

1.词性标注

2.基于规则的方法

3.基于统计的方法

4.条件随机场

3
使用条件随机场工具进行分词

1.文本预处理

2.sklearncrfsuite使用

5
基于深度学习的命名实体识别方法

1.命名实体识别

2.循环神经网络

3.长短时记忆网络

4.BiLSTMCRF

5.TensorFlow

4
实现基于规则的命名实体识别方法

1.命名实体识别概念

2.基于规则的方法

课程将会以中文文本为研究对象,

逐步讲解自然语言处理中常用的底层技术,

并动手实现。课程主要讲解自然语言处理的底层技术,

具体来说是中文分词,词性标注以及命名实体识别。

中文分词:基于字典的方法 。

中文分词:基于隐马尔可夫模型的方法。

词性标注:基于条件随机场的方法。

命名实体识别:基于深度学习的方法。

在中文分词实验中,主要会详细介绍以下几种方法:

正向最大匹配法。

逆向最大匹配法。

双向最大匹配法。

隐马尔可夫方法。


登录 后发表评论
最新评论
全部 第1节 第2节 第3节 第4节 第5节 第6节 第7节 第8节 第9节 第10节 第11节 第12节 第13节 第14节 第15节 第16节 第17节
我的报告 / 所有报告