课程大纲:
Python mrjob 操作 Hadoop培训
Python是做数据分析最好的语言。
大数据当然也离不开Hadoop,
Hadoop由JAVA写成,
但Python也可以很好地操控它。
本课程介绍了Python中MRjob模块,
通过该模块,
可以让开发者非常简单的通过Python来使用Hadoop进行数据分析。
1 Python MRJob模块的安装
2 使用MRJob实现文本统计
3 重写MRJob函数实现复杂数据处理
4 Hadoop——Python各模块介绍
5 Python MRJob的运行方式
1
Python玩转Hadoop之MRjob入门
1.PythonMRJob模块的安装
2.HadoopPython各模块介绍
3.使用MRJob实现文本统计
4.PythonMRJob的运行方式
5.重写MRJob函数实现复杂数据处理
1 使用 mrjob 实现词组统计
2 实战模拟 - 统计每部电影的热度
3 实战模拟 - 统计每部电影的观看用户列表
4 实战模拟 - 统计每个用户的观影列表
请
登录
后发表评论
最新评论
全部
第1节
第2节
第3节
第4节
第5节
第6节
第7节
第8节
第9节
第10节
第11节
第12节
第13节
第14节
第15节
第16节
第17节
我的报告 / 所有报告