课程名称:Python mrjob 操作 Hadoop培训

4401 人关注
(78637/99817)
课程大纲:

Python mrjob 操作 Hadoop培训

 

 

Python是做数据分析最好的语言。

大数据当然也离不开Hadoop,Hadoop由JAVA写成,但Python也可以很好地操控它。

课程介绍了Python中MRjob模块,通过该模块,

可以让开发者非常简单的通过Python来使用Hadoop进行数据分析。

1 Python MRJob模块的安装

2 使用MRJob实现文本统计

3 重写MRJob函数实现复杂数据处理

4 Hadoop——Python各模块介绍

5 Python MRJob的运行方式

1
Python玩转Hadoop之MRjob入门

1.PythonMRJob模块的安装

2.HadoopPython各模块介绍

3.使用MRJob实现文本统计

4.PythonMRJob的运行方式

5.重写MRJob函数实现复杂数据处理

使用 mrjob 实现词组统计

实战模拟 - 统计每部电影的热度

实战模拟 - 统计每部电影的观看用户列表

实战模拟 - 统计每个用户的观影列表


登录 后发表评论
最新评论
全部 第1节 第2节 第3节 第4节 第5节 第6节 第7节 第8节 第9节 第10节 第11节 第12节 第13节 第14节 第15节 第16节 第17节
我的报告 / 所有报告