
Python mrjob 操作(zuo) Hadoop培訓
Python是做(zuo)數(shu)據分析好的語(yu)言(yan)。
大數據當然也離不(bu)開Hadoop,Hadoop由JAVA寫成,但Python也可以(yi)很好地(di)操控它。
課程(cheng)介紹了Python中MRjob模塊,通(tong)過該(gai)模塊,
可以讓開發者非常(chang)簡(jian)單的通過Python來使用Hadoop進行數據分析。
1 Python MRJob模塊(kuai)的安裝
2 使用MRJob實現文本統(tong)計
3 重寫MRJob函數實現(xian)復雜數據(ju)處理
4 Hadoop——Python各(ge)模塊介(jie)紹(shao)
5 Python MRJob的運行方式
1
Python玩轉(zhuan)Hadoop之MRjob入門
1.PythonMRJob模塊(kuai)的安(an)裝
2.HadoopPython各模(mo)塊介(jie)紹
3.使用MRJob實現(xian)文本統計(ji)
4.PythonMRJob的運(yun)行方式
5.重寫MRJob函數實現復雜數據處理
使(shi)用 mrjob 實現詞組統計
實戰模擬 - 統(tong)計(ji)每部電影的熱度(du)
實(shi)戰模擬 - 統計每部(bu)電影的觀看用(yong)戶列表
實(shi)戰模擬 - 統(tong)計每個用戶的觀影(ying)列表
