
大數據(ju)處理技術-基(ji)于Hadoop/Yarn的大數據(ju)技術培訓(xun)
第一講云計算(suan)及大數(shu)據(ju)處理(li)技術(shu)介紹
1)云計算的概念
2)云計算發展(zhan)現(xian)狀
3)大數據的概念
4)大數據的應用
5)大數(shu)據關鍵技術
第二講(jiang)Google的關鍵技(ji)術
1)GFS分布式文件系統
2)Chubby并發(fa)鎖機制
3)MapReduce計算模型
4)Bigtable大(da)表管理技術(shu)
第三講(jiang)Hadoop系統及HDFS
1) Hadoop及其(qi)運行架構
2) Yarn中的隔離和調度機(ji)制
3) HDFS分布式文件及塊(kuai)
4) Seqenence file等DFS文件格式
5) HA和(he)Federation
第四講MapReduce計算模型(xing)設計
1) MapReduce產生背景
2) MapReduce編程模(mo)型
3) MapReduce實現(xian)機(ji)制(zhi)
4) MapReduce案例分析
第五講Pig 數(shu)據流(liu)處理工具
1)Pig 設(she)計的
2)Pig Latine介(jie)紹
3)Pig關鍵性技術
4)Pig的實用案例
第六講 云數據倉庫Hive
1) Hive設計
2) Hive數據模型
3) Hive關鍵性(xing)技術
4) Hive的使用案例
第七講HBase和NoSQL
1)NoSQL技術及其應用介紹
2)HBase數據處(chu)理機制
3)HBase列族設計及(ji)API
4)HBase高并發讀(du)/寫的實現
5)ZooKeeper并發控(kong)制模型(xing)
第八講 數據(ju)抽取(qu)工具Sqoop
1)云(yun)中(zhong)數據與DBMS數據的(de)交換
2)Sqoop數據(ju)抽取關鍵技術
3)Sqoop數據抽取策略
4)Sqoop的使用實例
第九講(jiang) Hadoop與其他(ta)云數據處理技(ji)術的融合
1)其他云環(huan)境(jing)中大數據處理技術介(jie)紹
2)與Spark實(shi)時處理技術的(de)融合
3)與(yu)Storm流數(shu)據處(chu)理技術的融合
4)與Docker等(deng)其它云工(gong)具的融合
5)基于(yu)Hadoop/Yarn的大數(shu)據挖掘應(ying)用(yong)
六、培訓
1,了解(jie)基于(yu)Hadoop/Yarn的大數(shu)據處理相關知識。
2,學習Hadoop/Yarn的核(he)心技術(shu)方法(fa)以及(ji)應用(yong)特征(zheng)。
3,深入學(xue)習(xi)Hadoop/Yarn相關工具在大數據中(zhong)的(de)實操使用。
4,了解Hadoop與Storm、Spark、Docker等技術的融合使用。