【時間地點】 | 2016年1月27-29日 杭州 | ||
【培訓講師】 | 錢興會、鐘運琴 | ||
【參加對象】 | 需要使用Apache Hadoop來開發(fā)功能強大的數(shù)據(jù)分析應用的程序開發(fā)人員;Hadoop項目規(guī)劃的咨詢師;需要快速掌握Hadoop周邊組件開發(fā)的人員;需要掌握Java、Linux | ||
【參加費用】 | ¥5800元/人 (含培訓費、考試費、證書費、資料費、午餐) 食宿統(tǒng)一安排,費用自理。(請學員帶一寸彩照2張—背面注明姓名,身份證復印件一張)。 | ||
【會務組織】 | 森濤培訓網(wǎng)(dbslw.com.cn).廣州三策企業(yè)管理咨詢有限公司 | ||
【咨詢電話】 | 020-34071250;020-34071978(提前報名可享受更多優(yōu)惠) | ||
【聯(lián) 系 人】 | 龐先生,鄧小姐;13378458028、18924110388(均可加微信) | ||
【在線 QQ 】 | 568499978 | 課綱下載 | |
【溫馨提示】 | 本課程可引進到企業(yè)內(nèi)部培訓,歡迎來電預約! |
為響應工業(yè)和信息化部信息化高端人才培養(yǎng)的號召,我培訓中心特推出了Hadoop技術架構課程培訓班,希望通過專業(yè)的Hadoop技術架構體系與業(yè)界真實案例來全面提高大數(shù)據(jù)工程師、設計人員的工作水平,旨在培養(yǎng)專業(yè)Hadoop技術架構專家,更好地服務于大數(shù)據(jù)開發(fā)。
培訓特色
項目全過程Hadoop沙盤模擬實戰(zhàn)。通過一個完整的大數(shù)據(jù)開發(fā)項目及一組實際項目案例,完全覆蓋Hadoop開發(fā)過程的各個技術體系的實踐應用。該項目是一個課堂實踐項目,以項目小組的形式進行沙盤實操練習,重點在于強化理解Hadoop項目各個階段的工作重點,同時明確并強化作為項目管理者的一些基本素質(zhì)。
強調(diào)互動式教學、強化團隊討論,力爭每一個學員在課程中都有上臺發(fā)言的機會,將有超過50% - 70% 的時間用于討論、練習及游戲(具體比例可視學員的情況進行調(diào)整)。但這一做法需要學員的積極參與,盡可能地將實際項目中地各種問題拿出來討論,這要求學員前期做一定地準備工作。
培訓目標
1、了解Hadoop的歷史及目前發(fā)展的現(xiàn)狀、以及Hadoop的技術特點,從而把握分布式計算框架及未來發(fā)展方向,在大數(shù)據(jù)時代能為企業(yè)的技術選型及架構設計提供決策參考。
2、全面掌握Hadoop的架構原理和使用場景,并通過貫穿課程的項目進行實戰(zhàn)鍛煉,從而熟練使用Hadoop進行MapReduce程序開發(fā)。課程還涵蓋了分布式計算領域的常用算法介紹,幫助學員為企業(yè)在利用大數(shù)據(jù)方面體現(xiàn)自身價值。
3、深入理解Hadoop技術架構,對Hadoop運作機制有清晰全面的認識,可以獨立規(guī)劃及部署生產(chǎn)環(huán)境的Hadoop集群,掌握Hadoop基本運維思路和方法,對Hadoop集群進行管理和優(yōu)化。
培訓師資
錢興會 大數(shù)據(jù)專家。在電信、電力、金融行業(yè)從事Java開發(fā)和架構設計的工作;資深云計算研發(fā)工程師。作為項目的主要成員和負責人參與并領導完成了多個大型復雜項目,并成功應用于行業(yè)解決方案,如海量數(shù)據(jù)匹配系統(tǒng)、電力行業(yè)實時數(shù)據(jù)采集分析系統(tǒng)等。設計并實現(xiàn)了實時索引系統(tǒng)-云搜,成功應用與某國企知識庫系統(tǒng)。并可應用與互聯(lián)網(wǎng)行業(yè)的搜索等應用。完成多個云計算解決方案的架構,涉及到金融行業(yè)海量數(shù)據(jù)分析與數(shù)據(jù)處理系統(tǒng)、海量日志分析系統(tǒng)、電力用電信息統(tǒng)計系統(tǒng)等,獲得業(yè)界認可。
鐘運琴 任職于某研究所,中國科學院計算技術研究所攻讀計算機系統(tǒng)結(jié)構博士學位。從 2008 年 12 月起,主要從事云計算和大規(guī)模數(shù)據(jù)管理方面的研究,精通云計算平臺和大規(guī)模數(shù)據(jù)庫管理系統(tǒng)內(nèi)部實現(xiàn)細節(jié),包括Hadoop、鍵值存儲系統(tǒng)(KVS) 、NoSQL (HBase、Cassandra、Membase/ Memcached)數(shù)據(jù)庫和數(shù)據(jù)倉庫(HIVE)。
培訓內(nèi)容
第一天
上午
一、Hadoop入門,了解什么是hadoop
1、 Hadoop產(chǎn)生背景
2、 Hadoop在大數(shù)據(jù)、云計算中的位置和關系
3、 國內(nèi)外Hadoop應用案例介紹
4、 國內(nèi)Hadoop的就業(yè)情況分析及課程大綱介紹
5、 分布式系統(tǒng)概述
6、 Hadoop生態(tài)圈以及各組成部分的簡介
7、 Hadoop核心MapReduce例子說明
二、分布式文件系統(tǒng)HDFS,是數(shù)據(jù)庫管理員的基礎課程
1、 分布式文件系統(tǒng)DFS簡介
2、 HDFS的系統(tǒng)組成介紹
3、 HDFS的組成部分詳解
4、 副本存放策略及路由規(guī)則
5、 NameNode Federation
6、 命令行接口
7、 Java接口
8、 客戶端與HDFS的數(shù)據(jù)流講解
9、 HDFS的可用性(HA)
第一天
下午
三、初級MapReduce,成為Hadoop開發(fā)人員的基礎課程
1、 如何理解map、reduce計算模型
2、 剖析偽分布式下MapReduce作業(yè)的執(zhí)行過程
3、 Yarn模型
4、 序列化
5、 MapReduce的類型與格式
6、 MapReduce開發(fā)環(huán)境搭建
7、 MapReduce應用開發(fā)
8、 更多示例講解,熟悉MapReduce算法原理
第二天
上午
四、高級MapReduce,高級Hadoop開發(fā)人員的關鍵課程
1、 使用壓縮分隔減少輸入規(guī)模
2、 利用Combiner減少中間數(shù)據(jù)
3、 編寫Partitioner優(yōu)化負載均衡
4、 如何自定義排序規(guī)則
5、 如何自定義分組規(guī)則
6、 MapReduce優(yōu)化
7、 編程實戰(zhàn)
五、Hadoop集群與管理,是數(shù)據(jù)庫管理員的高級課程
1、 Hadoop集群的搭建
2、 Hadoop集群的監(jiān)控
3、 Hadoop集群的管理
4、集群下運行MapReduce程序
六、ZooKeeper基礎知識,構建分布式系統(tǒng)的基礎框架
1、ZooKeeper體現(xiàn)結(jié)構
2、ZooKeeper集群的安裝
3、操作ZooKeeper
第二天
下午
七、HBase基礎知識,面向列的實時分布式數(shù)據(jù)庫
1、 HBase定義
2、 HBase與RDBMS的對比
3、 數(shù)據(jù)模型
4、 系統(tǒng)架構
5、HBase上的MapReduce
6、表的設計
八、HBase集群及其管理
1、集群的搭建過程講解
2、集群的監(jiān)控
3、集群的管理
九、HBase客戶端
1、 HBase Shell以及演示
2、Java客戶端以及代碼演示
第三天
上午
十、Pig基礎知識,進行hadoop計算的另一種框架
1、 Pig概述
2、 安裝Pig
3、 使用Pig完成手機流量統(tǒng)計業(yè)務
十一、Hive,使用sql進行計算的hadoop框架 1、 數(shù)據(jù)倉庫基礎知識
2、 Hive定義
3、 Hive體系結(jié)構簡介
4、 Hive集群
5、 客戶端簡介
6、 HiveQL定義
7、 HiveQL與SQL的比較
8、 數(shù)據(jù)類型
9、表與表分區(qū)概念
10、表的操作與CLI客戶端演示
11、數(shù)據(jù)導入與CLI客戶端演示
12、查詢數(shù)據(jù)與CLI客戶端演示
13、數(shù)據(jù)的連接與CLI客戶端演示
14、用戶自定義函數(shù)(UDF)的開發(fā)與演示
第三天
下午
十二、Sqoop,hadoop與rdbms進行數(shù)據(jù)轉(zhuǎn)換的框架
1、配置Sqoop
2、使用Sqoop把數(shù)據(jù)從mysql導入到HDFS中
3、使用Sqoop把數(shù)據(jù)從HDFS導出到mysql中
十三、大數(shù)據(jù)實戰(zhàn)
大數(shù)據(jù)完整項目架構和開發(fā)過程練習