班級(jí)規(guī)模及環(huán)境--熱線:4008699035 手機(jī):15921673576( 微信同號(hào)) |
每期人數(shù)限3到5人。 |
上課時(shí)間和地點(diǎn) |
上課地點(diǎn):【上海】:同濟(jì)大學(xué)(滬西)/新城金郡商務(wù)樓(11號(hào)線白銀路站) 【深圳分部】:電影大廈(地鐵一號(hào)線大劇院站)/深圳大學(xué)成教院 【北京分部】:北京中山學(xué)院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領(lǐng)館區(qū)1號(hào)(中和大道) 【沈陽(yáng)分部】:沈陽(yáng)理工大學(xué)/六宅臻品 【鄭州分部】:鄭州大學(xué)/錦華大廈 【石家莊分部】:河北科技大學(xué)/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協(xié)同大廈
最近開(kāi)課時(shí)間(周末班/連續(xù)班/晚班):2020年3月16日 |
實(shí)驗(yàn)設(shè)備 |
☆資深工程師授課
☆注重質(zhì)量
☆邊講邊練
☆合格學(xué)員免費(fèi)推薦工作
★實(shí)驗(yàn)設(shè)備請(qǐng)點(diǎn)擊這兒查看★ |
質(zhì)量保障 |
1、培訓(xùn)過(guò)程中,如有部分內(nèi)容理解不透或消化不好,可免費(fèi)在以后培訓(xùn)班中重聽(tīng);
2、培訓(xùn)結(jié)束后,授課老師留給學(xué)員聯(lián)系方式,保障培訓(xùn)效果,免費(fèi)提供課后技術(shù)支持。
3、培訓(xùn)合格學(xué)員可享受免費(fèi)推薦就業(yè)機(jī)會(huì)。 |
課程大綱 |
課程模塊 課程主題 主要內(nèi)容 案例和演示
模塊一 Hadoop在云計(jì)算技術(shù)的作用和地位 ? 傳統(tǒng)大規(guī)模系統(tǒng)存在的問(wèn)題?
? Hadoop概述?
? Hadoop分布式文件系統(tǒng)??????
? MapReduce工作原理?????????
? Hadoop集群剖析????????????
? Hadoop生態(tài)系統(tǒng)對(duì)一種新的解決方案的需求
? Hadoop的行業(yè)應(yīng)用案例分析
? Hadoop在云計(jì)算和大數(shù)據(jù)的位置和關(guān)系 ? 數(shù)據(jù)開(kāi)放,數(shù)據(jù)云服務(wù)平臺(tái)(DAAS)時(shí)代
? Hadoop平臺(tái)在數(shù)據(jù)云平臺(tái)(DAAS)上的天然優(yōu)勢(shì)
? 數(shù)據(jù)云平臺(tái)(DAAS 平臺(tái))組成部分
? 互聯(lián)網(wǎng)公共數(shù)據(jù)大云(DAAS)案例
? Hadoop構(gòu)建構(gòu)建游戲云(Web Game Daas)平臺(tái)
模塊二 Hadoop生態(tài)系統(tǒng)介紹和演示 ? Hadoop HDFS 和 MapReduce?
? Hadoop數(shù)據(jù)庫(kù)之HBase?
? Hadoop數(shù)據(jù)倉(cāng)庫(kù)之Hive
? Hadoop數(shù)據(jù)處理腳本Pig?
? Hadoop數(shù)據(jù)接口Sqoop和Flume,Scribe DataX?
? Hadoop工作流引擎 Oozie ? 運(yùn)用Hadoop自下而上構(gòu)建大規(guī)模企業(yè)數(shù)據(jù)倉(cāng)庫(kù)
? 暴風(fēng)影音數(shù)據(jù)倉(cāng)庫(kù)實(shí)戰(zhàn)解析
模塊三 Hadoop組件詳解 ? Hadoop HDFS 基本結(jié)構(gòu)
? Hadoop HDFS 副本存放策略
? Hadoop NameNode 詳解
? HadoopSecondaryNameNode 詳解?
? Hadoop DataNode 詳解
? Hadoop JobTracker 詳解?
? Hadoop TaskTracker 詳解 ? Hadoop Mapper類(lèi)核心代碼
? Hadoop Reduce類(lèi)核心代碼
? Hadoop 核心代碼
模塊四 Hadoop安裝和部署 ? Hadoop系統(tǒng)模塊組件概述
? Hadoop試驗(yàn)集群的部署結(jié)構(gòu)
? Hadoop 安裝依賴關(guān)系
? Hadoop 生產(chǎn)環(huán)境的部署結(jié)構(gòu)
? Hadoop集群部署
? Hadoop 高可用配置方法
? Hadoop 集群簡(jiǎn)單測(cè)試方法?
? Hadoop 集群異常Debug方法 ? Hadoop安裝部署實(shí)驗(yàn)
? Red hat Linux基礎(chǔ)環(huán)境搭建
? Hadoop 單機(jī)系統(tǒng)版本安裝配置
? Hadoop 集群系統(tǒng)版本安裝和啟動(dòng)配置?
? 使用 Hadoop MapReduce Streaming 快速測(cè)試系統(tǒng)
? Hadoopcore-site,hdfs-site,mapred-site 配置詳解
模塊五 Hadoop集群規(guī)劃 ? Hadoop 集群內(nèi)存要求
? Hadoop集群磁盤(pán)分區(qū)
? 集群和網(wǎng)絡(luò)拓?fù)湟?br>
? 集群軟件的端口配置 ? 針對(duì)NameNode Jobtracker DataNode TaskTracker Hiveserver 等不同組件需求推薦服務(wù)器配置
模塊六 MapReduce 算法原理 ? Hadoop MapReduce 算法的原理和優(yōu)化思想
? 靈活運(yùn)用MapReduce 實(shí)現(xiàn)算法 ? 運(yùn)用MapReduce 構(gòu)建數(shù)據(jù)庫(kù)算法
? Select Sort GrougBy Sum Count?
? Join 新進(jìn)流失算法
? 使用 Y-Smart 快速轉(zhuǎn)換SQL 為MapReduce 代碼
模塊七 編寫(xiě)MapReduce高級(jí)程序 ? 使用 Hadoop MapReduce Streaming 編程
? MapReduce流程??????????
? 剖析一個(gè)MapReduce程序?
? 基本MapReduceAPI概念??
? 驅(qū)動(dòng)代碼 Mapper、Reducer
? Hadoop流?
? API 使用Eclipse進(jìn)行快速開(kāi)發(fā)???????????????
? 新MapReduce API?
? MapReduce的優(yōu)化
? MapReduce的任務(wù)調(diào)度
? MapReduce編程實(shí)戰(zhàn)
? 如何利用其他Hadoop相關(guān)技術(shù),包括Apache Hive, Apache Pig,Sqoop和Oozie等?
? 滿足解決實(shí)際數(shù)據(jù)分析問(wèn)題的高級(jí)Hadoop API ? Hadoop Streaming 和 Java MapReduce Api 差異。
? MapReduce 實(shí)現(xiàn)數(shù)據(jù)庫(kù)功能
? 利用Combiners來(lái)減少中間數(shù)據(jù)
? 編寫(xiě)Partitioner來(lái)優(yōu)化負(fù)載平衡
? 直接訪問(wèn)Hadoop分布式文件系統(tǒng)(HDFS)
? Hadoop的join操作
? 輔助排序在Reducer方的合并
? 定制Writables和WritableComparables?
? 使用SequenceFiles和Avro文件保存二進(jìn)制數(shù)據(jù)?
? 創(chuàng)建InputFormats OutputFormats
? Hadoop的二次排序
? Hadoop的海量日志分析
? 在Map方的合并???????
模塊八 集成Hadoop到現(xiàn)有工作流?
及Hadoop API深入探討 ? 存儲(chǔ)系統(tǒng)?
? 利用Sqoop從關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)中導(dǎo)入數(shù)據(jù)到Hadoop?
? 利用Flume導(dǎo)入實(shí)時(shí)數(shù)據(jù)到Hadoop?
? ToolRunner介紹、使用MRUnit進(jìn)行測(cè)試?
? 使用Configure和Close方法來(lái)進(jìn)行Map/Reduce設(shè)置和關(guān)閉 ? 使用FuseDFS和Hadoop訪問(wèn)HDFS
? 使用分布式緩存(Distributed Cache)
? 直接訪問(wèn)Hadoop分布式文件系統(tǒng)(HDFS)?
? 利用Combiners來(lái)減少中間數(shù)據(jù)
? 編寫(xiě)Partitioner來(lái)優(yōu)化負(fù)載平衡??
模塊九 使用Hive和Pig開(kāi)發(fā)及技巧 ? Hive和Pig基礎(chǔ)??????????????
? Hive的作用和原理說(shuō)明
? Hadoop倉(cāng)庫(kù)和傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的協(xié)作關(guān)系
? Hadoop/Hive倉(cāng)庫(kù)數(shù)據(jù)數(shù)據(jù)流
? Hive 部署和安裝
? Hive Cli 的基本用法
? HQL基本語(yǔ)法
? 運(yùn)用Pig 過(guò)濾用戶數(shù)據(jù)?? ? 使用JDBC 連接Hive進(jìn)行查詢和分析
? 使用正則表達(dá)式加載數(shù)據(jù)
? HQL高級(jí)語(yǔ)法
? 編寫(xiě)UDF函數(shù)
? 編寫(xiě)UDAF自定義函數(shù)
? 基于Hive腳本內(nèi)嵌Streaming 編程
模塊十 Hbase安裝和使用 ? Hbase 安裝部署????????????
? Hbase原理和結(jié)構(gòu)
? Hbase 運(yùn)維和管理 ? 使用Hbase+Hive 提供 OLAP SQL查詢能力
? 使用Hbase+Phoenix提供 OLTP SQL能力
? 基于Hbase 的時(shí)間序列數(shù)據(jù)庫(kù) OpenTsDb 結(jié)構(gòu)解析
模塊十一 Hadoop2.0 集群探索 ? Hadoop2.0 HDFS 原理
? Hadoop2.0 Yarn 原理
? Hadoop2.0 生態(tài)系統(tǒng) ? 基于Hadoop2.0 構(gòu)建分布式系統(tǒng)
模塊十二 Hadoop企業(yè)級(jí)別案例解析 ? Hadoop 結(jié)構(gòu)化數(shù)據(jù)案例
? Hadoop 非結(jié)構(gòu)化案例
? Hbase 數(shù)據(jù)庫(kù)案例
? Hadoop 視頻分析案例 ? 利用大數(shù)據(jù)分析改進(jìn)交通管理
? 區(qū)域醫(yī)療大數(shù)據(jù)應(yīng)用案例
? 銀聯(lián)大數(shù)據(jù)數(shù)據(jù)票據(jù)詳單平臺(tái)
? 廣東移動(dòng)省公司請(qǐng)賬單系統(tǒng)
? 上海電信網(wǎng)絡(luò)優(yōu)化
? 某通信運(yùn)營(yíng)商全國(guó)用戶上網(wǎng)記錄
? 浙江臺(tái)州市智能交通系統(tǒng)
? 移動(dòng)廣州詳單實(shí)時(shí)查詢系統(tǒng)
? 跨區(qū)域?qū)崟r(shí)視頻監(jiān)控系統(tǒng)
模塊十三 RedHadoop 企業(yè)版本 ? 運(yùn)用RedHadoop快速構(gòu)建服務(wù)集群
? 運(yùn)用RedHadoop DW 構(gòu)建數(shù)據(jù)倉(cāng)庫(kù) ? 基于RedHadoop Hive構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)
? 靈活運(yùn)用 Hive 加速游戲數(shù)據(jù)倉(cāng)庫(kù)
? 基于Pig+OpenCV大規(guī)模圖像人臉識(shí)別
模塊十四 Spark原理和入門(mén) ? Spark原理;Spark的架構(gòu)圖;Spark運(yùn)行模式介紹
? —local;—standalone;—messos;—yarn;Spark的RDD
? 什么是RDD;RDD的種類(lèi);—Tranformation;—Action
? Spark的存儲(chǔ)級(jí)別;Cache介紹;Spark的容錯(cuò)原理
? Lineage容錯(cuò);Checkpoint容錯(cuò);RDD的創(chuàng)建
? 案例—統(tǒng)計(jì)單詞的個(gè)數(shù)
|