班級(jí)規(guī)模及環(huán)境--熱線:4008699035 手機(jī):15921673576( 微信同號(hào)) |
每期人數(shù)限3到5人。 |
上課時(shí)間和地點(diǎn) |
上課地點(diǎn):【上海】:同濟(jì)大學(xué)(滬西)/新城金郡商務(wù)樓(11號(hào)線白銀路站) 【深圳分部】:電影大廈(地鐵一號(hào)線大劇院站)/深圳大學(xué)成教院 【北京分部】:北京中山學(xué)院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領(lǐng)館區(qū)1號(hào)(中和大道) 【沈陽分部】:沈陽理工大學(xué)/六宅臻品 【鄭州分部】:鄭州大學(xué)/錦華大廈 【石家莊分部】:河北科技大學(xué)/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協(xié)同大廈
最近開課時(shí)間(周末班/連續(xù)班/晚班):2020年3月16日 |
實(shí)驗(yàn)設(shè)備 |
☆資深工程師授課
☆注重質(zhì)量
☆邊講邊練
☆合格學(xué)員免費(fèi)推薦工作
★實(shí)驗(yàn)設(shè)備請(qǐng)點(diǎn)擊這兒查看★ |
質(zhì)量保障 |
1、培訓(xùn)過程中,如有部分內(nèi)容理解不透或消化不好,可免費(fèi)在以后培訓(xùn)班中重聽;
2、培訓(xùn)結(jié)束后,授課老師留給學(xué)員聯(lián)系方式,保障培訓(xùn)效果,免費(fèi)提供課后技術(shù)支持。
3、培訓(xùn)合格學(xué)員可享受免費(fèi)推薦就業(yè)機(jī)會(huì)。 |
課程大綱 |
|
大數(shù)據(jù)培訓(xùn)
培訓(xùn)大綱:
第一部分:如何構(gòu)建分布式數(shù)據(jù)倉庫平臺(tái)
1. 怎么樣才算是真正意義的大數(shù)據(jù)平臺(tái)
2. ? ? ?開源Hadoop介紹
3. 數(shù)據(jù)采集過程與分布式存儲(chǔ)
?
1) ETL介紹
?
2) Sqoop
?
3) HDFS
4. 數(shù)據(jù)倉庫與數(shù)據(jù)分析
?
1) MapReduce
?
2) Hive
?
3) Pig
?
4) HBase
5. 集群監(jiān)控與調(diào)度組件
?
1) Ganglia監(jiān)控
?
2) Hadoop集群權(quán)限管理
?
3) Hbase列數(shù)據(jù)庫監(jiān)控
?
4) Oozie介紹
6. ? ? ?移動(dòng)互聯(lián)網(wǎng)行為分析
7. ? ? ?網(wǎng)上輿情分析
第二部分:大數(shù)據(jù)平臺(tái)部署及案例
1. 我們應(yīng)該選哪種Hadoop?
?
1) 選哪個(gè)版本?為什么?
?
2) 選哪種發(fā)行版本?為什么?
2. 集群硬件應(yīng)該如何選配?
?
1) 內(nèi)存
?
2) CPU
?
3) 硬盤
3. 部署案例講解
?
1) 電信運(yùn)營(yíng)商全國(guó)用戶上網(wǎng)記錄系統(tǒng)
?
2) ? ?淘寶大數(shù)據(jù)架構(gòu)
第三部分:準(zhǔn)實(shí)時(shí)日志采集
1. 如何實(shí)現(xiàn)日志的準(zhǔn)實(shí)時(shí)收集、處理?
2. Flume
3. Storm流式處理 + 消息集群
4. 流式處理與Hadoop集群結(jié)合
第四部分:Hbase列數(shù)據(jù)庫及應(yīng)用案例
1. Hbase感性認(rèn)識(shí)
?
1) 在大數(shù)據(jù)的實(shí)際應(yīng)用中關(guān)系型數(shù)據(jù)庫,NoSQL數(shù)據(jù)庫和hdfs分布式文件系統(tǒng)三種存儲(chǔ)方式關(guān)系和如何集成應(yīng)用;
?
2) Hbase來源?
?
3) Hbase記錄長(zhǎng)什么樣?
?
4) Hbase存儲(chǔ)文件是什么樣的?
?
5) Hbase表的邏輯結(jié)構(gòu)
?
6) Hbase常見概念
2. Hbase主要組成
?
7) Zookeeper、Hmaster
?
8) HRegionServer、Region
?
9) HStore存儲(chǔ)、Hfile
?
10) Hbase內(nèi)部掃描RowKey的原理
?
11) Hbase內(nèi)部讀寫原理
?
12) HBase設(shè)計(jì)原理、架構(gòu)分析
?
13) Hadoop+HBase伸縮性(自動(dòng)擴(kuò)容、熱部署)
?
14) HBase相關(guān)表結(jié)構(gòu)設(shè)計(jì)(列族、列詳細(xì)分析)
?
15) HBase主HMaster與備用HMaster間的切換原理
?
16) HBase基本命令介紹
3. 如何使用Hbase?
?
17) Hbase的6種使用方式
?
18) HBase Shell方式訪問;
?
19) HBase Java API方式訪問;
?
20) Hive+Hbase方式訪問;
?
21) Pig+Hbase方式訪問;
4. Hbase+Zookeeper使用配置
?
22) Zookeeper簡(jiǎn)介
?
23) Zookeeper與 HBase 的關(guān)系
5. 項(xiàng)目案例:
?
24) 哪些場(chǎng)景適用Hbase ?
第五部分:大數(shù)據(jù)挖掘介紹與應(yīng)用案例
1. 大數(shù)據(jù)挖掘和傳統(tǒng)數(shù)據(jù)挖掘區(qū)別?
?
1) 傳統(tǒng)數(shù)據(jù)挖掘
?
2) SPSS Modeler 14.2
?
3) ? ?SAS簡(jiǎn)介
?
3) Mahout簡(jiǎn)介
?
4) Rhadoop例子
2. 算法介紹和應(yīng)用
?
1) 關(guān)聯(lián)分析
?
2) K-means
?
3) ? ? 決策數(shù)據(jù)C5.0
?
4) ? ?邏輯線性Logistic回歸
?
5) ? ?主成分/因子分析
?
6) ? ?Apriori算法
?
7) ? ? 預(yù)測(cè)算法
?
8) ? ?神經(jīng)網(wǎng)絡(luò)
3. 項(xiàng)目案例詳解
?
1) 用戶行為編好分析
?
2) 客戶流失預(yù)測(cè)分析
?
3) ? ?顧客位置信息
4. ? ? ?大數(shù)據(jù)可視化
?
1) ? ?現(xiàn)狀和問題
?
2) ? ?HeatMap熱力圖
?
3) ? ?Treemapping矩形式樹狀圖
?
4) ? ?百度Echarts例子介紹
?
5) ? ?海云數(shù)據(jù)
?
6) ? ?淘寶指數(shù)
?
?
?
|