班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每個班級的人數限3到5人,互動授課, 保障效果,小班授課。 |
上間和地點 |
上部份地點:【上海】同濟大學(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院【北京分部】:北京中山學院/福鑫大樓【南京分部】:金港大廈(和燕路)【武漢分部】:佳源大廈(高新二路)【成都分部】:領館區1號(中和大道)【沈陽分部】:沈陽理工大學/六宅臻品【鄭州分部】:鄭州大學/錦華大廈【石家莊分部】:河北科技大學/瑞景大廈 最近開間(周末班/連續班/晚班):2020年3月16日 |
實驗設備 |
◆小班教學,教學效果好 ☆注重質量☆邊講邊練 ☆合格學員免費推薦工作 ★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽; 2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。 3、培訓合格學員可享受免費推薦就業機會。☆合格學員免費頒發相關工程師等資格證書,提升職業資質。專注高端技術培訓15年,端海學員的能力得到大家的認同,受到用人單位的廣泛贊譽,端海的證書受到廣泛認可。 |
部份程大綱 |
|
第一部份 Hive與Hadoop
(1) Hadoop和MapReduce
(2) Hadoop生態中的Hive
(3) Hive與關系型數據庫的差異
(4) Hive安裝
第二部份 Hive的特性1
(1) 內部表與外部表
(2) insert與insert overwrite
(3) mapjoin
(4) group by/order by/partition by/sort by/cluster by
第三部份 Hive的特性2
(1) 動態分區、靜態分區
(2) streaming轉換數據
(2) 一次讀取多次插入
(3) 文件壓縮格式
第四部份 Hive的特性3
(1) UDF
(2) UDAF
(3) UDTF
第五部份 Hive調優
(1) Hive優化通用思路
(2) 執行計劃
(3) Hive調優常用方法
(3) Hive調優案例
第六部份 Hive實戰
(1) 某電商網站,按平臺、版本、城市維度統計PV、UV
(2) 某電商網站,按平臺、版本、城市多種維度組合,統計PV、UV
(3) 某電商網站,按平臺、版本、城市多種維度組合,統計PV、UV、下單量、下單用戶數
第七部份 數據倉庫概要
(1) 數據倉庫起因
(2) 數據倉庫發展
(3) 數據倉庫定義
(4) 數據倉庫與數據庫的區別
第八部份 數據倉庫架構
(1) Inmon 與 Kimball
(2) 混合架構 與 DataVault架構
(3) 數倉架構選型的思考
(4) 數據倉庫分層
第九部份 數據倉庫建模
(1) 什么是數據模型
(2) 為什么需要數據模型
(3) 如何創建數據模型
(4) 數倉建模的方法介紹
第十部份 維度建模
(1) 維度建模基本概念
(2) 維度建模技術
(3) 維度建模過程
(4) 維度建模常見問題
第十一部份 從0到1搭建Hive數倉(上)
(1) 根據業務特點和需求,選型數據倉庫架構
(2) 基于數倉架構和業務處理綜合考慮,設計合理的數據倉庫分層
(3) 梳理整體的業務ER圖,選擇要建設的業務和數據范圍
(4) 確立數倉總線架構,站在較高的抽象業務分析主題
第十二部份 從0到1搭建Hive數倉(下)
(1) 按主題思想設計完整的數據倉庫模型
(2) 根據主題優先級劃分,分階段設計數據流和數據模型
(3) 數據模型落地:Hive開發->測試>數據驗證->上線
(4) 數倉建設過程中的數據質量和元數據管理
|