班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號) |
每個班級的人數限3到5人,互動授課, 保障效果,小班授課。 |
上間和地點 |
上部份地點:【上海】同濟大學(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院【北京分部】:北京中山學院/福鑫大樓【南京分部】:金港大廈(和燕路)【武漢分部】:佳源大廈(高新二路)【成都分部】:領館區1號(中和大道)【沈陽分部】:沈陽理工大學/六宅臻品【鄭州分部】:鄭州大學/錦華大廈【石家莊分部】:河北科技大學/瑞景大廈 最近開間(周末班/連續班/晚班):2019年1月26日 |
實驗設備 |
◆小班教學,教學效果好 ☆注重質量☆邊講邊練 ☆合格學員免費推薦工作 ★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽; 2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。 3、培訓合格學員可享受免費推薦就業機會。☆合格學員免費頒發相關工程師等資格證書,提升職業資質。專注高端技術培訓15年,端海學員的能力得到大家的認同,受到用人單位的廣泛贊譽,端海的證書受到廣泛認可。 |
部份程大綱 |
|
- 第1章 大數據概述
本章將從故事說起,讓大家明白大數據是與我們的生活息息相關的,并不是遙不可及的,還會介紹大數據的特性,以及大數據對我們帶來的技術變革,大數據處理過程中涉及到的技術以及大數據典型應用。
- 1-1 課程導學 試看
1-2 學前必讀(助你平穩踩坑,暢學無憂)
1-3 課程目錄
1-4 從一個案例說起
1-5 什么是大數據以及大數據的4V特征 試看
1-6 大數據帶來的技術變革
1-7 大數據現存的模式
1-8 大數據的技術概念
1-9 大數據帶來的挑戰
1-10 如何對大數據進行存儲和分析
1-11 大數據典型應用
第2章 初識Hadoop
本章節將帶領大家認識Hadoop以及Hadoop生態系統、Hadoop的發展史、Hadoop的優勢、Hadoop的三個核心組件、Hadoop發行版的選擇,為后續深入講解Hadoop打下堅實的基礎。
- 2-1 課程目錄
2-2 Hadoop概述
2-3 Hadoop核心組件之HDFS概述
2-4 Hadoop核心組件之MapReduce
2-5 Hadoop核心組件之YARN
2-6 Hadoop優勢
2-7 Hadoop發展史
2-8 Hadoop生態圈
2-9 Hadoop發行版選型
2-10 OOTB環境的使用
第3章 分布式文件系統HDFS
本章將從Hadoop的設計目標、架構及文件系統命令空間出發,快速搭建單節點偽分布式HDFS的實驗環境,通過講解使用hdfs shell以及Java API的方式操作HDFS文件系統,詳細分析HDFS文件的讀寫流程,并通過HDFS API來實現詞頻統計案例,使得大家對Hadoop分布式文件系統HDFS有深刻的認識以及實戰。 ...
- 3-1 HDFS概述
3-2 HDFS設計目標
3-3 HDFS架構詳解
3-4 文件系統NameSpace詳解
3-5 HDFS副本機制
3-6 本課程使用的Linux環境介紹
3-7 Hadoop部署前置介紹
3-8 JDK1.8部署詳解
3-9 ssh無密碼登陸部署詳解
3-10 Hadoop安裝目錄詳解及hadoop-env配置
3-11 HDFS格式化以及啟動詳解
3-12 HDFS常見文件之防火墻干擾
3-13 Hadoop停止集群以及如何單個進程啟動
3-14 Hadoop命令行操作詳解
3-15 深度剖析Hadoop文件的存儲機制
3-16 HDFS API編程之開發環境搭建
3-17 HDFS API編程之第一個應用程序的開發
3-18 HDFS API編程之jUnit封裝
3-19 HDFS API編程之查看HDFS文件內容
3-20 HDFS API編程之創建文件并寫入內容
3-21 HDFS API編程之副本系數深度剖析
3-22 HDFS API編程之重命名
3-23 HDFS API編程之copyFromLocalFile
3-24 HDFS API編程之帶進度的上傳大文件
3-25 HDFS API編程之下載文件
3-26 HDFS API編程之列出文件夾下的所有內容
3-27 HDFS API編程之遞歸列出文件夾下的所有文件
3-28 HDFS API編程之查看文件塊信息
3-29 HDFS API編程之刪除文件
3-30 HDFS項目實戰之需求分析
3-31 HDFS項目實戰之代碼框架編寫
3-32 HDFS項目實戰之自定義上下文
3-33 HDFS項目實戰之自定義處理類實現
3-34 HDFS項目實戰之功能實現
3-35 HDFS項目實戰之使用自定義配置文件重構代碼
3-36 HDFS項目實戰之使用反射創建自定義Mapper對象
3-37 HDFS項目實戰之可插拔的業務邏輯處理
3-38 HDFS Replica Placement Policy
3-39 HDFS寫數據流程圖解
3-40 HDFS讀數據流程圖解
3-41 HDFS Checkpoint詳解
3-42 HDFS SaveMode
第4章 分布式計算框架MapReduce
本章將從架構、編程模型等角度帶大家認識Hadoop的分布式計算框架MapReduce,掌握MapReduce各個核心組件編程,并通過兩個案例讓大家深入掌握MapReduce編程的方方面面。
- 4-1 課程目錄
4-2 MapReduce概述
4-3 MapReduce編程模型詳解
4-4 MapReduce編程模型核心概念詳解
4-5 詞頻統計之自定義Mapper實現
4-6 詞頻統計之自定義Reducer實現
4-7 詞頻統計之自定義Driver類實現
4-8 詞頻統計之本地方式運行
4-9 詞頻統計之通過Debug方式進一步了解偏移量以及重構代碼
4-10 詞頻統計升級之Combiner操作 試看
4-11 流量統計實戰之需求
4-12 流量統計實戰之自定義復雜數據類型
4-13 流量統計實戰之自定義Mapper類
4-14 流量統計實戰之自定義Reducer實現
4-15 流量統計實戰之Driver開發
4-16 流量統計實戰之代碼重構及NullWritable的使用
4-17 流量統計實戰升級之自定義Partitioner
第5章 資源調度框架YARN
本章將從YARN的產生背景、YARN的架構及執行流程的角度帶大家認知Hadoop的資源調度框架YARN,快速搭建單節點偽分布式YARN的實驗環境并掌握如何提交MapReduce作業提交到YARN上運行。
- 5-1 課程目錄
5-2 YARN產生背景
5-3 YARN概述
5-4 YARN架構詳解
5-5 YARN執行流程
5-6 YARN環境部署
5-7 提交example案例到YARN上運行
5-8 提交流量統計案例到YARN上運行
第6章 電商項目實戰Hadoop實現
本章將通過電商用戶行為日志分析的項目實戰,來將前面幾個章節講解的知識點串聯起來,綜合使用Hadoop的技術進行離線統計分析。
- 6-1 課程目錄
6-2 用戶行為日志概述
6-3 為什么要記錄用戶行為日志
6-4 日志內容介紹
6-5 用戶行為日志分析的意義所在
6-6 電商常用術語
6-7 項目需求描述
6-8 數據處理流程及技術架構
6-9 瀏覽量統計功能實現
6-10 省份瀏覽量統計之IP庫解析
6-11 省份瀏覽量統計之日志解析
6-12 省份瀏覽量統計之功能實現
6-13 頁面瀏覽量統計之頁面編號獲取
6-14 頁面瀏覽量統計之功能實現
6-15 數據處理過程中ETL的重要性
6-16 原始日志ETL操作
6-17 瀏覽量統計功能升級
6-18 省份瀏覽量統計功能升級
6-19 頁面瀏覽量統計功能升級思路
6-20 打包到服務器上運行
6-21 項目擴展
第7章 數據倉庫Hive
本章將從Hive的產生背景、體系架構、Hive部署、DDL以及DML來掌握Hive使用的方方面面。
- 7-1 課程目錄
7-2 Hive產生背景
7-3 Hive是什么
7-4 為什么要使用Hive
7-5 Hive在Hadoop生態圈中的位置
7-6 Hive體系架構
7-7 Hive部署架構
7-8 Hive與RDBMS的區別
7-9 Hive部署
7-10 Hive快速入門
7-11 Hive DDL之數據庫操作
7-12 Hive DDL之表操作
7-13 Hive DML之加載和導出數據
7-14 Hive QL基本統計
7-15 Hive QL之聚合函數
7-16 Hive QL之分組函數
7-17 Hive QL之join的使用
7-18 Hive QL執行計劃
第8章 電商項目實戰Hive實現
本章將使用Hive對電商用戶行為日志分析進行重新實現,讓大家對MapReduce編程和Hive實現的方式進行對比,體會Hive在生產上使用的便捷性。
- 8-1 課程目錄
8-2 外部表在Hive中的使用
8-3 track_info分區表的創建
8-4 將ETL的數據加載到Hive表
8-5 使用Hive完成統計分析功能
8-6 Hive實現項目的方便性體現
第9章 Hadoop分布式集群搭建
本章將帶領大家搭建一個三個節點的分布式Hadoop集群環境,讓大家對于Hadoop集群的安裝有更深入的認識,并將項目實戰案例運行在分布式集群環境中。
|