免费一看一级欧美-免费一区二区三区免费视频-免费伊人-免费影片-99精品网-99精品小视频

課程目錄:基于分布式架構大數(shù)據(jù)hadoop生態(tài)組件及數(shù)據(jù)分析可視化培訓
4401 人關注
(78637/99817)
課程大綱:

    基于分布式架構大數(shù)據(jù)hadoop生態(tài)組件及數(shù)據(jù)分析可視化培訓

 

 

1、分布式大數(shù)據(jù)框架Hadoop(理論·上)
本節(jié)主要講解大數(shù)據(jù)概述及Hadoop HDFS
2、分布式大數(shù)據(jù)框架Hadoop(實操·上)
本實操演練練習Hadoop部署及插件安裝
01 實操:Hadoop 安裝
紹搭建Hadoop集群的具體步驟。
02 實操:Hadoop開發(fā)插件安裝
介紹如何給Eclipse配置Hadoop插件、方便使用Eclipse開發(fā)工具進行大數(shù)據(jù)開發(fā)。
視情況及反饋, 會選用 IntelliJ IDEA
章節(jié)內(nèi)容:分布式大數(shù)據(jù)框架 Hadoop
課程內(nèi)容: 1 、分布式處理框架 MapReduce
2、資源調(diào)度框架 Yarn
授課內(nèi)容:
1、分布式大數(shù)據(jù)框架Hadoop(理論·下)
主要講解Hadoop MR、Yarn
2、式大數(shù)據(jù)框架Hadoop(實操·下)
操演練練習Hadoop Shell操作及MR入門案例
03 實操:Hadoop Shell基本操作
本任務介紹常用的Hadoop Shell命令。
04 實操:Mapreduce實例——WordCount
本任務練習使用電商數(shù)據(jù)進行詞頻統(tǒng)計。
章節(jié)內(nèi)容:數(shù)據(jù)倉庫 Hive + 數(shù)據(jù)遷移工具 Sqoop
課程內(nèi)容:
1、數(shù)據(jù)倉庫 Hive 介紹
2、Hive 安裝部署
3、Hive Shell 基本操作
4、Sqoop 安裝部署
5、Sqoop 數(shù)據(jù)遷移
6、Sqoop 增量數(shù)據(jù)遷移
授課內(nèi)容
1、 數(shù)據(jù)倉庫Hive+數(shù)據(jù)遷移工具Sqoop(理論)
本節(jié)主要講解數(shù)據(jù)倉庫Hive及遷移工具Sqoop
2、 數(shù)據(jù)倉庫Hive+數(shù)據(jù)遷移工具Sqoop(實操)
本實操演練練習Hive基本操作及Sqoop應用
05 實操:Hive安裝部署
本任務介紹如何安裝部署數(shù)據(jù)倉庫Hive。
06 實操:Hive基本操作
本任務詳細介紹Hive的基本操作以及Hive的外部表與內(nèi)部表的區(qū)別。
07 實操:Sqoop安裝
本任務主要介紹Sqoop的工作原理,然后詳細說明Sqoop的安裝部署過程。
08 實操:綜合案例—基本流程圖
本任務介紹Sqoop在Hive與Mysql之間進行數(shù)據(jù)傳遞以及Hive數(shù)據(jù)分析
1、Flume 介紹
2、Flume Agent 詳解
授課內(nèi)容:
1、 分布式日志采集工具Flume(理論)
本節(jié)主要講解Flume工作原理、架構、Agent概念
2、 分布式日志采集工具Flume(實操)
本演練實操練習Flume安裝部署及Agent配置詳解
09 實操:Flume安裝部署
本任務介紹Flume的工作原理和Flume安裝流程。
10 實操:Flume配置:Source、Channel、Sink
本任務介紹配置多種source,channel,sink組合,實現(xiàn)多種需求。
11 實操:Flume多source,多sink組合框架搭建
本任務介紹Flume多source,多sink組合框架搭建。
章節(jié)內(nèi)容:分布式消息系統(tǒng) Kafka
課程內(nèi)容:
1、Kafka 結構分析 2、Flume 與 Kafka 聯(lián)用
授課內(nèi)容:
1、 分布式消息體統(tǒng)Kafka(理論)
本節(jié)主要講解Kafka工作原理、架構及名詞概念
2、 分布式消息體統(tǒng)Kafka(實操)
本演練實操練習Kafka安裝部署、與Flume連用
12 實操:Kafka安裝及測試
本任務介紹安裝scala與zookeeper,然后在已安裝好的scala和zookeeper環(huán)境基礎上,安裝部署Kafka。
13 實操:Flume傳輸數(shù)據(jù)給Kafka
本任務介紹Flume傳數(shù)據(jù)到Kafka的執(zhí)行原理和具體操作。
章節(jié)內(nèi)容:分布式大數(shù)據(jù)框架Spark
課程內(nèi)容:
1、Spark 框架介紹
2、Spark RDD 介紹
3、Spark SQL 數(shù)據(jù)處理
4、Spark Shell 數(shù)據(jù)處理
授課內(nèi)容:
1、 分布式大數(shù)據(jù)框架Spark(理論)
本節(jié)主要講解Spark工作原理、架構及RDD概念
2、分布式大數(shù)據(jù)框架Spark(實操)
本演練實操練習Spark安裝部署及Shell操作
14 實操:Spark Standalone偽分布模式安裝
本任務介紹在已經(jīng)安裝好Hadoop下,如何安裝Spark Standalone模式。
15 實操:Spark Shell操作
本任務介紹Spark Shell操作,在Spark Shell命令行下對算子進行實例講解,包括去重、排序、Join、求平均值
1、爬蟲框架介紹
2、電商數(shù)據(jù)清洗
3、電商離線數(shù)據(jù)分析
4、數(shù)據(jù)遷移
授課內(nèi)容:
1、電子商務數(shù)據(jù)分析項目(爬蟲、清洗)
2、電子商務數(shù)據(jù)分析項目(離線數(shù)據(jù)分析)
16 實操:一、采集電商網(wǎng)站交易及評論數(shù)據(jù)(局域網(wǎng)or互聯(lián)網(wǎng))
本次任務對爬蟲進行了介紹,并分析網(wǎng)頁的源碼結構和如何爬取數(shù)據(jù)。
17 實操:二、開發(fā)MR程序清洗電商評論數(shù)
18 實操:三、利用HiveSQL離線分析評論數(shù)據(jù)
19 實操:四、利用Sqoop進行數(shù)據(jù)遷移至Mysql數(shù)據(jù)庫
1、離線數(shù)據(jù)可視化 2、SparkStreaming 實時流數(shù)據(jù)處理

主站蜘蛛池模板: eeuss国产一区二区三区 | 女人夜夜春 | aiai网站| 性福利网站| 欧美日韩一区二区三区在线观看 | 国产资源视频 | 国产性精品| 4虎永免费最新永久免费地址 | 久久久久久国产精品免费免 | 在线观看二区三区午夜 | 综合久久久| 视频在线观看91 | 国产欧美国产精品第二区 | 成人伊人亚洲人综合网站222 | 少妇高潮太爽了在线视频 | 久久精品a一国产成人免费网站 | 精品一卡2卡3卡4卡5卡亚洲 | 亚洲视频免费播放 | 欧美日韩亚洲一区二区精品 | 久久99精品国产麻豆 | 四虎影视www| 男女男免费视频网站国产 | 久久久久国产精品美女毛片 | 日韩中文字幕第一页 | 精品久久久久久中文 | 日本中文字幕在线 | 韩国演艺圈精品一区二区 | 欧美人体在线 | 精品成人一区二区 | 伊人草| 日日摸夜夜欧美一区二区 | 国产真实伦对白视频全集 | 四虎黄色网 | 手机看片午夜 | 久久国产高清波多野结衣 | 色综合久久久高清综合久久久 | 一区二区三区在线观看免费 | 在线观看91精品国产性色 | 免费观看亚洲视频 | 亚洲一区二区三区高清视频 | 日韩精品一区二区三区免费视频 |