
大數(shù)據(jù)技術(shù)原理與應(yīng)用培訓(xùn)
第1章 大數(shù)據(jù)概述
1.1大數(shù)據(jù)時(shí)代
1.2大數(shù)據(jù)的概念和影響
1.3大數(shù)據(jù)的應(yīng)用
1.4大數(shù)據(jù)的關(guān)鍵技術(shù)
1.5 大數(shù)據(jù)與云計(jì)算、物聯(lián)網(wǎng)的關(guān)系
第1章 大數(shù)據(jù)概述 單元測(cè)驗(yàn)
第2章 大數(shù)據(jù)處理架構(gòu)Hadoop
2.1Hadoop簡(jiǎn)介和版本演變
2.2Hadoop項(xiàng)目結(jié)構(gòu)
2.3Linux和Hadoop的安裝
2.4Hadoop集群的部署和使用
第2章 大數(shù)據(jù)處理架構(gòu)Hadoop 單元測(cè)驗(yàn)
第3章 分布式文件系統(tǒng)HDFS
3.1 分布式文件系統(tǒng)HDFS簡(jiǎn)介
3.2 HDFS相關(guān)概念
3.3 HDFS體系結(jié)構(gòu)
3.4 HDFS存儲(chǔ)原理
3.5 HDFS數(shù)據(jù)讀寫(xiě)
3.6 HDFS編程實(shí)踐
第3章 分布式文件系統(tǒng)HDFS 單元測(cè)驗(yàn)
第4章 分布式數(shù)據(jù)庫(kù)HBase
4.1 HBase簡(jiǎn)介
4.2 HBase數(shù)據(jù)模型
4.3 HBase的實(shí)現(xiàn)原理
4.4 HBase運(yùn)行機(jī)制
4.5 HBase應(yīng)用方案
4.6 HBase的安裝和編程實(shí)踐
第4章 分布式數(shù)據(jù)庫(kù)HBase單元測(cè)驗(yàn)
第5章 NoSQL數(shù)據(jù)庫(kù)
5.1 NoSQL數(shù)據(jù)庫(kù)
5.2 NoSQL與關(guān)系數(shù)據(jù)庫(kù)的比較
5.3 四大類型NoSQL數(shù)據(jù)庫(kù)
5.4 NoSQL數(shù)據(jù)庫(kù)的理論基石
5.5 從NoSQL到NewSQL數(shù)據(jù)庫(kù)
5.6 文檔數(shù)據(jù)庫(kù)MongoDB
第5章 NoSQL數(shù)據(jù)庫(kù) 單元測(cè)驗(yàn)
第6章 云數(shù)據(jù)庫(kù)
6.1 云數(shù)據(jù)庫(kù)概述
6.2 云數(shù)據(jù)庫(kù)產(chǎn)品
6.3 UMP系統(tǒng)
6.4 Amazon云數(shù)據(jù)庫(kù)
6.5 微軟云數(shù)據(jù)庫(kù)SQL Azure
第6章 云數(shù)據(jù)庫(kù) 單元測(cè)驗(yàn)
第7章 MapReduce
7.1 MapReduce簡(jiǎn)介
7.2 MapReduce的體系結(jié)構(gòu)
7.3 MapReduce工作流程概述
7.4 Shuffle過(guò)程原理
7.5 MapReduce應(yīng)用程序執(zhí)行過(guò)程
7.6 實(shí)例分析:WordCount
7.7 MapReduce的具體應(yīng)用
7.8 MapReduce編程實(shí)踐
第7章 MapReduce 單元測(cè)驗(yàn)
第8章 Hadoop再探討
8.1 Hadoop的優(yōu)化與發(fā)展
8.2 HDFS HA和HDFS Federation
8.3 YARN
8.4 Hadoop生態(tài)系統(tǒng)中具有代表性的功能組件
第8章 Hadoop再探討 單元測(cè)驗(yàn)
第9章 數(shù)據(jù)倉(cāng)庫(kù)Hive
9.1 數(shù)據(jù)倉(cāng)庫(kù)概念
9.2 Hive簡(jiǎn)介
9.3 SQL語(yǔ)句轉(zhuǎn)換成MapReduce作業(yè)的基本原理
9.4 Impala
9.5 Hive的安裝和基本操作
第9章 數(shù)據(jù)倉(cāng)庫(kù)Hive 單元測(cè)驗(yàn)
第10章 Spark
10.1 Spark簡(jiǎn)介
10.2 Spark生態(tài)系統(tǒng)
10.3 Spark運(yùn)行架構(gòu)
10.4 Spark SQL
10.5 Spark的部署和應(yīng)用方式
10.6 Spark的安裝和編程實(shí)踐
第10章 Spark 單元測(cè)驗(yàn)
第11章 流計(jì)算
11.1 流計(jì)算概述
11.2 流計(jì)算處理流程
11.3 流計(jì)算的應(yīng)用
11.4 開(kāi)源流計(jì)算框架Storm
11.5 Spark Streaming、Samza以及三種流計(jì)算框架的比較
11.6 Storm的安裝和編程實(shí)踐
第11章 流計(jì)算 單元測(cè)驗(yàn)
第12章 Flink
12.1Flink簡(jiǎn)介
12.2為什么選擇Flink
12.3Flink應(yīng)用場(chǎng)景
12.4Flink技術(shù)棧、體系架構(gòu)和編程模型
12.5Flink的安裝和編程實(shí)踐
第12章 Flink 單元測(cè)驗(yàn)
第13章 圖計(jì)算
13.1 圖計(jì)算簡(jiǎn)介
13.2 Pregel簡(jiǎn)介
13.3 Pregel圖計(jì)算模型
13.4 Pregel的C++ API
13.5 Pregel的體系結(jié)構(gòu)
13.6 Pregel的應(yīng)用實(shí)例——單源短路徑
13.7 Hama的安裝和使用
第13章 圖計(jì)算 單元測(cè)驗(yàn)
第14章 大數(shù)據(jù)在不同領(lǐng)域的應(yīng)用
14.1大數(shù)據(jù)應(yīng)用概覽
14.2 大數(shù)據(jù)在互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用——推薦系統(tǒng)
14.3 基于大數(shù)據(jù)的綜合健康服務(wù)平臺(tái)
第14章 大數(shù)據(jù)在不同領(lǐng)域的應(yīng)用