階段九:Java大數(shù)據(jù)基礎(chǔ)
學(xué)習(xí)內(nèi)容:
了解大數(shù)據(jù)概論、Hadoop生態(tài)系統(tǒng)、Hadoop環(huán)境安裝配置,掌握Hadoop的RPC機(jī)制、Hadoop的Writable類型、Hadoop中編碼器和解碼器、HDFS使用shell+Java API、MapReduce函數(shù)式編程概念、壓縮格式與MapReduce優(yōu)化、MapReduce中的Join算法、Hive工作原理、類型及特點(diǎn)、Hive的三種連接方式、Sqoop使用案例、Azkaban執(zhí)行工作流......
學(xué)習(xí)目標(biāo):
初步了解Hadoop起源與安裝、MapReduce工作原理、Hive數(shù)據(jù)倉庫工具等使用,掌握HDFS分布式文件系統(tǒng)、Hadoop文件I/O詳解、MapReduce編程開發(fā)、Hive深入解讀、Sqoop與Oozie、Zookeeper詳解等。
完成項(xiàng)目:微博數(shù)據(jù)大數(shù)據(jù)分析項(xiàng)目、用戶行為分析項(xiàng)目、精準(zhǔn)廣告投放項(xiàng)目。