模塊一?Spark ML基礎(chǔ)入門
1.1 Spark介紹
1.2 Spark ML介紹
1.3 課程的基礎(chǔ)環(huán)境
1.4 Spark SparkSession
1.5 Spark Datasets操作
1.6 Datasets操作的代碼實(shí)操
模塊二?Spark ML
Pipelines(ML管道)
2.1 Pipelines的主要概念
2.2 Pipelines實(shí)例講解
2.3 ML操作的代碼實(shí)操
2.4 使用 ML Pipeline 構(gòu)建機(jī)器學(xué)習(xí)工作流案例展示
2.5 實(shí)例的代碼實(shí)操聲
模塊三?Spark ML數(shù)學(xué)基礎(chǔ)
3.1 ML矩陣向量計(jì)算
3.2 分類效果評(píng)估指標(biāo)及ML實(shí)現(xiàn)詳解
3.3 交叉-驗(yàn)證方法及ML實(shí)現(xiàn)詳解
3.4 實(shí)例的代碼實(shí)操
3.5 特征的提取及ML實(shí)現(xiàn)詳解
3.6特征的轉(zhuǎn)換及ML實(shí)現(xiàn)詳解
3.7 特征的選擇及ML實(shí)現(xiàn)詳解
3.8 實(shí)例的代碼實(shí)操?
模塊四?Spark ML特征的提取、轉(zhuǎn)換和選擇
4.1 線性回歸算法
4.2 邏輯回歸算法
4.3 ML回歸算法參數(shù)詳解
4.4 ML實(shí)例
4.5 實(shí)例的代碼實(shí)操
模塊五?Spark ML線性回歸/邏輯回歸算法
5.1 決策樹算法
5.2 隨機(jī)森林算法
5.3 GDBT算法
5.4 ML樹模型參數(shù)詳解
5.5 ML實(shí)例
5.6 實(shí)例的代碼實(shí)操
模塊六?Spark ML決策樹/隨機(jī)森林/GBDT算法
6.1 KMeans聚類算法
6.2 ML KMeans模型參數(shù)詳解
6.3 ML實(shí)例
6.4 實(shí)例的代碼實(shí)操
模塊七?Spark ML KMeans聚類算法?7.1 LDA主題聚類算法
7.2 ML LDA主題聚類模型參數(shù)詳解
7.3 ML實(shí)例
7.4 實(shí)例的代碼實(shí)操
模塊八?Spark ML LDA主題聚類算法
8.1 協(xié)同過濾推薦算法
8.2 ML協(xié)同過濾分布式實(shí)現(xiàn)邏輯
8.3 ML協(xié)同過濾源碼開發(fā)
8.4 實(shí)現(xiàn)實(shí)例
8.5 實(shí)例的代碼實(shí)操
模塊九?Spark ML協(xié)同過濾推薦算法
9.1 案例背景
9.2 架構(gòu)設(shè)計(jì)
9.3 數(shù)據(jù)準(zhǔn)備
9.4 模型訓(xùn)練
9.5 模型預(yù)測(cè)
9.6 腳本封裝
模塊十?項(xiàng)目實(shí)踐
大型案例:基于Spark的推薦模型開發(fā) |