第一部份 Spark ML基礎(chǔ)入門(mén)
1、Spark介紹
2、Spark ML介紹
3、部份程的基礎(chǔ)環(huán)境
4、Spark SparkSession
5、Spark Datasets操作
6、Datasets操作的代碼實(shí)操
第二部份 Spark ML Pipelines(ML管道)
1、Pipelines的主要概念
2、Pipelines實(shí)例講解
3、ML操作的代碼實(shí)操
4、使用 ML Pipeline 構(gòu)建機(jī)器學(xué)習(xí)工作流案例展示
5、實(shí)例的代碼實(shí)操
第三部份 Spark ML數(shù)學(xué)基礎(chǔ)
1、ML矩陣向量計(jì)算
2、分類(lèi)效果評(píng)估指標(biāo)及ML實(shí)現(xiàn)詳解
3、交叉-驗(yàn)證方法及ML實(shí)現(xiàn)詳解
4、實(shí)例的代碼實(shí)操
第四部份 Spark ML特征的提取、轉(zhuǎn)換和選擇
1、特征的提取及ML實(shí)現(xiàn)詳解
2、特征的轉(zhuǎn)換及ML實(shí)現(xiàn)詳解
3、特征的選擇及ML實(shí)現(xiàn)詳解
4、實(shí)例的代碼實(shí)操
第五部份 Spark ML線性回歸/邏輯回歸算法
1、線性回歸算法
2、邏輯回歸算法
3、ML回歸算法參數(shù)詳解
4、ML實(shí)例
5、實(shí)例的代碼實(shí)操
第六部份 Spark ML決策樹(shù)/隨機(jī)森林/GBDT算法
1、決策樹(shù)算法
2、隨機(jī)森林算法
3、GDBT算法
4、ML樹(shù)模型參數(shù)詳解
5、ML實(shí)例
6、實(shí)例的代碼實(shí)操
第七部份 Spark ML KMeans聚類(lèi)算法
1、KMeans聚類(lèi)算法
2、ML KMeans模型參數(shù)詳解
3、ML實(shí)例
4、實(shí)例的代碼實(shí)操
第八部份 Spark ML LDA主題聚類(lèi)算法
1、LDA主題聚類(lèi)算法
2、ML LDA主題聚類(lèi)模型參數(shù)詳解
3、ML實(shí)例
4、實(shí)例的代碼實(shí)操
第九部份 Spark ML協(xié)同過(guò)濾推薦算法
1、協(xié)同過(guò)濾推薦算法
2、ML協(xié)同過(guò)濾分布式實(shí)現(xiàn)邏輯
3、ML協(xié)同過(guò)濾源碼開(kāi)發(fā)
4、實(shí)現(xiàn)實(shí)例
5、實(shí)例的代碼實(shí)操
第十部份 大型案例:基于Spark的推薦模型開(kāi)發(fā)
1、案例背景
2、架構(gòu)設(shè)計(jì)
3、數(shù)據(jù)準(zhǔn)備
4、模型訓(xùn)練
5、模型預(yù)測(cè)
6、腳本封裝 |