
機(jī)器學(xué)習(xí)及R應(yīng)用培訓(xùn)
第1講 機(jī)器學(xué)習(xí)引論
(1) 什么是機(jī)器學(xué)習(xí)
(2) 機(jī)器學(xué)習(xí)的分類與術(shù)語
(3) 案例:垃圾郵件過濾;手寫體數(shù)字識(shí)別;圖像識(shí)別;自動(dòng)駕駛
第2講 R語言快速入門
(1) Why R?
(2) 安裝R與RStudio
(3) R的對(duì)象(vector, matrix, data frame,list)
(4) 面向?qū)ο蟮暮瘮?shù)式語言
(5) R語言畫圖
第3講 數(shù)學(xué)回顧
(1) 梯度向量
(2) 方向?qū)?shù)
(3) 梯度下降
(4) 向量微分
(5) 優(yōu)化
第4講 線性回歸
(1) OLS
(2) 過擬合與泛化能力
(3) 偏差與方差的權(quán)衡
(4) 交叉驗(yàn)證
(5) R案例:多項(xiàng)式回歸的過擬合;波士頓房價(jià)
第5講 邏輯回歸
(1) Logit
(2) 幾率比
(3) 靈敏度與特異度
(4) ROC與AUC
(5) 科恩的kappa
(6) R案例:泰坦尼克號(hào)旅客的存活
第6講 多項(xiàng)邏輯回歸
(1) 多項(xiàng)Logit
(2) R案例:識(shí)別玻璃類別
第7講 判別分析
(1) 線性判別分析(Linear Discriminant Analysis)
(2) 二次判別分析(Quadratic Discriminant Analysis)
(3) 費(fèi)雪判別分析(Fisher Discriminant Analysis)
(4) R案例:鳶尾花品種的歸類
第8講 樸素貝葉斯
(1) 樸素貝葉斯(Naive Bayes)
(2) 拉普拉斯修正(Laplacian Correction)
(3) R案例:垃圾郵件的識(shí)別
第9講 懲罰回歸
(1) 高維回歸的挑戰(zhàn)
(2) 嶺回歸(Ridge Regression)
(3) 套索估計(jì)(Lasso)
(4) 彈性網(wǎng)估計(jì)(Elastic Net)
(5) R案例:前列腺癌的影響因素
第10講 K近鄰法
(1) 回歸問題的K近鄰法
(2) 分類問題的K近鄰法
(3) R案例:摩托車撞擊實(shí)驗(yàn)數(shù)據(jù);模擬混合數(shù)據(jù);威斯康辛乳腺癌的診斷
第11講 決策樹
(1) 分類樹(Classification Tree)
(2) 分裂準(zhǔn)則(錯(cuò)分率、基尼指數(shù)、信息熵)
(3) 成本復(fù)雜性修枝
(4) 回歸樹(Regression Tree)
(5) R案例:波士頓房價(jià);葡萄牙銀行市場營銷
第12講 隨機(jī)森林
(1) 集成學(xué)習(xí)(Ensemble Learning)
(2) 裝袋法(Bagging)
(3) 隨機(jī)森林(Random Forest)
(4) 變量重要性(Variable Importance)
(5) 偏依賴圖(Partial Dependence Plot)
(6) R案例:波士頓房價(jià);聲吶信號(hào)的分類
第13講 提升法
(1) 自適應(yīng)提升法 (AdaBoost)
(2) AdaBoost的統(tǒng)計(jì)解釋
(3) 梯度提升法 (Gradient Boosting Machine)
(4) XGBoost
(5) R案例:波士頓房價(jià);過濾垃圾郵件;識(shí)別玻璃類別
第14講 支持向量機(jī)
(1) 大間隔分類器(Maximal Margin Classifier)
(2) 軟間隔分類器(Soft MarginClassifier)
(3) 支持向量機(jī)(Support Vector Machine)
(4) 核技巧(Kernel Trick)
(5) 支持向量回歸(Support Vector Regression)
(6) R案例:模擬數(shù)據(jù);過濾垃圾郵件;識(shí)別手寫數(shù)字;波士頓房價(jià)
第15講 人工神經(jīng)網(wǎng)絡(luò)
(1) 人工神經(jīng)網(wǎng)絡(luò)的思想
(2) 感知機(jī)(Perceptron)
(3)前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Network)
(4) 激活函數(shù)(Activation Function)
(5) 反向傳播算法(Back-propagation Algorithm)
(6) 隨機(jī)梯度下降(Stochastic Gradient Descent)
(7) 神經(jīng)網(wǎng)絡(luò)的過擬合與正則化
(8) 卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network)
(9) 深度學(xué)習(xí)的發(fā)展
(10) R案例:波士頓房價(jià);聲吶信號(hào)的分類;鳶尾花品種的分類
第16講 非監(jiān)督學(xué)習(xí)之主成分分析
(1) 總體中的主成分分析
(2) 樣本中的主成分分析
(3) 方差分解與降維
(4) 主成分回歸(Principal Component Regression)
(5) R案例:左右耳聽力;香港回歸的經(jīng)濟(jì)效應(yīng)
第17講 非監(jiān)督學(xué)習(xí)之聚類分析
(1) K-均值聚類(K-means Clustering)
(2) 分層聚類(Hierarchical Clustering)
(3) 樹狀圖
(4) 基于相關(guān)系數(shù)的距離
(5) R案例:模擬數(shù)據(jù);鳶尾花品種的歸類
第18講 數(shù)據(jù)科學(xué)的R語言
(1) 何為數(shù)據(jù)科學(xué)
(2) 管道算子(Pipe Operator)
(3) R包tidyverse(輸入數(shù)據(jù)、數(shù)據(jù)清理、數(shù)據(jù)變換)
(4) R包ggplot2(高階畫圖)
(5) R包c(diǎn)aret(機(jī)器學(xué)習(xí)的統(tǒng)一接口)
(6) R案例:R包tidyverse的自帶案例;威斯康辛乳腺癌的診斷
第19講(Bonus Lecture) 機(jī)器學(xué)習(xí)在經(jīng)管社科的應(yīng)用
精讀幾篇在經(jīng)管社科頂刊發(fā)表的經(jīng)典機(jī)器學(xué)習(xí)論文