
Python數(shù)據(jù)挖掘應(yīng)用培訓(xùn)
第一階段: Python 基礎(chǔ)精要,零基礎(chǔ)也能學(xué)會(huì)
1. 語法初步
2. 列表、字符串和元組
3. 集合與字典
4. 條件和循環(huán)語句
5. 若干重要內(nèi)置函數(shù)應(yīng)用
6. 文件操作
7. 函數(shù)及其應(yīng)用
8. 正則表達(dá)式
9. 數(shù)據(jù)庫和 Python
10.排序算法、 動(dòng)態(tài)規(guī)劃算法、遞歸算法等算法
第二階段:numpy、pandas等進(jìn)行數(shù)據(jù)清洗和整理,充分統(tǒng)計(jì)分析數(shù)據(jù)
1. 整理數(shù)據(jù)(切片、產(chǎn)生隨機(jī)數(shù)、復(fù)制、廣播、排序等)
2. 數(shù)據(jù)索引和選擇的各種方法
3. 數(shù)據(jù)的分組、分割、合并、變形
4. 缺失值和空值的數(shù)據(jù)處理
5. 時(shí)間序列數(shù)據(jù)處理、建模和預(yù)測(cè)(ARIMA)
6. 含中文數(shù)據(jù)的處理
7. 數(shù)據(jù)去重、去離群值
8. R語言和Python(pandas)數(shù)據(jù)整理和建模的比較
9. 描述統(tǒng)計(jì)和推論統(tǒng)計(jì)分析
第三階段:Python機(jī)器學(xué)習(xí)算法和數(shù)據(jù)挖掘案例實(shí)戰(zhàn)
1. 文本挖掘原理和案例(Logistic 回歸模型對(duì)文本的分類)
2. 預(yù)測(cè)分析核心算法(圖片的K-means聚類分析)
3. 機(jī)器學(xué)習(xí)經(jīng)典算法(圖片的識(shí)別和分類:PCA建模)
4. 概率統(tǒng)計(jì)(二維手寫數(shù)字識(shí)別 KNN方法)
5. 數(shù)據(jù)可視化(推薦系統(tǒng)和精準(zhǔn)營銷 近鄰方法、協(xié)同過濾)
6. 金融建模分析(數(shù)據(jù)可視化的各種情形)
7. 客戶畫像和精準(zhǔn)營銷(新聞的文本分類 TF-IDF準(zhǔn)則、旅游新聞個(gè)性化推薦)
8. 算法和模型的優(yōu)化(手寫識(shí)別)
9. 模型精度評(píng)估和提升(樸素貝葉斯決策)
10.特征選取的方法(酒的品質(zhì)分類預(yù)測(cè))
11.佳K-means分類數(shù)(機(jī)器學(xué)習(xí)的格點(diǎn)搜索和參數(shù)尋優(yōu))
12.交叉驗(yàn)證(懲罰線性回歸分類器)
13.不平衡數(shù)據(jù)處理(使用支持向量機(jī)識(shí)別和分類)
14.XGBoost 使用案例 (金融時(shí)間序列預(yù)測(cè))
15.貝葉斯分析(機(jī)器集成學(xué)習(xí)算法)
16.逼近和優(yōu)化 (隨機(jī)模擬)
17.自然語言概率圖模型(用戶流失預(yù)警)
18 馬爾科夫&蒙特卡羅(量化投資實(shí)戰(zhàn))