自然語(yǔ)言處理(NLP)是人工智能和語(yǔ)言學(xué)領(lǐng)域的一個(gè)分支學(xué)科,同時(shí)也是機(jī)器學(xué)習(xí)中最熱的一個(gè)方向之一。試想想,機(jī)器可完全明白人類的語(yǔ)言,并且可以嫻熟地使用自然語(yǔ)言與人類溝通,這不就是人工智能的目標(biāo)?目前,我們處理的數(shù)據(jù),并不僅僅只有數(shù)值型數(shù)據(jù),還包含了大量的文本數(shù)據(jù)。對(duì)于傳統(tǒng)的分析技術(shù)來(lái)說(shuō),文本數(shù)據(jù)中的真正含義無(wú)法真正解析出來(lái),是對(duì)文本信息的較大浪費(fèi)。幸好,現(xiàn)在各種文本預(yù)處理、文本挖掘技術(shù)已日漸成熟,可以幫助我們從文本中提取出更多有意義的信息。
第一部分:算法軟件基礎(chǔ):介紹不同算法工具的基本使用語(yǔ)法
第一節(jié):語(yǔ)言模型SRILM——用SRILM訓(xùn)練語(yǔ)言模型
第二節(jié): 隱馬爾可夫模型HTK入門——HTK的安裝與使用
第三節(jié): 隱馬爾可夫模型HTK深入——HTK使用詳解
第四節(jié): 隱馬爾可夫模型HTK實(shí)例——簡(jiǎn)單的語(yǔ)音撥號(hào)應(yīng)用程序
第五節(jié): 條件隨機(jī)場(chǎng)CRF++——CRF++的安裝與使用
第六節(jié): 較大熵模型OpenNLP——OpenNLP的安裝與基本功能
第七節(jié): 較大熵模型MALLET——MALLET的安裝與使用
第八節(jié):中文NLP工具包——FudanNLP入門
第九節(jié):中文NLP工具包——StanfordNLP各個(gè)模塊介紹
第二部分:實(shí)驗(yàn)案例操作
第十節(jié):中文NLP基礎(chǔ),分詞處理與詞性標(biāo)注——對(duì)比常用的中文分詞工具的使用
第十一節(jié):命名實(shí)體識(shí)別的實(shí)現(xiàn)
第十二節(jié):文本分類與情感分析——商品評(píng)論傾向性分析
第十三節(jié):文本關(guān)鍵信息提取——關(guān)鍵詞提取與文本摘要
|