學(xué)習(xí)nlp方法大致可以分為二種。
第一種,在實(shí)踐中學(xué)習(xí),找一個(gè)特定的任務(wù),譬如文本分類、情感分析等。然后以做好任務(wù)為導(dǎo)向的去挖掘和這一個(gè)任務(wù)相關(guān)的知識(shí)點(diǎn)。由于沒(méi)有系統(tǒng)的學(xué)習(xí),肯定會(huì)遇到各種各樣的攔路虎問(wèn)題,當(dāng)遇到不懂的概念時(shí),利用百度/谷歌查閱相關(guān)資料去理解學(xué)習(xí)這個(gè)概念,若是概念難懂,就多看不同的人對(duì)這些概念的理解,有的時(shí)候有些人能深入淺出的講解一些很不錯(cuò)的資料,個(gè)人覺(jué)得這種有目的性的實(shí)踐學(xué)習(xí)方式學(xué)來(lái)的東西更加印象深刻。
這樣也在潛移默化中鍛煉了個(gè)人能力(獨(dú)立查找資料/文獻(xiàn)是一種極其重要的能力),又能達(dá)成某些目的。這樣過(guò)了一段時(shí)間之后,好像懂很多東西了,但是好像又有很多方面不了解,其實(shí)這就是在某個(gè)點(diǎn)有點(diǎn)深度了,但是廣度還不夠。
如果此時(shí)有大把閑置的時(shí)間,就可以去刷刷那些不錯(cuò)的系統(tǒng)性課程,刷課的時(shí)候會(huì)發(fā)現(xiàn)很多概念理解起來(lái)輕松多了,或者說(shuō)似曾相識(shí)(理解的知識(shí)點(diǎn)又得到了復(fù)習(xí)并再次確認(rèn)自己的理解了的知識(shí)點(diǎn)和這些老師講的是否一致)。
第二種,就是一上來(lái)就是刷課刷書,把理論什么的都梳理一遍,然后根據(jù)課程把課后作業(yè)都敲一遍并且理解。
這樣系統(tǒng)的學(xué)習(xí)雖然會(huì)花上很長(zhǎng)的時(shí)間,但是也會(huì)讓你對(duì)知識(shí)體系有個(gè)全面的認(rèn)識(shí),之后你再進(jìn)去某個(gè)小點(diǎn)(比如文本分類等)的深入探索,會(huì)發(fā)現(xiàn)很多東西都理解學(xué)習(xí)過(guò)。
其實(shí)你已經(jīng)有了知識(shí)的廣度,但是對(duì)某個(gè)點(diǎn)的知識(shí)深度還欠缺,此時(shí)就按需深挖即可,當(dāng)然,這個(gè)過(guò)程肯定也不輕松。
其實(shí)這二種學(xué)習(xí)方法我覺(jué)得都挺不錯(cuò),根據(jù)自身具體情況具體分析,交叉使用,效果應(yīng)該更佳?,F(xiàn)在回過(guò)頭來(lái)看,我之前的學(xué)習(xí)方法更像第一種。
最近想從頭開(kāi)始學(xué)一些基礎(chǔ)知識(shí),以查漏補(bǔ)缺,所以收集了一大波不錯(cuò)的資料,作為新年大禮包送給初學(xué)者們,往下看,你想要的都在后面,記得看完免費(fèi)的贊來(lái)一個(gè)喲!?。?/p>
編程語(yǔ)言
初學(xué)者推薦python,安裝方法可以選擇純python安裝也可以選擇Anaconda方式安裝。IDE推薦pycharm。
此外,強(qiáng)烈推薦初學(xué)者使用jupyter來(lái)學(xué)習(xí)代碼,感覺(jué)真的超級(jí)贊。
對(duì)于新手應(yīng)該如何學(xué)python,個(gè)人覺(jué)得最重要的是寫,排除那種特別優(yōu)秀的人,相信大部分人都可以歸入到我亦無(wú)他,唯手熟爾。因此前期的代碼量是必不可少的,即使在不熟悉的語(yǔ)法情況下對(duì)著敲也不失為一種不錯(cuò)的方法,總而言之,要敲,要實(shí)踐,從而達(dá)到手熟。
有人會(huì)問(wèn),那我一開(kāi)始敲什么呢?初學(xué)者建議把python基本語(yǔ)法敲一遍,可以配合jupyter,這樣可以很方便的敲完一個(gè)方法就能實(shí)時(shí)運(yùn)行展示效果。然后敲一些基礎(chǔ)的python包的基本用法,譬如最基本的numpy、pandas、matlibplot三劍客。
個(gè)人建議一開(kāi)始沒(méi)必要對(duì)里面的每個(gè)方法都去深究,這樣做會(huì)很費(fèi)時(shí)而且可能正反饋也不大,把簡(jiǎn)單的基本的用法敲幾遍熟悉,在這個(gè)過(guò)程中,要慢慢鍛煉一種能力:碰到問(wèn)題能夠獨(dú)立通過(guò)百度/谷歌解決。以后會(huì)發(fā)現(xiàn)這種能力尤為重要。
自然語(yǔ)言處理初學(xué)者首先要了解熟悉nlp領(lǐng)域的基本術(shù)語(yǔ)、任務(wù)定義以及一些基本算法,前期可以結(jié)合一些不錯(cuò)的工具實(shí)踐,比如經(jīng)典的jieba、hanlp、snownlp、stanfordcorenlp、spaCy、pyltp、nltk、textblob、gensim、scikit-learn等,以及最近的pkuseg、flair等等。通過(guò)這些熟悉比如任務(wù)的輸入輸出、評(píng)價(jià)指標(biāo)以及應(yīng)用場(chǎng)景等等。
書籍推薦
個(gè)人覺(jué)得從頭到尾的看書對(duì)于初學(xué)者來(lái)說(shuō)不太友好,但是必備的工具書放在手邊經(jīng)常查閱是必不可少的。比如周志華老師的西瓜書《機(jī)器學(xué)習(xí)》、李航的《統(tǒng)計(jì)學(xué)習(xí)方法》、宗成慶的《統(tǒng)計(jì)自然語(yǔ)言處理》以及花書《Deep Learning》等等。另外一些比較有意思的書譬如《數(shù)學(xué)之美》也可以讀讀,通俗易懂的語(yǔ)言會(huì)讓你對(duì)這個(gè)領(lǐng)域產(chǎn)生興趣,最后推薦一本培養(yǎng)機(jī)器學(xué)習(xí)思維的書《Machine Learning Yearning》。
-
算法
+關(guān)注
關(guān)注
23文章
4701瀏覽量
94848 -
python
+關(guān)注
關(guān)注
56文章
4825瀏覽量
86271 -
nlp
+關(guān)注
關(guān)注
1文章
490瀏覽量
22512
原文標(biāo)題:強(qiáng)推 | 學(xué)習(xí)自然語(yǔ)言處理(NLP)的學(xué)習(xí)方法和資料合集
文章出處:【微信號(hào):AI_shequ,微信公眾號(hào):人工智能愛(ài)好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論