學(xué)習(xí)nlp方法大致可以分為二種。
第一種,在實踐中學(xué)習(xí),找一個特定的任務(wù),譬如文本分類、情感分析等。然后以做好任務(wù)為導(dǎo)向的去挖掘和這一個任務(wù)相關(guān)的知識點。由于沒有系統(tǒng)的學(xué)習(xí),肯定會遇到各種各樣的攔路虎問題,當(dāng)遇到不懂的概念時,利用百度/谷歌查閱相關(guān)資料去理解學(xué)習(xí)這個概念,若是概念難懂,就多看不同的人對這些概念的理解,有的時候有些人能深入淺出的講解一些很不錯的資料,個人覺得這種有目的性的實踐學(xué)習(xí)方式學(xué)來的東西更加印象深刻。
這樣也在潛移默化中鍛煉了個人能力(獨立查找資料/文獻是一種極其重要的能力),又能達成某些目的。這樣過了一段時間之后,好像懂很多東西了,但是好像又有很多方面不了解,其實這就是在某個點有點深度了,但是廣度還不夠。
如果此時有大把閑置的時間,就可以去刷刷那些不錯的系統(tǒng)性課程,刷課的時候會發(fā)現(xiàn)很多概念理解起來輕松多了,或者說似曾相識(理解的知識點又得到了復(fù)習(xí)并再次確認自己的理解了的知識點和這些老師講的是否一致)。
第二種,就是一上來就是刷課刷書,把理論什么的都梳理一遍,然后根據(jù)課程把課后作業(yè)都敲一遍并且理解。
這樣系統(tǒng)的學(xué)習(xí)雖然會花上很長的時間,但是也會讓你對知識體系有個全面的認識,之后你再進去某個小點(比如文本分類等)的深入探索,會發(fā)現(xiàn)很多東西都理解學(xué)習(xí)過。
其實你已經(jīng)有了知識的廣度,但是對某個點的知識深度還欠缺,此時就按需深挖即可,當(dāng)然,這個過程肯定也不輕松。
其實這二種學(xué)習(xí)方法我覺得都挺不錯,根據(jù)自身具體情況具體分析,交叉使用,效果應(yīng)該更佳。現(xiàn)在回過頭來看,我之前的學(xué)習(xí)方法更像第一種。
最近想從頭開始學(xué)一些基礎(chǔ)知識,以查漏補缺,所以收集了一大波不錯的資料,作為新年大禮包送給初學(xué)者們,往下看,你想要的都在后面,記得看完免費的贊來一個喲?。?!
編程語言
初學(xué)者推薦python,安裝方法可以選擇純python安裝也可以選擇Anaconda方式安裝。IDE推薦pycharm。
此外,強烈推薦初學(xué)者使用jupyter來學(xué)習(xí)代碼,感覺真的超級贊。
對于新手應(yīng)該如何學(xué)python,個人覺得最重要的是寫,排除那種特別優(yōu)秀的人,相信大部分人都可以歸入到我亦無他,唯手熟爾。因此前期的代碼量是必不可少的,即使在不熟悉的語法情況下對著敲也不失為一種不錯的方法,總而言之,要敲,要實踐,從而達到手熟。
有人會問,那我一開始敲什么呢?初學(xué)者建議把python基本語法敲一遍,可以配合jupyter,這樣可以很方便的敲完一個方法就能實時運行展示效果。然后敲一些基礎(chǔ)的python包的基本用法,譬如最基本的numpy、pandas、matlibplot三劍客。
個人建議一開始沒必要對里面的每個方法都去深究,這樣做會很費時而且可能正反饋也不大,把簡單的基本的用法敲幾遍熟悉,在這個過程中,要慢慢鍛煉一種能力:碰到問題能夠獨立通過百度/谷歌解決。以后會發(fā)現(xiàn)這種能力尤為重要。
自然語言處理初學(xué)者首先要了解熟悉nlp領(lǐng)域的基本術(shù)語、任務(wù)定義以及一些基本算法,前期可以結(jié)合一些不錯的工具實踐,比如經(jīng)典的jieba、hanlp、snownlp、stanfordcorenlp、spaCy、pyltp、nltk、textblob、gensim、scikit-learn等,以及最近的pkuseg、flair等等。通過這些熟悉比如任務(wù)的輸入輸出、評價指標(biāo)以及應(yīng)用場景等等。
書籍推薦
個人覺得從頭到尾的看書對于初學(xué)者來說不太友好,但是必備的工具書放在手邊經(jīng)常查閱是必不可少的。比如周志華老師的西瓜書《機器學(xué)習(xí)》、李航的《統(tǒng)計學(xué)習(xí)方法》、宗成慶的《統(tǒng)計自然語言處理》以及花書《Deep Learning》等等。另外一些比較有意思的書譬如《數(shù)學(xué)之美》也可以讀讀,通俗易懂的語言會讓你對這個領(lǐng)域產(chǎn)生興趣,最后推薦一本培養(yǎng)機器學(xué)習(xí)思維的書《Machine Learning Yearning》。
-
算法
+關(guān)注
關(guān)注
23文章
4612瀏覽量
92909 -
python
+關(guān)注
關(guān)注
56文章
4797瀏覽量
84694 -
nlp
+關(guān)注
關(guān)注
1文章
488瀏覽量
22038
原文標(biāo)題:強推 | 學(xué)習(xí)自然語言處理(NLP)的學(xué)習(xí)方法和資料合集
文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論