如今,自然語(yǔ)言處理應(yīng)用已經(jīng)變得無(wú)處不在。自然語(yǔ)言處理應(yīng)用能夠快速增長(zhǎng),很大程度上要?dú)w功于通過(guò)預(yù)訓(xùn)練模型實(shí)現(xiàn)遷移學(xué)習(xí)的概念。在本文中,我將介紹一些頂級(jí)的預(yù)訓(xùn)練模型,你可以用它們來(lái)開(kāi)始你的自然語(yǔ)言處理之旅,并復(fù)制該領(lǐng)域的最新研究成果。
如今,自然語(yǔ)言處理(Natural Language Processing,NLP)應(yīng)用已經(jīng)變得無(wú)處不在。我似乎總是不經(jīng)意間發(fā)現(xiàn)一些網(wǎng)站和應(yīng)用程序,以這樣的或那樣的形式利用了自然語(yǔ)言處理技術(shù)。簡(jiǎn)而言之,現(xiàn)在就是涉足自然語(yǔ)言處理領(lǐng)域的絕佳時(shí)機(jī)。
自然語(yǔ)言處理應(yīng)用能夠快速增長(zhǎng),很大程度上要?dú)w功于通過(guò)預(yù)訓(xùn)練模型實(shí)現(xiàn)遷移學(xué)習(xí)的概念。在自然語(yǔ)言處理的背景下,遷移學(xué)習(xí)本質(zhì)上是在一個(gè)數(shù)據(jù)集上訓(xùn)練模型,然后對(duì)該模型進(jìn)行調(diào)整,以在不同的數(shù)據(jù)集上執(zhí)行不同的自然語(yǔ)言處理功能。
這一突破,使得每個(gè)人都能夠輕松地完成任務(wù),尤其是那些沒(méi)有時(shí)間、也沒(méi)有資源從頭開(kāi)始構(gòu)建自然語(yǔ)言處理模型的人們。對(duì)于想要學(xué)習(xí)或過(guò)渡到自然語(yǔ)言處理的初學(xué)者來(lái)講,它也堪稱完美。
為什么要使用預(yù)訓(xùn)練模型?
作者已盡其所能設(shè)計(jì)了基準(zhǔn)模型。我們可以在自己的自然語(yǔ)言處理數(shù)據(jù)集上使用預(yù)訓(xùn)練模型,而不是從頭構(gòu)建模型來(lái)解決類似的自然語(yǔ)言處理問(wèn)題。
盡管仍然需要進(jìn)行一些微調(diào),但它已經(jīng)為我們節(jié)省了大量的時(shí)間和計(jì)算資源。
在本文中,我將介紹一些頂級(jí)的預(yù)訓(xùn)練模型,你可以用它們來(lái)開(kāi)始你的自然語(yǔ)言處理之旅,并復(fù)制該領(lǐng)域的最新研究成果。
如果你是自然語(yǔ)言處理的初學(xué)者,我建議你參加我們的熱門課程:《NLP using Python》(《使用 Python 進(jìn)行自然語(yǔ)言處理》):
https://courses.analyticsvidhya.com/courses/natural-language-processing-nlp?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
本文介紹的預(yù)訓(xùn)練自然語(yǔ)言處理模型根據(jù)應(yīng)用,將預(yù)處理模型分為三類:
多用途自然語(yǔ)言處理模型
ULMFiT
Transformer
Google BERT
Transformer-XL
OpenAI GPT-2
詞嵌入
ELMo
Flair
其他預(yù)訓(xùn)練模型
StanfordNLP
多用途自然語(yǔ)言處理模型
多用途模型是自然語(yǔ)言處理領(lǐng)域的熱門話題。這些模型為機(jī)器翻譯、問(wèn)答系統(tǒng)、聊天機(jī)器人、情緒分析等我們感興趣的自然語(yǔ)言處理應(yīng)用提供了動(dòng)力。這些多用途自然語(yǔ)言處理模型的核心組件是語(yǔ)言建模的概念。
簡(jiǎn)單來(lái)說(shuō),語(yǔ)言模型的目的是預(yù)測(cè)序列中的下一個(gè)單詞或字符。我們?cè)谶@里看到每種模型時(shí),都會(huì)理解這一點(diǎn)。
如果你是自然語(yǔ)言處理的愛(ài)好者,那么你將會(huì)喜歡這一節(jié)?,F(xiàn)在,讓我們深入研究這 5 個(gè)最先進(jìn)的多用途自然語(yǔ)言處理模型框架吧。對(duì)于每個(gè)模型,我都提供了研究論文和預(yù)訓(xùn)練模型的鏈接。讓我們繼續(xù)探索吧!
ULMFiT
GitHub 項(xiàng)目地址:
https://github.com/fastai/fastai/tree/master/courses/dl2/imdb_scripts
ULMFiT 由 fast.ai 的 Jeremy Howard 和 DeepMind 的 Sebastian Ruder 提出并設(shè)計(jì)。你可以說(shuō) ULMFiT 是去年啟動(dòng)遷移學(xué)習(xí)派對(duì)的發(fā)行版。
正如我們?cè)诒疚闹兴?,ULMFiT 使用新的自然語(yǔ)言生成技術(shù)實(shí)現(xiàn)了最先進(jìn)的結(jié)果。該方法包括在 Wikitext 103 數(shù)據(jù)集上訓(xùn)練的預(yù)處理語(yǔ)言模型進(jìn)行微調(diào),使其不會(huì)忘記以前所學(xué)的內(nèi)容,從而將其微調(diào)為一個(gè)新的數(shù)據(jù)集。
在文本分類任務(wù)方面,ULMFiT 的性能優(yōu)于許多最先進(jìn)的技術(shù)。我喜歡 ULMFiT 的原因是,它只需要很少的例子就可以產(chǎn)生這些令人印象深刻的結(jié)果。讓像你我這樣的人更容易理解,并在我們的機(jī)器上實(shí)現(xiàn)它!
如果你好奇 ULMFiT 為什么叫這個(gè)名,我會(huì)告訴你,ULMFiT 其實(shí)就是 Universal Language Model Fine-Tuning(通用語(yǔ)言模型微調(diào))的縮寫(xiě)?!癠niversal”(通用)這詞用在這里非常貼切,因?yàn)檫@個(gè)框架幾乎可以應(yīng)用于任何自然語(yǔ)言處理任務(wù)。
有關(guān) ULMFiT 的更多信息,請(qǐng)參閱以下資源:
《Tutorial on Text Classification (NLP) using ULMFiT and fastai Library in Python》(《在 Python 中使用 ULMFiT 和 fastai 庫(kù)的文本分類(自然語(yǔ)言處理)教程》):https://www.analyticsvidhya.com/blog/2018/11/tutorial-text-classification-ulmfit-fastai-library/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
ULMFiT 的預(yù)訓(xùn)練模型:https://www.paperswithcode.com/paper/universal-language-model-fine-tuning-for-text
研究論文:https://arxiv.org/abs/1801.06146
Transformer
GitHub 項(xiàng)目地址:
https://github.com/tensorflow/models/tree/master/official/transformer
Transformer 架構(gòu)是自然語(yǔ)言處理領(lǐng)域最近幾乎所有主要發(fā)展的核心,2017 年由 Google 推出。當(dāng)時(shí),RNN 遞歸神經(jīng)網(wǎng)絡(luò)被用于語(yǔ)言任務(wù),如機(jī)器翻譯和問(wèn)答系統(tǒng)。
這種 Transformer 架構(gòu)的性能優(yōu)于 RNN 和 CNN(卷積神經(jīng)網(wǎng)絡(luò))。而且訓(xùn)練模型所需的計(jì)算資源也大為減少。對(duì)自然語(yǔ)言處理的每個(gè)人來(lái)講,這種結(jié)果是雙贏的局面??纯聪旅娴膶?duì)比:
根據(jù) Google 的說(shuō)法,Transformer“應(yīng)用了一種自注意力(self-attention)機(jī)制,可以直接模擬句子中所有單詞之間的關(guān)系,無(wú)論這些單詞的位置如何”。它使用固定大小的上下文(也就是前面的單詞)來(lái)實(shí)現(xiàn)這一點(diǎn)。是不是覺(jué)得太復(fù)雜了?讓我們舉個(gè)例子來(lái)簡(jiǎn)化這個(gè)。
“She found the shells on the bank of the river.”模型需要理解這里的“bank”是指河岸,而不是金融機(jī)構(gòu)。Transformer 只需一步就能理解這一點(diǎn)。我建議你閱讀下面給出鏈接的完整論文,以了解 Transformer 的工作原理。它會(huì)讓你大吃一驚。
Google 去年發(fā)布了一款 Universal Transformer 的改進(jìn)版。還有一個(gè)更新、更直觀的版本,叫做 Transformer-XL,我們將稍后予以介紹。
有關(guān) Transformer 的更多信息,請(qǐng)參閱以下資源:
Google 的官方博客文章:https://ai.googleblog.com/2017/08/transformer-novel-neural-network.html
Transformer 的預(yù)訓(xùn)練模型:https://www.paperswithcode.com/paper/attention-is-all-you-need
研究論文:https://arxiv.org/abs/1706.03762
Google BERT
GitHub 項(xiàng)目地址:
https://github.com/google-research/bert
自 Google 公布他們的結(jié)果以來(lái),BERT 就一直在掀起波瀾,然后 Google 開(kāi)源了它背后的代碼。我們可以討論這是否標(biāo)志著“自然語(yǔ)言處理領(lǐng)域的新時(shí)代”,但毫無(wú)疑問(wèn)的是,BERT 是一個(gè)非常有用的框架,可以很好地推廣到各種自然語(yǔ)言處理任務(wù)。
BERT,是 Bidirectional Encoder Representations(雙向編碼器表示)的縮寫(xiě),它從單詞的兩邊(左邊和右邊)來(lái)考慮上下文。以前所有的努力方向,都是一次只考慮單詞的一邊,要么是左邊,要么是右邊。這種雙向性有助于模型更好地理解使用單詞的上下文。此外,BERT 的設(shè)計(jì)目標(biāo)是能夠進(jìn)行多任務(wù)學(xué)習(xí),也就是說(shuō),它可以同時(shí)執(zhí)行不同的自然語(yǔ)言處理任務(wù)。
BERT 是第一個(gè)無(wú)監(jiān)督、深度雙向的自然語(yǔ)言處理模型預(yù)訓(xùn)練系統(tǒng)。它只使用純文本語(yǔ)料庫(kù)進(jìn)行訓(xùn)練。
在發(fā)布的時(shí)候,BERT 在 11 個(gè)自然語(yǔ)言處理任務(wù)上取得了最先進(jìn)的結(jié)果。這真是相當(dāng)了不起的成就!你可以在短短幾個(gè)小時(shí)內(nèi)(在單個(gè) GPU 上)使用 BERT 訓(xùn)練自己的自然語(yǔ)言處理模型(例如問(wèn)答系統(tǒng))。
有關(guān) BERT 的更多信息,請(qǐng)參閱以下資源:
Google 官方博客文章:https://ai.googleblog.com/2018/11/open-sourcing-bert-state-of-art-pre.html
BERT 預(yù)訓(xùn)練模型:https://www.paperswithcode.com/paper/bert-pre-training-of-deep-bidirectional#code
研究論文:https://arxiv.org/pdf/1810.04805.pdf
Google Transformer-XL
GitHub 項(xiàng)目地址:
https://github.com/kimiyoung/transformer-xl
從長(zhǎng)遠(yuǎn)來(lái)看,Google 的這一發(fā)行版對(duì)自然語(yǔ)言處理領(lǐng)域來(lái)說(shuō)可能是一個(gè)非常重要的版本。如果你是一名菜鳥(niǎo),這個(gè)概念可能會(huì)變得有點(diǎn)棘手,所以我建議你多讀幾遍來(lái)掌握它。我還會(huì)在這一節(jié)中提供一些資源,幫助你開(kāi)始入門 Transformer-XL。
想象一下,你正在讀一本書(shū),讀到一半的時(shí)候,書(shū)中突然出現(xiàn)了某個(gè)單詞或句子,而這些在這本書(shū)的開(kāi)頭都提到過(guò)。這時(shí)候,你我都能回憶起那些單詞或句子指的是什么意思。但機(jī)器很難建立模擬長(zhǎng)期依賴(long-term dependency)的模型,這是可以理解的。
如上所述,實(shí)現(xiàn)這一點(diǎn)的一種方法是使用 Transformer。但它們是在固定長(zhǎng)度的上下文實(shí)現(xiàn)的。換句話說(shuō),如果使用這種方法,就沒(méi)有多少靈活性而言。
而 Transformer-XL 很好地彌補(bǔ)了這一缺陷。它由 Google AI 團(tuán)隊(duì)開(kāi)發(fā),是一種新型的自然語(yǔ)言處理架構(gòu),可以幫助機(jī)器理解超出固定長(zhǎng)度限制的上下文。Transformer-XL 比普通的 Transformer 要快上 1800 倍。
你可以通過(guò) Google 發(fā)布的兩個(gè)動(dòng)圖來(lái)了解這一區(qū)別:
普通 Transformer
Transformer-XL
正如你現(xiàn)在所預(yù)測(cè)的,Transformer-XL 在各種語(yǔ)言建?;鶞?zhǔn) / 數(shù)據(jù)集上實(shí)現(xiàn)了最新的、最先進(jìn)的結(jié)果。下面是他們網(wǎng)頁(yè)上的一張表,展示了這一點(diǎn):
上面的鏈接和下面提到的 Transformer-XL GitHub 存儲(chǔ)庫(kù)包含 PyTorch 和 TensorFlow 中的代碼。
有關(guān) Transformer-XL 的更多信息,請(qǐng)參閱以下資源:
Google 官方博客文章:https://ai.googleblog.com/2019/01/transformer-xl-unleashing-potential-of.html
Transformer-XL 的預(yù)訓(xùn)練模型:https://www.paperswithcode.com/paper/transformer-xl-attentive-language-models
研究論文:https://arxiv.org/abs/1901.02860
OpenAI GPT-2
GitHub 項(xiàng)目地址:
https://github.com/openai/gpt-2
目前這是一個(gè)頗有爭(zhēng)議的條目。一些人可能會(huì)認(rèn)為 GPT-2 的發(fā)布就是 OpenAI 的營(yíng)銷噱頭。我當(dāng)然理解他們的想法。然而,我還是認(rèn)為,至少嘗試一下 OpenAI 發(fā)布的代碼還是很重要的。
首先,我得為那些不知道我在說(shuō)什么的人們提供一些背景信息。OpenAI 在 2 月份的時(shí)候發(fā)表了一篇博文,聲稱他們已經(jīng)設(shè)計(jì)了一個(gè)自然語(yǔ)言處理模型,表現(xiàn)非常出色,以至于他們擔(dān)心被惡意使用,而沒(méi)有選擇發(fā)布完整版本。這當(dāng)然引起了社區(qū)的關(guān)注。
GPT-2 經(jīng)過(guò)訓(xùn)練后,可以預(yù)測(cè) 40GB 互聯(lián)網(wǎng)文本數(shù)據(jù)的下一個(gè)出現(xiàn)的單詞。這個(gè)框架也是基于 Transformer 的模型,該模型在 800 萬(wàn)個(gè) Web 頁(yè)面的數(shù)據(jù)集進(jìn)行訓(xùn)練。他們?cè)诰W(wǎng)站公布的結(jié)果令人震撼。這個(gè)模型能夠根據(jù)我們輸入的寥寥可數(shù)的句子就編織出一個(gè)完全清晰的故事,請(qǐng)看看下面的這個(gè)例子:
難以置信,對(duì)吧?
為了供研究人員和工程師測(cè)試,開(kāi)發(fā)人員發(fā)布了一個(gè)小得多的 GPT-2 版本。原始模型有 15 億個(gè)參數(shù),而開(kāi)源的示例模型僅有 1.17 億個(gè)。
有關(guān) GPT-2 的更多信息,請(qǐng)參閱以下資源:
OpenAI 官方博客文章:https://openai.com/blog/better-language-models/
GPT-2 的預(yù)訓(xùn)練模型:https://github.com/openai/gpt-2
研究論文:https://d4mucfpksywv.cloudfront.net/better-language-models/language-models.pdf
詞嵌入
我們使用的大多數(shù)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法都無(wú)法直接處理字符串和純文本。這些技術(shù)要求我們必須先將文本數(shù)據(jù)轉(zhuǎn)換為數(shù)字,然后才能執(zhí)行任何任務(wù)(如回歸和分類)。
因此,簡(jiǎn)單來(lái)說(shuō),詞嵌入就是為了將文本塊轉(zhuǎn)換為用于執(zhí)行自然語(yǔ)言處理任務(wù)的數(shù)字。詞嵌入格式通常嘗試使用字典將單詞映射到向量。
你可以在下面的文章中,更深入地理解詞嵌入、它的不同類型以及如何在數(shù)據(jù)集中使用它們。如果你不熟悉這個(gè)概念的話,我認(rèn)為這份指南對(duì)你來(lái)說(shuō)是必讀的:
《An Intuitive Understanding of Word Embeddings: From Count Vectors to Word2Vec》(《直觀理解詞嵌入:從計(jì)數(shù)向量到 Word2Vec》:https://www.analyticsvidhya.com/blog/2017/06/word-embeddings-count-word2veec/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
在這一節(jié)中,我們將介紹自然語(yǔ)言處理領(lǐng)域中兩個(gè)最先進(jìn)的詞嵌入。我還提供了教程的鏈接,這樣你就可以對(duì)每個(gè)主題有實(shí)際的理解。
ELMo
GitHub 項(xiàng)目地址:
https://github.com/allenai/allennlp/blob/master/tutorials/how_to/elmo.md
ELMo(是 Embedding from Language Models 的縮寫(xiě))在構(gòu)建自然語(yǔ)言處理模的上下文非常有用。
ELMo 是一種用向量和嵌入表示單詞的新方法。這些 ELMo 詞嵌入有助于我們?cè)诙鄠€(gè)自然語(yǔ)言處理任務(wù)上獲得最先進(jìn)的結(jié)果,如下所示:
讓我們花點(diǎn)時(shí)間來(lái)理解 ELMo 的工作原理?;貞浺幌挛覀冎坝懻撨^(guò)的雙向語(yǔ)言模型。從本文中得到的提示:“ELMo 詞向量是在雙層雙向語(yǔ)言模型(bidirectional language model,biLM)智商計(jì)算的。這個(gè) biLM 模型有兩層堆疊在一起。每層有兩個(gè)通道:前向通道和后向通道。
ELMo 詞向量表示(word representations)考慮用于計(jì)算詞嵌入的完整輸入語(yǔ)句。因此“read”這個(gè)詞在不同的上下文中有不同的 ELMo 向量。這點(diǎn)與舊詞嵌入截然不同,對(duì)舊詞嵌入而言,無(wú)論單詞在什么上下文中使用,這個(gè)單詞都會(huì)分配到相同的向量。
有關(guān) ELMo 更多的信息,請(qǐng)參閱以下資源:
《Step-by-Step NLP Guide to Learn ELMo for Extracting Features from Text》(《自然語(yǔ)言處理入門指南:學(xué)習(xí) ELMo 從文本中提取特征》https://www.analyticsvidhya.com/blog/2019/03/learn-to-use-elmo-to-extract-features-from-text/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
用于預(yù)訓(xùn)練模型的 GitHub 存儲(chǔ)庫(kù):https://github.com/allenai/allennlp/blob/master/tutorials/how_to/elmo.md
研究論文:https://arxiv.org/pdf/1802.05365.pdf
Flair
GitHub 項(xiàng)目地址:https://github.com/zalandoresearch/flair
Flair 并不完全是詞嵌入,而是詞嵌入的組合。我們可以稱 Flair 更多的是一個(gè)自然語(yǔ)言處理程序庫(kù),它結(jié)合了 GloVe、BERT、EMLo 等嵌入。Zalando Research 的優(yōu)秀人員開(kāi)發(fā)并開(kāi)源了 Flair。
該團(tuán)隊(duì)已經(jīng)為以下自然語(yǔ)言處理任務(wù)發(fā)布了幾個(gè)預(yù)訓(xùn)練模型:
Name-Entity Recognition (NER,名稱 - 實(shí)體識(shí)別)
Parts-of-Speech Tagging (PoS,詞性標(biāo)注)
文本分類
訓(xùn)練自定義模型
還不確定?那么,看下面這張比較表就會(huì)讓你明白:
“Flair Embedding”是封裝在 Flair 庫(kù)中的簽名嵌入。它由上下文字符串嵌入提供支持。你應(yīng)該自詡閱讀這篇文章《Introduction to Flair for NLP: A Simple yet Powerful State-of-the-Art NLP Library》(《Flair 簡(jiǎn)介:簡(jiǎn)單而強(qiáng)大的,最先進(jìn)的自然語(yǔ)言處理庫(kù)》)來(lái)了解支持 Flair 的核心組件:
https://www.analyticsvidhya.com/blog/2019/02/flair-nlp-library-python/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
我特別喜歡 Flair 的地方就是它能夠支持多種語(yǔ)言。如此多的自然語(yǔ)言處理版本都只做英語(yǔ)方面的任務(wù)。如果自然語(yǔ)言處理想在全球范圍內(nèi)獲得吸引力的話,我們就必須超越這一點(diǎn)!
有關(guān) Flair 更多的信息,請(qǐng)參閱以下資源:
《Introduction to Flair for NLP: A Simple yet Powerful State-of-the-Art NLP Library》(《Flair 簡(jiǎn)介:簡(jiǎn)單而強(qiáng)大的,最先進(jìn)的自然語(yǔ)言處理庫(kù)》):https://www.analyticsvidhya.com/blog/2019/02/flair-nlp-library-python/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
Flair 的預(yù)訓(xùn)練模型:https://github.com/zalandoresearch/flair
StanfordNLP
GitHub 項(xiàng)目地址:https://github.com/stanfordnlp/stanfordnlp
說(shuō)到將自然語(yǔ)言處理擴(kuò)展到英語(yǔ)之外,現(xiàn)在有一個(gè)已設(shè)置基準(zhǔn)的庫(kù)了。據(jù)作者聲稱,StandfordNLP 支持超過(guò) 53 種語(yǔ)言,這當(dāng)然引起了我們的關(guān)注。
我們的團(tuán)隊(duì)是第一批使用該庫(kù)并在真實(shí)數(shù)據(jù)集上發(fā)布結(jié)果的團(tuán)隊(duì)之一。我們研究了一下,發(fā)現(xiàn) StandfordNLP 確實(shí)為非英語(yǔ)語(yǔ)言中應(yīng)用自然語(yǔ)言處理技術(shù)提供了很多可能性,比如印地語(yǔ)、漢語(yǔ)和日語(yǔ)。
StandfordNLP 是一個(gè)經(jīng)過(guò)預(yù)訓(xùn)練的、最先進(jìn)的自然語(yǔ)言處理模型的集合。 這些模型并不只是僅在實(shí)驗(yàn)室內(nèi)測(cè)試——在 2017 年、2018 年的 CoNLL 競(jìng)賽作者就曾使用 StandfordNLP 參賽。在 StandfordNLP 中打包的所有預(yù)訓(xùn)練自然語(yǔ)言處理模型都是基于 PyTorch 構(gòu)建的,并且可以在你自己的注釋數(shù)據(jù)上進(jìn)行訓(xùn)練和評(píng)估。
我們認(rèn)為,你應(yīng)該考慮 StandfordNLP 的兩個(gè)主要原因是:
用于執(zhí)行文本分析的完整神經(jīng)網(wǎng)絡(luò)管道,包括:
標(biāo)記化(Tokenization)
多詞標(biāo)記擴(kuò)展(Multi-word token (MWT) expansion)
詞性還原(Lemmatization)
詞性和詞形特征標(biāo)記(Parts-of-speech (POS) and morphological feature tagging)
依存句法分析(Dependency Parsing)
一個(gè)穩(wěn)定的官方維護(hù)的 CoreNLP Python 接口
有關(guān) StandfordNLP 的更多信息,請(qǐng)參閱以下資源:
《Introduction to StanfordNLP: An Incredible State-of-the-Art NLP Library for 53 Languages (with Python code)》(《StandfordNLP 簡(jiǎn)介:令人難以置信的、最先進(jìn)的自然語(yǔ)言處理庫(kù),支持 53 種語(yǔ)言(使用 Python 實(shí)現(xiàn))》):https://www.analyticsvidhya.com/blog/2019/02/stanfordnlp-nlp-library-python/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
StandfordNLP 預(yù)訓(xùn)練模型:https://github.com/stanfordnlp/stanfordnlp
尾 注
本文絕不是預(yù)訓(xùn)練自然語(yǔ)言處理模型的詳盡清單。還有更多可用的模型,你可以在這個(gè)網(wǎng)站上查看其中的一些:
https://paperswithcode.com
下面是學(xué)習(xí)自然語(yǔ)言處理的一些有用資源:
《Natural Language Processing (NLP) Using Python》(《課程:使用 Python 進(jìn)行自然語(yǔ)言處理(NLP)》):https://courses.analyticsvidhya.com/courses/natural-language-processing-nlp?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
Certified Program: NLP for Beginners(認(rèn)證項(xiàng)目:NLP 初學(xué)者):https://courses.analyticsvidhya.com/bundles/nlp-combo?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
關(guān)于自然語(yǔ)言處理的文章集:https://www.analyticsvidhya.com/blog/category/nlp/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
-
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1208瀏覽量
24713 -
自然語(yǔ)言處理
+關(guān)注
關(guān)注
1文章
618瀏覽量
13562 -
遷移學(xué)習(xí)
+關(guān)注
關(guān)注
0文章
74瀏覽量
5563
原文標(biāo)題:NLP領(lǐng)域最優(yōu)秀的8個(gè)預(yù)訓(xùn)練模型(附開(kāi)源地址)
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論