0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NLP的工作原理是什么 有哪些用例

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-06-24 15:19 ? 次閱讀

自然語言處理是一項(xiàng)利用計(jì)算機(jī)和軟件獲取人類語言(書面或口語)含義的技術(shù)。

什么是自然語言處理?

自然語言處理(NLP)使用 AI 處理和分析文本或語音數(shù)據(jù),以便理解和解釋內(nèi)容、對內(nèi)容進(jìn)行分類和/或從內(nèi)容中獲得見解。

NLP 中包含自然語言生成(NLG),它會使用計(jì)算機(jī)創(chuàng)建人類語言文本。此外,自然語言理解(NLU)會錄入文本,理解上下文和意圖,然后生成智能回復(fù)。

垃圾郵件過濾程序、拼寫檢查程序、語法檢查程序、自動更正、語言翻譯、情感分析、語義搜索等都屬于 NLP 。基于 Transformer 架構(gòu)的新深度學(xué)習(xí)(DL)方法的出現(xiàn),為 NLP 技術(shù)的性能和功能帶來了革命性的變化?,F(xiàn)在,先進(jìn)的 NLP 模型已成為現(xiàn)代搜索引擎、語音助手和聊天機(jī)器人的核心。這些應(yīng)用程序在自動處理日常訂單、路由查詢和回答常見問題時也變得日益純熟。

為什么選擇 NLP?

NLP 的應(yīng)用已相當(dāng)廣泛,并有望以幾何級數(shù)增長。據(jù)一項(xiàng)研究調(diào)查估計(jì),在全球市場中,與自然語言處理相關(guān)的產(chǎn)品和服務(wù)將在 2025 年增長到 430 億美元;而 2017 年時,這一數(shù)字為 30 億美元。這一驚人的 14 倍增長也證明了自然語言處理解決方案的廣泛應(yīng)用。

進(jìn)一步推動這一增長的是,一個組織內(nèi)僅有 15% 的數(shù)據(jù)存儲在企業(yè)數(shù)據(jù)庫中這一事實(shí)。這些數(shù)據(jù)包括文本、電子郵件、會議筆記、電話轉(zhuǎn)錄等。自然語言處理有望釋放隱藏在所有這些數(shù)據(jù)中的業(yè)務(wù)價值,使其像存儲數(shù)據(jù)一樣對業(yè)務(wù)決策者發(fā)揮作用。

NLP 的工作原理是什么?

機(jī)器學(xué)習(xí)(ML)是推動當(dāng)今大多數(shù)自然語言處理解決方案的引擎,并將推動它們進(jìn)一步發(fā)展。這些系統(tǒng)使用 NLP 算法來理解詞語的使用方式。它們從書籍、短語和慣用語中提取所有信息后,通過 NLP 識別詞語和短語之間的模式和關(guān)系,來“學(xué)習(xí)”理解人類語言。

通常,在 NLP 應(yīng)用中,會使用詞嵌入等技術(shù)將輸入文本轉(zhuǎn)換為詞向量(一個詞的數(shù)學(xué)表征)。借助此技術(shù),在將句子中的每個詞輸入到深度學(xué)習(xí)模型(例如RNN、LSTM 或 Transformer)前將其翻譯成一組數(shù)字,以便理解上下文。神經(jīng)網(wǎng)絡(luò)在進(jìn)行自我訓(xùn)練時,這些數(shù)字會隨著時間的推移而發(fā)生變化,為每個詞編碼語義和上下文信息等獨(dú)特屬性。這些 DL 模型為特定語言任務(wù)(例如下一詞語預(yù)測和文本摘要)提供適當(dāng)?shù)妮敵觯@些任務(wù)用于生成輸出序列。

但是,詞嵌入等文本編碼機(jī)制可能會為捕獲細(xì)微差別帶來挑戰(zhàn)。例如,bass fish 和 bass player 具有相同的表征。在對長段落進(jìn)行編碼時,它們還可能在結(jié)尾丟失掉文章開頭獲取的上下文。BERT(Bidirectional Encoder Representations from Transformers)是深度雙向的,能夠比其他文本編碼機(jī)制更好地理解和保留上下文。訓(xùn)練語言模型時,遭遇的一個關(guān)鍵挑戰(zhàn)是缺少標(biāo)記數(shù)據(jù)。BERT 在無監(jiān)督任務(wù)上接受訓(xùn)練,通常使用書籍語料庫、英語維基百科等的非結(jié)構(gòu)化數(shù)據(jù)集。

GPU:加速 NLP

讓計(jì)算機(jī)理解人類語言及所有細(xì)微差別,并做出適當(dāng)?shù)姆磻?yīng),這是 AI 研究人員長期以來的追求。但是,在采用加速計(jì)算的現(xiàn)代 AI 技術(shù)出現(xiàn)之前,構(gòu)建具有真正自然語言處理(NLP)功能的系統(tǒng)是無法實(shí)現(xiàn)的。

一個由數(shù)百個核心組成的 GPU,可以并行處理數(shù)千個線程。GPU 已成為訓(xùn)練深度學(xué)習(xí)模型和執(zhí)行推理的首選平臺,因?yàn)樗鼈兊男阅鼙燃?CPU 平臺高 10 倍。

自然語言處理中近年來不斷取得的進(jìn)步和突破是驅(qū)動 NLP 增長的一個因素,其中重要的是部署 GPU 來處理日漸龐大且高度復(fù)雜的語言模型。

像 BERT 這樣基于 NLP Transformer 的深度學(xué)習(xí)模型不需要按順序處理連續(xù)數(shù)據(jù),與 RNN 相比,可以在 GPU 上實(shí)現(xiàn)更多的并行化,并減少訓(xùn)練時間。BERT 使用無監(jiān)督式學(xué)習(xí)方法的能力、使用預(yù)訓(xùn)練模型進(jìn)行遷移學(xué)習(xí)的能力,以及使用 GPU 進(jìn)行加速的能力,均使其在行業(yè)中得到廣泛應(yīng)用。

對支持 GPU 的模型經(jīng)過快速訓(xùn)練和優(yōu)化后,語音輔助應(yīng)用程序中的響應(yīng)時間從數(shù)十秒縮短到幾毫秒。這使得此類計(jì)算機(jī)輔助交互盡可能地接近“自然”。

NLP 用例

| 初創(chuàng)公司

自然語言處理應(yīng)用在過去十年呈爆炸式增長,因?yàn)橛?GPU 驅(qū)動的遞歸神經(jīng)網(wǎng)絡(luò)的改進(jìn)提供了性能更好的人工智能。這使得初創(chuàng)公司得以提供語音服務(wù)語言教師聊天機(jī)器人等服務(wù)。

| 醫(yī)療健康

醫(yī)療健康面臨的困難之一是難以獲得。打醫(yī)生辦公室電話并一直等待的情況十分常見,與索賠代表聯(lián)系可能同樣困難。通過實(shí)施 NLP 來訓(xùn)練聊天機(jī)器人是醫(yī)療健康行業(yè)的一項(xiàng)新興技術(shù),可以解決醫(yī)療專業(yè)人員的短缺問題,并開創(chuàng)與患者的溝通渠道。

NLP 的另一個重要的醫(yī)療健康應(yīng)用程序是生物醫(yī)學(xué)文本挖掘(通常稱為 BioNLP)。鑒于生物文獻(xiàn)數(shù)量眾多,以及生物醫(yī)學(xué)出版速度不斷提高,自然語言處理是一個關(guān)鍵的工具,可以在已發(fā)表的研究中提取信息,推動生物醫(yī)學(xué)領(lǐng)域的知識進(jìn)步。這非常有助于藥物研發(fā)和疾病診斷。

| 金融服務(wù)

NLP 是為金融服務(wù)公司構(gòu)建更好的聊天機(jī)器人和 AI 助理的關(guān)鍵組成部分。在眾多用于基于 NLP 的應(yīng)用程序的語言模型中,BERT 已成為機(jī)器學(xué)習(xí)領(lǐng)域 NLP 的領(lǐng)軍者及語言模型。借助 AI ,NVIDIA 近期打破了 BERT 訓(xùn)練速度的記錄,有助于釋放未來幾年內(nèi)在線提供的數(shù)十億預(yù)期對話式 AI 服務(wù)的潛力,使其達(dá)到人類水平的理解能力。例如,銀行可以使用 NLP 來評估信用記錄很少或沒有信用記錄的客戶信譽(yù)。

| 零售

除了醫(yī)療健康外,聊天機(jī)器人技術(shù)還常用于零售應(yīng)用程序,能夠準(zhǔn)確分析客戶查詢,并生成回復(fù)或建議。這可簡化客戶流程,并提高商店運(yùn)營效率。NLP 還用于文本挖掘客戶反饋和情感分析。

加速 AI 和 NLP 的 NVIDIA GPU

借助 NVIDIA GPU 和CUDA-X AI庫,可快速訓(xùn)練和優(yōu)化大量的先進(jìn)語言模型,從而在幾毫秒或幾千分之一秒內(nèi)運(yùn)行推理。這是一項(xiàng)重大進(jìn)步,可以結(jié)束快速 AI 模型與大型復(fù)雜 AI 模型之間的權(quán)衡。

NVIDIA 的 AI 平臺率先將BERT的訓(xùn)練時間控制在一小時之內(nèi),并在 2 毫秒多一點(diǎn)的時間內(nèi)完成 AI 推理。在與復(fù)雜語言模型協(xié)作時,NVIDIA GPU 的并行處理能力和Tensor Core架構(gòu)可實(shí)現(xiàn)更高的吞吐量和可擴(kuò)展性,從而為 BERT 的訓(xùn)練和推理提供優(yōu)異的性能。借助這種突破性的性能水平,開發(fā)者能夠?yàn)榇笮蛻?yīng)用程序應(yīng)用先進(jìn)的語言理解技術(shù),供全球數(shù)億消費(fèi)者使用。

早期采用 NVIDIA 性能提升技術(shù)的公司包括 Microsoft 以及全球一些最具創(chuàng)新性的初創(chuàng)公司。這些組織借助 NVIDIA 平臺為客戶開發(fā)高度直觀、響應(yīng)即時且基于語言的服務(wù)。

原文標(biāo)題:NVIDIA 大講堂 | 什么是自然語言處理?

文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5063

    瀏覽量

    103436
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    619

    瀏覽量

    13603
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    489

    瀏覽量

    22065

原文標(biāo)題:NVIDIA 大講堂 | 什么是自然語言處理?

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AIGC是什么及其應(yīng)用 AIGC的定義和工作原理

    的發(fā)展得益于深度學(xué)習(xí)的進(jìn)步,特別是神經(jīng)網(wǎng)絡(luò)模型,如生成對抗網(wǎng)絡(luò)(GANs)、變分自編碼器(VAEs)和自回歸模型等。 AIGC的工作原理 AIGC的工作原理可以分為以下幾個步驟: 數(shù)據(jù)收集與預(yù)處理 :首先,需要收集大量的數(shù)據(jù),這些數(shù)據(jù)可以是文本、圖像、音頻
    的頭像 發(fā)表于 11-22 16:00 ?1038次閱讀

    cmos電流反饋運(yùn)放的工作原理是什么?

    這是一個cmos電流反饋型運(yùn)放的原理圖 誰能詳細(xì)的解釋一下它的工作原理 具體每個mos什么 如何實(shí)現(xiàn)放大的 謝謝了
    發(fā)表于 09-23 07:40

    邏輯和翻譯優(yōu)化資產(chǎn)跟蹤器

    電子發(fā)燒友網(wǎng)站提供《邏輯和翻譯優(yōu)化資產(chǎn)跟蹤器.pdf》資料免費(fèi)下載
    發(fā)表于 09-21 11:24 ?0次下載
    <b class='flag-5'>用</b>邏輯和翻譯<b class='flag-5'>用</b><b class='flag-5'>例</b>優(yōu)化資產(chǎn)跟蹤器

    刷電機(jī)工作原理是什么

    刷電機(jī),也稱為直流電機(jī)(DC Motor),是一種將直流電能轉(zhuǎn)換為機(jī)械能的裝置。它由定子(靜止部分)和轉(zhuǎn)子(旋轉(zhuǎn)部分)組成,通過磁場的相互作用產(chǎn)生轉(zhuǎn)矩,從而實(shí)現(xiàn)旋轉(zhuǎn)運(yùn)動。刷電機(jī)的工作原理可以概括
    的頭像 發(fā)表于 09-03 10:48 ?889次閱讀

    可視門鈴設(shè)計(jì)優(yōu)化和通用邏輯

    電子發(fā)燒友網(wǎng)站提供《可視門鈴設(shè)計(jì)優(yōu)化和通用邏輯.pdf》資料免費(fèi)下載
    發(fā)表于 08-27 09:34 ?0次下載
    可視門鈴設(shè)計(jì)優(yōu)化和通用邏輯<b class='flag-5'>用</b><b class='flag-5'>例</b>

    行程開關(guān)和接近開關(guān)工作原理何不同

    行程開關(guān)和接近開關(guān)是兩種常見的工業(yè)自動化控制元件,它們在機(jī)械制造、自動化設(shè)備、機(jī)器人等領(lǐng)域有著廣泛的應(yīng)用。雖然它們都用于檢測物體的位置或狀態(tài),但它們的工作原理和應(yīng)用場景很大的不同。 一、行程開關(guān)
    的頭像 發(fā)表于 08-26 15:52 ?773次閱讀

    nlp神經(jīng)語言和NLP自然語言的區(qū)別和聯(lián)系

    神經(jīng)語言(Neuro-Linguistic Programming,NLP) 神經(jīng)語言是一種心理學(xué)方法,它研究人類思維、語言和行為之間的關(guān)系。NLP的核心理念是,我們可以通過改變我們的思維方式和語言
    的頭像 發(fā)表于 07-09 10:35 ?818次閱讀

    nlp自然語言處理模型哪些

    自然語言處理(Natural Language Processing,NLP)是計(jì)算機(jī)科學(xué)和人工智能領(lǐng)域的一個重要分支,旨在使計(jì)算機(jī)能夠理解、解釋和生成人類語言。以下是對NLP領(lǐng)域一些模型的介紹
    的頭像 發(fā)表于 07-05 09:57 ?820次閱讀

    nlp自然語言處理的應(yīng)用哪些

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領(lǐng)域的一個分支,它致力于使計(jì)算機(jī)能夠理解和生成自然語言。隨著技術(shù)的發(fā)展,NLP已經(jīng)在許多領(lǐng)域得到了廣泛
    的頭像 發(fā)表于 07-05 09:55 ?2734次閱讀

    NLP模型中RNN與CNN的選擇

    NLP中的應(yīng)用場景、工作原理、優(yōu)缺點(diǎn),以及在選擇時應(yīng)考慮的關(guān)鍵因素,以期為讀者提供一個全面而深入的理解。
    的頭像 發(fā)表于 07-03 15:59 ?592次閱讀

    什么是LLM?LLM的工作原理和結(jié)構(gòu)

    生成、機(jī)器翻譯、智能問答等多個領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力。本文將從LLM的定義、發(fā)展歷程、工作原理、結(jié)構(gòu)以及未來趨勢等方面進(jìn)行深入解讀,以期為讀者提供一個全面而清晰的認(rèn)識。
    的頭像 發(fā)表于 07-02 11:45 ?8351次閱讀

    表的工作原理

    表的工作原理主要基于一個靈敏的磁電式直流電流表(也稱為微安表)作為表頭。當(dāng)微小電流通過表頭時,它會產(chǎn)生電流指示。但是,由于表頭本身不能直接通過大電流,因此需要通過在表頭上并聯(lián)或串聯(lián)一些電阻來進(jìn)行分流或降壓,以便能夠測量電路中的電流、電壓和電阻。
    的頭像 發(fā)表于 05-07 16:50 ?2845次閱讀

    霍爾開關(guān)的工作原理及應(yīng)用

    霍爾開關(guān)的工作原理及應(yīng)用
    的頭像 發(fā)表于 04-09 10:29 ?3549次閱讀
    霍爾開關(guān)的<b class='flag-5'>工作原理</b>及應(yīng)用

    蜂鳴器的工作原理 蜂鳴器正負(fù)極嗎?

    蜂鳴器的工作原理 蜂鳴器正負(fù)極嗎? 蜂鳴器是一種能夠發(fā)出連續(xù)鳴叫聲的電子元件,通常用于警報系統(tǒng)、電子設(shè)備等場合。蜂鳴器具有很多種類,比如壓電式蜂鳴器和電磁式蜂鳴器。本文將以壓電式蜂鳴器為,詳細(xì)
    的頭像 發(fā)表于 02-19 14:08 ?3909次閱讀

    電流探頭的基本工作原理 電流探頭哪些分類?

    電流探頭的基本工作原理 電流探頭哪些分類? 電流探頭是一種用于測量電流的電子設(shè)備。它能夠?qū)㈦娏鬓D(zhuǎn)換為可測量的電壓信號,從而允許我們對電流進(jìn)行測量和分析。 一、基本工作原理 電流探頭的基本工作
    的頭像 發(fā)表于 01-31 10:07 ?1838次閱讀