0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“躲避”or“鴨子”:看深度學(xué)習(xí)如何解釋多義詞

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 作者:工程師曾 ? 2018-09-22 15:02 ? 次閱讀

脫離上下文時(shí),每個(gè)英文單詞都有多重含義。例如,“bank”可以指銀行或河岸;“Fair”可以指展覽會(huì),也可以指對(duì)展覽會(huì)的評(píng)價(jià);“Duck”可以是躲避傷害的動(dòng)作,也可以指鴨子。

對(duì)于人類來(lái)說(shuō)搞清楚一個(gè)單詞在某場(chǎng)景中適用的含義是非常簡(jiǎn)單的。但是,對(duì)于自然語(yǔ)言處理模型就是另一回事了。

近些年已經(jīng)出現(xiàn)很多用于解析文本的AI工具,但是當(dāng)涉及到多重含義的單詞時(shí),這些工具往往會(huì)陷入困境。來(lái)自艾倫人工智能研究所(Allen Institute for Artificial Intelligence)和華盛頓大學(xué)的研究人員正在努力解決這一難題,他們使用了可以根據(jù)上下文來(lái)確定英文單詞含義的神經(jīng)網(wǎng)絡(luò)。

向前和向后閱讀

通常,NLP模型通過詞向量(在每個(gè)單詞中附加語(yǔ)言含義和單詞語(yǔ)法的基礎(chǔ)元素)中的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行訓(xùn)練。此算法基于假設(shè)每個(gè)單詞只有一種向量表示,但實(shí)際上英文單詞并非如此。

研究人員利用名為“ELMo”的神經(jīng)系統(tǒng)打破了這一假設(shè),此神經(jīng)系統(tǒng)可以為每個(gè)單詞創(chuàng)造出無(wú)限數(shù)量的向量。

“‘ELMo’是‘Embeddings from Language Models’的縮寫,而不是毛茸茸的紅色芝麻街角色”,論文“Deep contextualized word representations”的第一作者M(jìn)atthew Peters解釋道。

ELMo喜歡閱讀:這不是美國(guó)幼兒教育電視節(jié)目《芝麻街》中的Elmo,而是使用雙向語(yǔ)言模型的神經(jīng)系統(tǒng)ELMo。

常規(guī)語(yǔ)言模型嘗試預(yù)測(cè)句子中即將出現(xiàn)的下一個(gè)單詞。如果片段是“The people sat down on the …,”,那么算法將預(yù)測(cè)出“bench”或“grass”之類的單詞。為了給單詞附加所有潛在含義的詞向量,這個(gè)團(tuán)隊(duì)使用了雙向語(yǔ)言模型。

使用雙向模型意味著,該模型可以通過一個(gè)二次的回顧性算法,獲取句子的結(jié)尾并嘗試預(yù)測(cè)出現(xiàn)在句子結(jié)尾前邊的單詞。當(dāng)模型嘗試分析的單詞出現(xiàn)在句首,并且相關(guān)上下文隨即出現(xiàn)時(shí),這會(huì)非常有用。

“就像‘He lies to his teacher’與‘He lies on the sofa’這種情況”,Peters說(shuō)道。

為測(cè)試ELMo的技能,該團(tuán)隊(duì)利用六種不同的NLP任務(wù)(包括情緒分析和問答等)對(duì)算法進(jìn)行測(cè)試。與之前使用相同訓(xùn)練數(shù)據(jù)的方法相比,ELMo每次都會(huì)得到更新、更出色的結(jié)果,在某些情況下可以比之前的領(lǐng)先模型提升25%的速度。

“在NLP中,很重要的一點(diǎn)是,單一的方法能夠提高多樣化任務(wù)的性能”,Peters指出。

ELMo在半監(jiān)督式學(xué)習(xí)領(lǐng)域大放異彩

在進(jìn)行自然語(yǔ)言處理時(shí),訓(xùn)練數(shù)據(jù)的類型非常關(guān)鍵。例如,問答系統(tǒng)使用的模型無(wú)法在任何舊文本上進(jìn)行訓(xùn)練。通常,此類模型需要在由帶標(biāo)注的問題和答案對(duì)組成的大型數(shù)據(jù)庫(kù)中訓(xùn)練,以學(xué)習(xí)如何做出正確的回答。

標(biāo)注數(shù)據(jù)非常耗時(shí)并且成本高昂。因此,研究人員首先選擇使用包含大約十億個(gè)單詞的大型無(wú)標(biāo)記學(xué)術(shù)數(shù)據(jù)庫(kù)來(lái)訓(xùn)練ELMo。然后,針對(duì)特定任務(wù)(例如問答)將此數(shù)據(jù)庫(kù)調(diào)整為一個(gè)帶標(biāo)注的小型數(shù)據(jù)庫(kù)。對(duì)于這種結(jié)合使用大量無(wú)標(biāo)記數(shù)據(jù)和一小部分已標(biāo)記數(shù)據(jù)的方法,統(tǒng)稱為“半監(jiān)督式學(xué)習(xí)”。

減少對(duì)已標(biāo)記和帶標(biāo)注數(shù)據(jù)的依賴后,研究人員可以更輕松地在現(xiàn)實(shí)問題中應(yīng)用其NLP模型應(yīng)用。

“在我們的示例中,我們選擇了一個(gè)未標(biāo)記的學(xué)術(shù)數(shù)據(jù)庫(kù)來(lái)訓(xùn)練語(yǔ)言模型”,Peters說(shuō)道。但是研究人員能夠調(diào)整算法,以便在任何其他未標(biāo)記的數(shù)據(jù)庫(kù)中運(yùn)行該算法,也可以將其應(yīng)用于生物醫(yī)學(xué)論文、法律合同或其他語(yǔ)言等專業(yè)領(lǐng)域中。

與之前最先進(jìn)(SOTA)的基準(zhǔn)相比,ELMo在六個(gè)基準(zhǔn)NLP任務(wù)中都增強(qiáng)了神經(jīng)模型的性能。從左到右,這些任務(wù)依次是:語(yǔ)義推理、命名實(shí)體識(shí)別、問題回答、指代消解、語(yǔ)義角色標(biāo)注和情感分類。

研究人員通過Amazon Web Service,使用NVIDIA Tesla V100和K80 GPU助力訓(xùn)練和推理。

在后續(xù)論文中,研究人員指出其僅使用了幾百個(gè)已標(biāo)記示例,便可應(yīng)用ELMo模式回答幾何問題。人工需要花費(fèi)幾個(gè)小時(shí)便能完成此標(biāo)記工作,但卻會(huì)顯著提高NLP模型的性能。

ELMo已作為開源庫(kù)提供。Peters表示其他的NLP研究人員已經(jīng)將此模型應(yīng)用到了他們自己的工作中,包括除英語(yǔ)外的其他語(yǔ)言。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31123

    瀏覽量

    269447
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3265

    瀏覽量

    48918
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5507

    瀏覽量

    121272

原文標(biāo)題:“躲避”or“鴨子”:看深度學(xué)習(xí)如何解釋多義詞

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NPU在深度學(xué)習(xí)中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其核心驅(qū)動(dòng)力之一,已經(jīng)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和價(jià)值。NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元)是專門為深度學(xué)習(xí)
    的頭像 發(fā)表于 11-14 15:17 ?690次閱讀

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識(shí)別 圖像識(shí)別是深度學(xué)習(xí)
    的頭像 發(fā)表于 10-27 11:13 ?415次閱讀

    AI大模型與深度學(xué)習(xí)的關(guān)系

    AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對(duì)兩者關(guān)系的介紹: 一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐 :深度
    的頭像 發(fā)表于 10-23 15:25 ?914次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    。FPGA的優(yōu)勢(shì)就是可編程可配置,邏輯資源多,功耗低,而且賽靈思等都在極力推廣。不知道用FPGA做深度學(xué)習(xí)未來(lái)會(huì)怎樣發(fā)展,能走多遠(yuǎn),你怎么。 A:FPGA 在深度
    發(fā)表于 09-27 20:53

    深度學(xué)習(xí)中的時(shí)間序列分類方法

    時(shí)間序列分類(Time Series Classification, TSC)是機(jī)器學(xué)習(xí)深度學(xué)習(xí)領(lǐng)域的重要任務(wù)之一,廣泛應(yīng)用于人體活動(dòng)識(shí)別、系統(tǒng)監(jiān)測(cè)、金融預(yù)測(cè)、醫(yī)療診斷等多個(gè)領(lǐng)域。隨著深度
    的頭像 發(fā)表于 07-09 15:54 ?1030次閱讀

    深度學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)方法綜述

    深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)重要分支,近年來(lái)在多個(gè)領(lǐng)域取得了顯著的成果,特別是在圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域。然而,深度學(xué)習(xí)模型
    的頭像 發(fā)表于 07-09 10:50 ?820次閱讀

    深度學(xué)習(xí)在視覺檢測(cè)中的應(yīng)用

    深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)重要分支,其核心在于通過構(gòu)建具有多層次的神經(jīng)網(wǎng)絡(luò)模型,使計(jì)算機(jī)能夠從大量數(shù)據(jù)中自動(dòng)學(xué)習(xí)并提取特征,進(jìn)而實(shí)現(xiàn)對(duì)復(fù)雜任務(wù)的處理和理解。這種
    的頭像 發(fā)表于 07-08 10:27 ?753次閱讀

    深度學(xué)習(xí)與nlp的區(qū)別在哪

    深度學(xué)習(xí)和自然語(yǔ)言處理(NLP)是計(jì)算機(jī)科學(xué)領(lǐng)域中兩個(gè)非常重要的研究方向。它們之間既有聯(lián)系,也有區(qū)別。本文將介紹深度學(xué)習(xí)與NLP的區(qū)別。 深度
    的頭像 發(fā)表于 07-05 09:47 ?973次閱讀

    深度學(xué)習(xí)中的模型權(quán)重

    深度學(xué)習(xí)這一充滿無(wú)限可能性的領(lǐng)域中,模型權(quán)重(Weights)作為其核心組成部分,扮演著至關(guān)重要的角色。它們不僅是模型學(xué)習(xí)的基石,更是模型智能的源泉。本文將從模型權(quán)重的定義、作用、優(yōu)化、管理以及應(yīng)用等多個(gè)方面,深入探討
    的頭像 發(fā)表于 07-04 11:49 ?1474次閱讀

    深度學(xué)習(xí)常用的Python庫(kù)

    深度學(xué)習(xí)作為人工智能的一個(gè)重要分支,通過模擬人類大腦中的神經(jīng)網(wǎng)絡(luò)來(lái)解決復(fù)雜問題。Python作為一種流行的編程語(yǔ)言,憑借其簡(jiǎn)潔的語(yǔ)法和豐富的庫(kù)支持,成為了深度學(xué)習(xí)研究和應(yīng)用的首選工具。
    的頭像 發(fā)表于 07-03 16:04 ?668次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)深度學(xué)習(xí)無(wú)疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來(lái)了革命性的變化。然而,盡管它們都屬于機(jī)器學(xué)習(xí)的范疇,但
    的頭像 發(fā)表于 07-01 11:40 ?1431次閱讀

    深度解析深度學(xué)習(xí)下的語(yǔ)義SLAM

    隨著深度學(xué)習(xí)技術(shù)的興起,計(jì)算機(jī)視覺的許多傳統(tǒng)領(lǐng)域都取得了突破性進(jìn)展,例如目標(biāo)的檢測(cè)、識(shí)別和分類等領(lǐng)域。近年來(lái),研究人員開始在視覺SLAM算法中引入深度學(xué)習(xí)技術(shù),使得
    發(fā)表于 04-23 17:18 ?1321次閱讀
    <b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>下的語(yǔ)義SLAM

    為什么深度學(xué)習(xí)的效果更好?

    導(dǎo)讀深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,已成為人工智能領(lǐng)域的一項(xiàng)變革性技術(shù),在從計(jì)算機(jī)視覺、自然語(yǔ)言處理到自動(dòng)駕駛汽車等廣泛的應(yīng)用中取得了顯著的成功。深度
    的頭像 發(fā)表于 03-09 08:26 ?639次閱讀
    為什么<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的效果更好?

    【技術(shù)科普】主流的深度學(xué)習(xí)模型有哪些?AI開發(fā)工程師必備!

    接近于人工智能。它通過學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,對(duì)文字、圖像和聲音等數(shù)據(jù)進(jìn)行解釋深度學(xué)習(xí)的目標(biāo)是讓機(jī)器像人一樣具有分析學(xué)習(xí)能力,能
    的頭像 發(fā)表于 01-30 15:26 ?643次閱讀
    【技術(shù)科普】主流的<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>模型有哪些?AI開發(fā)工程師必備!

    什么是深度學(xué)習(xí)?機(jī)器學(xué)習(xí)深度學(xué)習(xí)的主要差異

    2016年AlphaGo 擊敗韓國(guó)圍棋冠軍李世石,在媒體報(bào)道中,曾多次提及“深度學(xué)習(xí)”這個(gè)概念。
    的頭像 發(fā)表于 01-15 10:31 ?1102次閱讀
    什么是<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>?機(jī)器<b class='flag-5'>學(xué)習(xí)</b>和<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的主要差異