0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算語(yǔ)言學(xué)的發(fā)展趨勢(shì)、不足與挑戰(zhàn)

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 作者:深度學(xué)習(xí)自然語(yǔ)言 ? 2022-08-18 11:03 ? 次閱讀

01

引言

NAACL 會(huì)議是 ACL 的北美分會(huì),每年舉辦一次,也是 NLP 領(lǐng)域備受關(guān)注的頂會(huì)之一。NAACL 主要涉及對(duì)話(huà)、信息抽取、信息檢索、語(yǔ)言生成、機(jī)器翻譯、多模態(tài)、統(tǒng)計(jì)機(jī)器學(xué)習(xí)等多個(gè)方面。

本篇文章的作者Antoine SIMOULIN協(xié)助了NAACL 2022,他結(jié)合今年一些論文的情況,就大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型的應(yīng)用、表現(xiàn)、期望等做了概述,總結(jié)并思考了當(dāng)今計(jì)算語(yǔ)言學(xué)的發(fā)展趨勢(shì)、不足與挑戰(zhàn)。

02

2.1大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型數(shù)量增多

人們?cè)絹?lái)越樂(lè)觀(guān)地看待大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型的潛在應(yīng)用,這使人們的注意力從它們?yōu)槭裁匆约叭绾喂ぷ鬓D(zhuǎn)移到如何確保它們?cè)诂F(xiàn)實(shí)世界中可以更好地工作。

對(duì)話(huà)是語(yǔ)言模型的直接應(yīng)用。Amazon Alexa AI高級(jí)首席科學(xué)家Dilek Hakkani-Tur表示,由于公共數(shù)據(jù)集、語(yǔ)言模型和產(chǎn)品的蓬勃發(fā)展,對(duì)話(huà)研究正處于激動(dòng)人心的階段。她還概述了剩余的挑戰(zhàn):基于知識(shí)的回復(fù)生成、開(kāi)放域?qū)υ?huà)中產(chǎn)生的事實(shí)響應(yīng)、知識(shí)攝取以及收集跨長(zhǎng)文檔或多源信息。

2.2 開(kāi)放對(duì)話(huà)

通過(guò)給定恰當(dāng)格式的輸入文本并提供相關(guān)上下文,模型可以產(chǎn)生符合條件的輸出。這種交互對(duì)話(huà)范式可以應(yīng)用在很多任務(wù)上,如問(wèn)答(Sanagavarapu et al. 2022 (opens new window), Qian et al. 2022 (opens new window), You et al. 2022 (opens new window))或摘要總結(jié)(Fang et al. 2022 (opens new window), Zhao et al. 2022 (opens new window), Asi et al. 2022 (opens new window))。此外,對(duì)話(huà)數(shù)據(jù)可用于學(xué)習(xí)高效的語(yǔ)言表示 (Zhou et al. 2022 (opens new window))。

2.3 結(jié)構(gòu)融合和常識(shí)知識(shí)

我們期望大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型能夠準(zhǔn)確回答事實(shí)問(wèn)題,讓模型擁有如“百科全書(shū)”一般的知識(shí)。知識(shí)圖譜提供了可以與神經(jīng)網(wǎng)絡(luò)一起使用的硬結(jié)構(gòu)信息??梢栽诿麑?shí)體及其關(guān)系之間進(jìn)行顯式通信(Ayoola et al. 2022 (opens new window)),或者將符號(hào)和顯式知識(shí)提煉成模型參數(shù)的隱式編碼知識(shí) (Moiseev et al. 2022 (opens new window))。

我們還希望大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型擁有我們所有人擁有的日常知識(shí)。例如,我們希望模型不會(huì)生成“狗正在從噴氣式飛機(jī)上經(jīng)過(guò)”這樣的句子(Seo et al. 2022 (opens new window)),或牙刷在空間上應(yīng)與浴室相關(guān)而不是與客廳相關(guān)(Henlein and Mehler 2022 (opens new window))。

最后,這些事實(shí)取決于時(shí)間。如果是在模型訓(xùn)練后發(fā)生的事件,例如新冠肺炎大流行,那么模型并不會(huì)將其考慮在內(nèi),否則會(huì)導(dǎo)致時(shí)間錯(cuò)位 (Luu et al. 2022 (opens new window))。

2.4 推理

我們希望模型可以校對(duì)事實(shí)并推斷它們之間的關(guān)系。(Sun et al. 2022 (opens new window))提出了JointLK,這是一個(gè)在LM(語(yǔ)言模型)和KG(知識(shí)圖譜)之間進(jìn)行多步聯(lián)合推理的模型,可以解決問(wèn)答任務(wù)。多跳問(wèn)答任務(wù)也涉及推理,因?yàn)樗枰茢喽鄠€(gè)間接引用來(lái)連接詢(xún)問(wèn)(query)中提到的實(shí)體。(Kinet al. 2022 (opens new window))提出了一種方法:對(duì)這種特定類(lèi)型的問(wèn)答使用知識(shí)庫(kù)。

2.5 超越語(yǔ)言本身

模型不僅僅需要精通語(yǔ)言,它們還需要捕捉語(yǔ)言背后的含義和意圖,捕捉真實(shí)世界的一些直觀(guān)表述,并對(duì)實(shí)體和現(xiàn)有的關(guān)系進(jìn)行復(fù)雜的推斷。要推動(dòng)大規(guī)模預(yù)訓(xùn)練的語(yǔ)言模型向前發(fā)展,關(guān)鍵是:僅憑文本可以訓(xùn)練高效且有意義的模型嗎?

2.6 多模態(tài)、多語(yǔ)言、對(duì)比學(xué)習(xí)

我們是否需要在訓(xùn)練過(guò)程中引入其他模態(tài),例如音頻信息或者圖像信息?事實(shí)上,嬰兒在學(xué)習(xí)時(shí)會(huì)受到多種類(lèi)型信息的刺激。關(guān)于多模態(tài)學(xué)習(xí),(Zhang et al.2022 (opens new window))使用文本和圖像混合信息的對(duì)比框架來(lái)構(gòu)建句子編碼。(Wang et al. 2022 (opens new window))提出將文本和圖像結(jié)合起來(lái),以更好地確認(rèn)命名實(shí)體識(shí)別。

2.7 語(yǔ)言學(xué)和符號(hào)結(jié)構(gòu)的地位

計(jì)算語(yǔ)言學(xué)見(jiàn)證了大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型的廣泛使用,但大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型對(duì)語(yǔ)言學(xué)和符號(hào)的假設(shè)很少。在激動(dòng)人心的小組會(huì)議上,Chitta Baral、Dilek Hakkani-Tür、Emily Bender和Chris Manning研究了這一觀(guān)察可能如何影響未來(lái)的研究方向??蒲匈Y金通常流向研究神經(jīng)網(wǎng)絡(luò)的工作,因此人們對(duì)利用語(yǔ)言學(xué)進(jìn)行分析并不感興趣。但神經(jīng)網(wǎng)絡(luò)是我們應(yīng)該追逐的唯一趨勢(shì)嗎?

Chris Manning根據(jù)經(jīng)驗(yàn)觀(guān)察到,孩子們可以在沒(méi)有任何語(yǔ)言學(xué)專(zhuān)業(yè)知識(shí)的情況下學(xué)習(xí)語(yǔ)言。我們或許可以從語(yǔ)言理論和概念中汲取靈感,如復(fù)合性、系統(tǒng)概括、符號(hào)的穩(wěn)定意義和校對(duì)相關(guān)。但是,我們應(yīng)該關(guān)注意義的直接表征,而不是語(yǔ)言本身,因?yàn)檎Z(yǔ)言是一種間接表征。

Emily Bender認(rèn)為如果沒(méi)有語(yǔ)言學(xué),包括結(jié)構(gòu)語(yǔ)言學(xué)、形態(tài)學(xué)、語(yǔ)法學(xué)、語(yǔ)義學(xué)、語(yǔ)言語(yǔ)用學(xué)、兒童語(yǔ)言習(xí)得、語(yǔ)言類(lèi)型學(xué)和社會(huì)語(yǔ)言學(xué),那么NLP就不應(yīng)該作為一個(gè)領(lǐng)域而存在。

2.8 文本內(nèi)涵的定義

在SemEval研討會(huì)上,Jacob Andreas討論了語(yǔ)言模型在文本內(nèi)涵表示方面的潛力,以及是否可以單獨(dú)從文本中學(xué)習(xí)到文本的內(nèi)涵。會(huì)議期間多次提到關(guān)于文本的內(nèi)涵。文本內(nèi)涵是指世界上的外部參考,人們腦海中的內(nèi)部思想,還是用語(yǔ)言表達(dá)的觀(guān)念?更廣泛地說(shuō),我們可以期望一個(gè)模型在沒(méi)有任何形式的社交互動(dòng)或?qū)嶋H經(jīng)驗(yàn)的情況下,只憑借文本訓(xùn)練就展示人類(lèi)的行為嗎?

2.9 巨大的能力帶來(lái)巨大的責(zé)任

隨著大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型變得越來(lái)越可行和廣泛采用,工程師們對(duì)他們的觀(guān)念變得更加負(fù)責(zé)。

2.10 價(jià)值敏感設(shè)計(jì)

Batya Friedman就道德和技術(shù)想象力應(yīng)該如何塑造技術(shù)發(fā)表了公開(kāi)演講。除了安全、可靠性、效率或成本等工程標(biāo)準(zhǔn)外,還應(yīng)考慮其他標(biāo)準(zhǔn),包括專(zhuān)注和身體完整性。為了使技術(shù)和社會(huì)結(jié)構(gòu)和諧發(fā)展,我們應(yīng)該衡量大規(guī)模語(yǔ)言模型帶來(lái)的的影響,例如規(guī)模、時(shí)間、結(jié)構(gòu)以及應(yīng)用人類(lèi)價(jià)值觀(guān)作為評(píng)估系統(tǒng)性能的標(biāo)準(zhǔn)。

2.11 拓寬NLP

眾所周知,自然語(yǔ)言處理是一個(gè)快速發(fā)展的領(lǐng)域,但這個(gè)領(lǐng)域的演變非常多樣化,研究資源也非常集中。科技公司擁有巨大的行動(dòng)力,使學(xué)者難以跟上步伐。此外,研究資源在地理上分布不均,例如Manuel Montes-y-Gómez展示了墨西哥西班牙語(yǔ)NLP社區(qū)研究現(xiàn)狀,該研究不如美式英語(yǔ)先進(jìn)。

2.12 NLP未來(lái)的一些挑戰(zhàn):組成性、基礎(chǔ)或解釋

盡管大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型非常令人興奮,并且我們對(duì)它們的可靠性和效率實(shí)現(xiàn)任務(wù)自動(dòng)化的能力越來(lái)越樂(lè)觀(guān),但一些挑戰(zhàn)仍然存在。

一個(gè)挑戰(zhàn)是跟蹤模型為什么產(chǎn)生一個(gè)給定的輸出。(Tan 2022 (opens new window))區(qū)分了幾種我們能從模型或人類(lèi)所期望的概念解釋和挑戰(zhàn)。

根據(jù)許多研究,模型在系統(tǒng)推廣和顯式組成方面是失敗的,因?yàn)樗鼈円蕾?lài)于虛假的相關(guān)性。在這方面,(Wei?enhorn et al. 2022 (opens new window))使用復(fù)合語(yǔ)義解析器來(lái)解決COGS數(shù)據(jù)集上的成分概括。(Qui et al. 2022 (opens new window)) 提出了一種基于上下文無(wú)關(guān)語(yǔ)法主干的數(shù)據(jù)增強(qiáng)方法。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4772

    瀏覽量

    100807
  • 計(jì)算
    +關(guān)注

    關(guān)注

    2

    文章

    450

    瀏覽量

    38820
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    526

    瀏覽量

    10277

原文標(biāo)題:結(jié)合NAACL2022對(duì)計(jì)算語(yǔ)言學(xué)趨勢(shì)的思考與分析

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    未來(lái)物流發(fā)展趨勢(shì)與TMS的關(guān)系

    隨著全球化的加速和電子商務(wù)的蓬勃發(fā)展,物流行業(yè)正經(jīng)歷著前所未有的變革。未來(lái)物流的發(fā)展趨勢(shì)不僅影響著供應(yīng)鏈的效率和成本,也對(duì)企業(yè)的競(jìng)爭(zhēng)力產(chǎn)生深遠(yuǎn)影響。運(yùn)輸管理系統(tǒng)(Transportation
    的頭像 發(fā)表于 11-26 09:40 ?434次閱讀

    NPU的市場(chǎng)前景與發(fā)展趨勢(shì)

    隨著人工智能技術(shù)的快速發(fā)展,神經(jīng)網(wǎng)絡(luò)處理器(Neural Processing Unit,簡(jiǎn)稱(chēng)NPU)作為AI領(lǐng)域的關(guān)鍵硬件,其市場(chǎng)前景和發(fā)展趨勢(shì)備受關(guān)注。 一、NPU市場(chǎng)前景分析 市場(chǎng)需求
    的頭像 發(fā)表于 11-15 09:14 ?975次閱讀

    邊緣計(jì)算的未來(lái)發(fā)展趨勢(shì)

    邊緣計(jì)算的未來(lái)發(fā)展趨勢(shì)呈現(xiàn)出多元化和高速增長(zhǎng)的態(tài)勢(shì),以下是對(duì)其未來(lái)發(fā)展趨勢(shì)的分析: 一、技術(shù)融合與創(chuàng)新 與5G、AI技術(shù)的深度融合 隨著5G技術(shù)的普及,其大帶寬、低延遲的特性為邊緣計(jì)算
    的頭像 發(fā)表于 10-24 14:21 ?870次閱讀

    計(jì)算技術(shù)的未來(lái)發(fā)展趨勢(shì)

    計(jì)算技術(shù)的未來(lái)發(fā)展趨勢(shì)呈現(xiàn)出多元化和高度集成的特點(diǎn),以下是對(duì)其未來(lái)發(fā)展趨勢(shì)的介紹: 一、市場(chǎng)規(guī)模持續(xù)增長(zhǎng) 全球范圍 : 根據(jù)權(quán)威機(jī)構(gòu)發(fā)布的數(shù)據(jù),全球云計(jì)算市場(chǎng)規(guī)模近年來(lái)持續(xù)增長(zhǎng),20
    的頭像 發(fā)表于 10-24 09:20 ?1333次閱讀

    智能駕駛技術(shù)發(fā)展趨勢(shì)

    智能駕駛技術(shù)是當(dāng)前汽車(chē)行業(yè)的重要發(fā)展趨勢(shì)之一,它融合了傳感器技術(shù)、人工智能、大數(shù)據(jù)和云計(jì)算等多種先進(jìn)技術(shù),旨在實(shí)現(xiàn)車(chē)輛的自主駕駛和智能化管理。以下是對(duì)智能駕駛技術(shù)發(fā)展趨勢(shì)的分析: 一、技術(shù)突破與進(jìn)展
    的頭像 發(fā)表于 10-23 15:41 ?718次閱讀

    未來(lái)AI大模型的發(fā)展趨勢(shì)

    未來(lái)AI大模型的發(fā)展趨勢(shì)將呈現(xiàn)多元化和深入化的特點(diǎn),以下是對(duì)其發(fā)展趨勢(shì)的分析: 一、技術(shù)驅(qū)動(dòng)與創(chuàng)新 算法與架構(gòu)優(yōu)化 : 隨著Transformer架構(gòu)的廣泛應(yīng)用,AI大模型在特征提取和并行計(jì)算效率
    的頭像 發(fā)表于 10-23 15:06 ?638次閱讀

    變阻器的未來(lái)發(fā)展趨勢(shì)和前景如何?是否有替代品出現(xiàn)?

    變阻器是一種用于調(diào)節(jié)電路中電阻值的電子元件,廣泛應(yīng)用于各種電子設(shè)備和系統(tǒng)中。隨著科技的不斷進(jìn)步和應(yīng)用領(lǐng)域的擴(kuò)展,變阻器的未來(lái)發(fā)展趨勢(shì)和前景備受關(guān)注。 未來(lái)變阻器將趨向于智能化和多功能化,隨著物聯(lián)網(wǎng)
    發(fā)表于 10-10 14:35

    智能制造行業(yè)現(xiàn)狀與發(fā)展趨勢(shì)

    智能制造行業(yè)作為現(xiàn)代制造業(yè)的重要組成部分,正經(jīng)歷著快速的發(fā)展與變革。以下是對(duì)智能制造行業(yè)現(xiàn)狀與發(fā)展趨勢(shì)的詳細(xì)分析:
    的頭像 發(fā)表于 09-15 14:26 ?1397次閱讀

    倉(cāng)頡語(yǔ)言書(shū)籍申請(qǐng)

    樓主, 您好!我是一名接觸開(kāi)發(fā)語(yǔ)言不久,對(duì)語(yǔ)言學(xué)習(xí)充滿(mǎn)熱情的開(kāi)發(fā)者小白,近期對(duì)華為推出的倉(cāng)頡語(yǔ)言產(chǎn)生了濃厚的興趣。為了更深入地了解和學(xué)習(xí)這種語(yǔ)言,我希望能申請(qǐng)一本關(guān)于倉(cāng)頡
    發(fā)表于 08-06 08:37

    工業(yè)控制計(jì)算機(jī)的發(fā)展趨勢(shì)有哪些

    工業(yè)控制計(jì)算機(jī)是工業(yè)自動(dòng)化系統(tǒng)中的核心設(shè)備,其發(fā)展趨勢(shì)對(duì)于整個(gè)工業(yè)自動(dòng)化領(lǐng)域的發(fā)展具有重要意義。本文將從以下幾個(gè)方面對(duì)工業(yè)控制計(jì)算機(jī)的發(fā)展趨勢(shì)
    的頭像 發(fā)表于 06-16 11:41 ?1051次閱讀

    智慧燈桿發(fā)展趨勢(shì)

    智慧燈桿不僅具備了傳統(tǒng)的照明功能,還集成了監(jiān)控、通信、信息發(fā)布等多種功能,通過(guò)物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等先進(jìn)技術(shù)的運(yùn)用,實(shí)現(xiàn)了對(duì)城市環(huán)境的智能感知和管理。本文將從多個(gè)方面探討智慧燈桿的發(fā)展趨勢(shì)。
    的頭像 發(fā)表于 04-30 16:30 ?483次閱讀
    智慧燈桿<b class='flag-5'>發(fā)展趨勢(shì)</b>

    DC電源模塊的發(fā)展趨勢(shì)和前景展望

    BOSHIDA ?DC電源模塊的發(fā)展趨勢(shì)和前景展望 隨著電子產(chǎn)品的普及和多樣化,對(duì)電源模塊的需求也越來(lái)越大。其中,DC電源模塊作為一種重要的電源供應(yīng)方式,在各個(gè)領(lǐng)域有著廣泛的應(yīng)用。在過(guò)去的幾十年
    的頭像 發(fā)表于 04-18 13:37 ?522次閱讀
    DC電源模塊的<b class='flag-5'>發(fā)展趨勢(shì)</b>和前景展望

    中國(guó)網(wǎng)絡(luò)交換芯片市場(chǎng)發(fā)展趨勢(shì)

    中國(guó)網(wǎng)絡(luò)交換芯片市場(chǎng)的發(fā)展趨勢(shì)受多種因素影響,包括技術(shù)進(jìn)步、政策推動(dòng)、市場(chǎng)需求以及全球產(chǎn)業(yè)鏈的變化等。以下是對(duì)該市場(chǎng)發(fā)展趨勢(shì)的一些分析。
    的頭像 發(fā)表于 03-18 14:02 ?890次閱讀

    靜壓主軸的應(yīng)用、優(yōu)勢(shì)及發(fā)展趨勢(shì)?|深圳恒興隆機(jī)電a

    靜壓主軸是用于機(jī)械加工中的一種設(shè)備,它通過(guò)靜壓平衡的原理,實(shí)現(xiàn)高速旋轉(zhuǎn)并保持較高的精度和穩(wěn)定性。本文將介紹靜壓主軸的應(yīng)用、優(yōu)勢(shì)及發(fā)展趨勢(shì),并整理相關(guān)知識(shí)。接下來(lái)就跟著深圳恒興隆機(jī)電小編一起來(lái)看下吧
    發(fā)表于 01-22 10:32

    配網(wǎng)故障定位裝置:未來(lái)發(fā)展趨勢(shì)挑戰(zhàn)

    在電力系統(tǒng)中,恒峰智慧科技設(shè)計(jì)的配網(wǎng)故障定位裝置是一個(gè)至關(guān)重要的設(shè)備,它可以幫助我們快速準(zhǔn)確地找到故障發(fā)生的位置,從而進(jìn)行有效的維修。隨著科技的發(fā)展,這種設(shè)備也在不斷地進(jìn)步和改進(jìn)。本文將探討配網(wǎng)故障定位裝置的未來(lái)發(fā)展趨勢(shì)挑戰(zhàn)
    的頭像 發(fā)表于 01-18 10:24 ?469次閱讀
    配網(wǎng)故障定位裝置:未來(lái)<b class='flag-5'>發(fā)展趨勢(shì)</b>與<b class='flag-5'>挑戰(zhàn)</b>