0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Richard Socher:NLP領(lǐng)域的發(fā)展要過三座大山

mK5P_AItists ? 來源:未知 ? 作者:胡薇 ? 2018-09-06 11:40 ? 次閱讀

“我的飛機(jī)什么時(shí)候到?”把這個(gè)問題拋給智能機(jī)器人助手。幾乎可以肯定,機(jī)器立馬就懵逼了。“我”是誰?“飛機(jī)”是航班還是淘寶上訂的模型玩具呢?“到”又是到哪呢?如果是人類來回答這個(gè)問題,即使在情景不明確的情況下也能在快速澄清后給出回答,但對(duì)機(jī)器來說,除非依賴大量人為制定的規(guī)則,回答這樣的問題難度堪比“哥德巴赫猜想”。

面對(duì)自然語言處理發(fā)展(NLP)存在的諸多難題,該領(lǐng)域的大牛、Salesforce的首席科學(xué)家Richard Socher在近日指出:NLP領(lǐng)域的發(fā)展要過三座大山。

困擾NLP領(lǐng)域的這三座大山究竟是什么?一起來聽大佬說。

一直以來,語言都被認(rèn)為是人類的獨(dú)特能力,是智慧的表現(xiàn)。但最近,自然語言處理技術(shù)的發(fā)展似乎也將語言能力賦予給了機(jī)器。

幫你打電話訂餐,給你講故事,解決各種刁鉆的冷知識(shí)問答…機(jī)器的語言能力已經(jīng)無限接近人類水平。

現(xiàn)在你可以走進(jìn)昏暗的客廳,讓Alexa把智能燈的亮度提高到75%。你也可以詢問他世界另一邊的天氣情況。在Google最近的Duplexde,AI助理已經(jīng)能夠給理發(fā)店打電話,為你預(yù)約剪發(fā)。

曾經(jīng)被視為科幻的場(chǎng)景現(xiàn)在變?yōu)榱爽F(xiàn)實(shí),但為了維持真正的人機(jī)關(guān)系,機(jī)器必須能夠與人進(jìn)行更直觀、理解上下文和自然的對(duì)話--這仍然是一個(gè)挑戰(zhàn)。我致力于研究NLP,但是就像AI一樣,我們還在這個(gè)旅程的開始階段。

語言是分享信息和與周圍連接的一種機(jī)制,但是機(jī)器需要理解語言的復(fù)雜性以及作為人類是如何使用語言進(jìn)行交流的。情感分析、問題回答和聯(lián)合多任務(wù)學(xué)習(xí)方面的進(jìn)步使AI能夠真正理解人類以及我們的交流方式。

情感分析

語言本身就是復(fù)雜的。它不斷發(fā)展,而且細(xì)致入微,一般人需要數(shù)年才能掌握。通過情緒分析,我們可以使用AI來理解特定內(nèi)容,比如品牌或電影評(píng)價(jià)是正面的、負(fù)面的還是中性的。

我們也能弄清楚演講者的態(tài)度和意圖(她是生氣,高興,驚訝還是準(zhǔn)備好要買東西了?)。從客戶服務(wù)到在線社區(qū)調(diào)節(jié)再到算法交易,能夠即時(shí)分析數(shù)千條推特和數(shù)百條產(chǎn)品評(píng)論來理解公眾對(duì)一個(gè)品牌的看法,這對(duì)于企業(yè)來說是非常有價(jià)值的。

情感分析技術(shù)已經(jīng)存在了一段時(shí)間,但并不總是非常精準(zhǔn)。隨著NLP的進(jìn)展,這種情況正在發(fā)生變化。在我擔(dān)任首席科學(xué)家的Salesforce,我們的AI(叫做Einstein)允許品牌能夠通過電子郵件,社交媒體,和聊天短信得到實(shí)時(shí)的情感分析,為客戶提供更好的體驗(yàn)。

準(zhǔn)確的情感分析,例如,服務(wù)代理可幫助了解應(yīng)優(yōu)先服務(wù)哪些不滿意的客戶,或者應(yīng)向誰提供優(yōu)惠。也可識(shí)別產(chǎn)品缺陷,衡量產(chǎn)品滿意度,通過社交平臺(tái)改變?nèi)藗儗?duì)品牌的認(rèn)知。其他科技公司也提供類似服務(wù)。

對(duì)于情感分析來說,理解上下文也是很重要的。假設(shè)你有一家肥皂公司,有人在推特上說:“這種肥皂對(duì)嬰兒來說真的很棒。”這可以是對(duì)兒童肥皂的積極支持,也可能是暗諷這對(duì)孩子來說很可怕。

這句陳述可能包含很多上下文,但又很簡(jiǎn)單!使用AI分析某一句子結(jié)構(gòu)的所有可能性,并理解一個(gè)人在特定語境下的用意,是NLP研究的重大挑戰(zhàn)。它既需要標(biāo)記數(shù)據(jù)來改進(jìn)模型培訓(xùn),也需要新的模型在學(xué)習(xí)上下文的同時(shí)在許多不同類型的任務(wù)之間共享知識(shí)。

問 答

隨著NLP更好地解析文本的含義,幫助管理我們生活的數(shù)字助理智能將會(huì)提高。Siri和Google Assistant等應(yīng)用程序可為常見問題提供優(yōu)質(zhì)答案,并執(zhí)行簡(jiǎn)單的命令。理想情況下,我們應(yīng)該能夠問電腦任意問題,并且得到好的答案。

提供更好答案的一種方式是確保計(jì)算機(jī)理解問題。如果你問“我的飛機(jī)什么時(shí)候到達(dá)?”計(jì)算機(jī)怎么知道是在談?wù)撃愕暮桨噙€是從亞馬遜訂購(gòu)的木工工具呢?

通過對(duì)語義的更深入理解,再加上對(duì)上下文數(shù)據(jù)的更好使用,計(jì)算機(jī)在判斷語義這方面正變得越來越好。我們正在研究如何使用NLP學(xué)習(xí)每一層上下文,這樣AI就可以同時(shí)處理所有內(nèi)容,而不會(huì)錯(cuò)過重要的信息。

例如,動(dòng)態(tài)共聚焦網(wǎng)絡(luò)(dynamic coattentionnetworks可以根據(jù)不同的問題對(duì)單個(gè)文檔進(jìn)行不同的解釋,比如,面對(duì)一篇體育報(bào)道,在回答“哪位運(yùn)動(dòng)員獲得了冠軍?”和“最年輕的參賽者是幾歲?”這兩個(gè)問題是,機(jī)器就能對(duì)這篇報(bào)道作出不同的理解,從而反復(fù)假設(shè)多個(gè)答案,最終得到最好、最準(zhǔn)確的結(jié)果。

聯(lián)合多任務(wù)學(xué)習(xí)

科學(xué)界善于構(gòu)建能很好地執(zhí)行單個(gè)任務(wù)的人工智能模型。但是,更直觀、會(huì)話式的并聯(lián)系上下文的界面則需要一個(gè)不斷學(xué)習(xí)的AI模型,它能夠?qū)⑿氯蝿?wù)與舊任務(wù)集成起來,并在這個(gè)過程中學(xué)習(xí)執(zhí)行更加復(fù)雜的任務(wù)??傮w上來說,這對(duì)所有AI都是適用的,但在語言方面尤其如此,因?yàn)檎Z言需要靈活性。

“誰是我的客戶?”這是一個(gè)十分簡(jiǎn)單的任務(wù):創(chuàng)建客戶列表。但是,“誰是太平洋西北地區(qū)對(duì)某一特定產(chǎn)品的最佳潛在客戶呢”?這樣的問題增加了一層復(fù)雜性,需要大量的集成任務(wù)來提供答案,例如:如何定義“最佳”?客戶定位在哪里?是什么因素導(dǎo)致客戶對(duì)產(chǎn)品感興趣的?每增加一個(gè)因素,問題的復(fù)雜性都會(huì)急劇增加。

Salesforce研究公司最近進(jìn)行了一項(xiàng)名為“自然語言十項(xiàng)全能”的研究,該研究將多個(gè)任務(wù)轉(zhuǎn)化為問答的形式,從而在一個(gè)單模型中解決了NLP最困[1]難的10項(xiàng)任務(wù):?jiǎn)栴}回答,機(jī)器翻譯,摘要,自然語言推理,情感分析,語義角色標(biāo)注,關(guān)系提取,目標(biāo)導(dǎo)向?qū)υ?,?shù)據(jù)庫查詢生成,代詞消解。

使用多任務(wù)問答模型,將每個(gè)任務(wù)作為一種問答形式,單個(gè)模型在沒有任何特定參數(shù)或模塊的情況下共同學(xué)習(xí)和處理不同的任務(wù)。這不僅意味著數(shù)據(jù)科學(xué)家不再需要為每項(xiàng)任務(wù)建立、訓(xùn)練和優(yōu)化單個(gè)模型,而且還意味著該模型具有零射擊(zero-shot)學(xué)習(xí)能力---換句話說就是該模型可以處理以前從未見過或?qū)iT訓(xùn)練過的任務(wù)。

隨著研究人員繼續(xù)改進(jìn)這樣的模型,我們會(huì)看到AI界面在承擔(dān)更復(fù)雜任務(wù)時(shí)變得更聰明。

雖然我們已經(jīng)研究NLP很長(zhǎng)時(shí)間了,但我們要走的路還長(zhǎng)著呢。希望隨著NLP技術(shù)的提升,人類與機(jī)器的交互形式最終能夠迎來質(zhì)的飛躍。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    288

    瀏覽量

    13369
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    489

    瀏覽量

    22064

原文標(biāo)題:語言處理想突破,三座大山必須過

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    甲骨文規(guī)劃三座小型核電站賦能AI數(shù)據(jù)中心

    甲骨文公司近日宣布了一項(xiàng)重大能源戰(zhàn)略,已獲得授權(quán)建設(shè)三座小型模塊化核反應(yīng)堆,旨在為旗下龐大的AI數(shù)據(jù)中心提供清潔、穩(wěn)定的電力支持。這一創(chuàng)新舉措由公司董事長(zhǎng)拉里·埃里森親自披露,彰顯了甲骨文在可持續(xù)發(fā)展與AI技術(shù)融合方面的前瞻視野。
    的頭像 發(fā)表于 09-19 18:18 ?662次閱讀

    基于望獲實(shí)時(shí)Linux和飛騰E2000Q CPU的全國(guó)產(chǎn)工控解決方案

    隨著智能制造和工業(yè)4.0浪潮的席卷,工業(yè)生產(chǎn)對(duì)控制系統(tǒng)提出了前所未有的挑戰(zhàn)——高精度、高實(shí)時(shí)性和高可靠性的需求如同三座大山,橫亙?cè)谛袠I(yè)發(fā)展之路上。然而,環(huán)顧當(dāng)前市場(chǎng),高性能的國(guó)產(chǎn)化工業(yè)控制解決方案仍
    的頭像 發(fā)表于 08-08 13:48 ?683次閱讀

    nlp自然語言處理框架有哪些

    自然語言處理(Natural Language Processing,簡(jiǎn)稱NLP)是計(jì)算機(jī)科學(xué)和人工智能領(lǐng)域的一個(gè)重要分支,它致力于使計(jì)算機(jī)能夠理解和處理人類語言。隨著技術(shù)的發(fā)展NLP
    的頭像 發(fā)表于 07-09 10:28 ?595次閱讀

    nlp自然語言處理的主要任務(wù)及技術(shù)方法

    自然語言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能和語言學(xué)領(lǐng)域的一個(gè)分支,它研究如何讓計(jì)算機(jī)能夠理解、生成和處理人類語言。NLP技術(shù)在許多領(lǐng)域
    的頭像 發(fā)表于 07-09 10:26 ?1254次閱讀

    nlp自然語言處理模型怎么做

    自然語言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能領(lǐng)域的一個(gè)重要分支,它涉及到計(jì)算機(jī)對(duì)人類語言的理解和生成。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,NLP
    的頭像 發(fā)表于 07-05 09:59 ?677次閱讀

    nlp自然語言處理的應(yīng)用有哪些

    自然語言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能領(lǐng)域的一個(gè)分支,它致力于使計(jì)算機(jī)能夠理解和生成自然語言。隨著技術(shù)的發(fā)展,NLP已經(jīng)在許多
    的頭像 發(fā)表于 07-05 09:55 ?2724次閱讀

    NLP技術(shù)在機(jī)器人中的應(yīng)用

    人類語言的能力,還使得機(jī)器人能夠以更加自然、流暢的方式與人類進(jìn)行交互,從而在服務(wù)、教育、醫(yī)療、娛樂等多個(gè)領(lǐng)域展現(xiàn)出巨大的潛力和價(jià)值。本文將從NLP技術(shù)在機(jī)器人中的應(yīng)用現(xiàn)狀、核心技術(shù)、應(yīng)用場(chǎng)景、面臨的挑戰(zhàn)及未來發(fā)展趨勢(shì)等方面進(jìn)行深
    的頭像 發(fā)表于 07-04 16:04 ?539次閱讀

    NLP技術(shù)在人工智能領(lǐng)域的重要性

    智能的橋梁,其重要性日益凸顯。本文將從NLP的定義、發(fā)展歷程、核心技術(shù)、應(yīng)用領(lǐng)域以及對(duì)人工智能領(lǐng)域的深遠(yuǎn)影響等多個(gè)維度,深入探討NLP技術(shù)在
    的頭像 發(fā)表于 07-04 16:03 ?628次閱讀

    什么是自然語言處理 (NLP)

    自然語言處理(Natural Language Processing, NLP)是人工智能領(lǐng)域中的一個(gè)重要分支,它專注于構(gòu)建能夠理解和生成人類語言的計(jì)算機(jī)系統(tǒng)。NLP的目標(biāo)是使計(jì)算機(jī)能夠像人類一樣
    的頭像 發(fā)表于 07-02 18:16 ?1272次閱讀

    臺(tái)積電高雄P3廠用地變更獲批,邁向第三座2nm廠建設(shè)

    近日,臺(tái)積電在高雄市的P3廠項(xiàng)目取得了重要進(jìn)展。據(jù)可靠消息,6月24日,臺(tái)積電高雄P3廠通過了高雄市都市計(jì)劃委員會(huì)的用地變更申請(qǐng),該地塊將被正式變更為甲種工業(yè)區(qū)。這一里程碑式的進(jìn)展意味著,臺(tái)積電距離其第三座2nm廠的建設(shè)動(dòng)工又近了一步。
    的頭像 發(fā)表于 06-26 10:21 ?1388次閱讀

    天合光能供貨的巴西三座光伏電站(Solar Park)成功并網(wǎng)運(yùn)行

    近日,由天合光能供貨的巴西三座光伏電站(Solar Park)成功并網(wǎng)運(yùn)行。這三座電站均位于巴西南部的巴拉那州,全部采用天合光能至尊N型720W系列組件和至尊670W組件,總裝機(jī)量達(dá)21MW,為這座熱情之都輸入更多綠色能量。
    的頭像 發(fā)表于 05-14 10:32 ?525次閱讀

    臺(tái)積電將在美國(guó)鳳凰城建設(shè)第三座芯片工廠

    立第三座芯片工廠,將其在亞利桑那州的總投資增加至 650 億美元。 第三座晶圓廠將使用 2nm 或更先進(jìn)的工藝生產(chǎn)芯片,并于本世紀(jì)末開始生產(chǎn)。 美國(guó)總統(tǒng)拜登表示,這些設(shè)施將生產(chǎn)世界上最先進(jìn)的芯片,促使美國(guó)有望在2030 年生產(chǎn)出全球 20% 的尖端半導(dǎo)體。 他表示,
    的頭像 發(fā)表于 04-10 16:19 ?407次閱讀

    臺(tái)積電將建第3晶圓廠 臺(tái)積電5/3nm漲定

    近日,全球半導(dǎo)體制造巨頭臺(tái)積電宣布將進(jìn)一步擴(kuò)大在美國(guó)的投資版圖,計(jì)劃在亞利桑那州增設(shè)第三座工廠。
    的頭像 發(fā)表于 04-09 15:03 ?720次閱讀

    印度批準(zhǔn)三座半導(dǎo)體工廠投資,金額達(dá)1.26萬億盧比

    達(dá)到2700億盧比,預(yù)計(jì)日產(chǎn)能力可達(dá)4800萬顆芯片。   而第三座封裝測(cè)試工廠則由CG Power與日本瑞薩電子、泰國(guó)Stars Microelectronics合作運(yùn)營(yíng),預(yù)計(jì)每日封裝測(cè)試能力
    的頭像 發(fā)表于 03-01 09:09 ?547次閱讀

    MLCC龍頭村田三座工廠繼續(xù)停工

    據(jù)報(bào)道,作為MLCC(多層陶瓷電容器)行業(yè)的領(lǐng)軍企業(yè),村田制作所于17日發(fā)布了關(guān)于旗下工廠受日本能登半島地震影響的最新公告。在這次地震中,共有13工廠受到了不同程度的影響。
    的頭像 發(fā)表于 01-19 14:39 ?898次閱讀