0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器閱讀理解的含義以及如何工作

KIyT_gh_211d74f ? 2018-01-16 13:47 ? 次閱讀

提起閱讀理解這四個(gè)字,你會(huì)想到什么?

被四六級(jí)雅思托福支配的恐懼?語(yǔ)文試卷上連原作者都搞不懂的選擇題?

不管哪種答案,肯定都逃不出一個(gè)規(guī)律:進(jìn)行閱讀理解這項(xiàng)有益身心運(yùn)動(dòng)的主體,必然是跟你我一樣的人類(lèi)。

畢竟嘛,這東西需要閱讀一大段文字,然后理解了意義之后再做題目,堪稱(chēng)一場(chǎng)考試中最復(fù)雜最費(fèi)腦筋,也最考驗(yàn)綜合能力的一個(gè)環(huán)節(jié)。所以你的英語(yǔ)老師一定說(shuō)過(guò)這樣一句話(huà):得閱讀理解者得天下。

然而,可是,但是,如果告訴你今天得這個(gè)天下的已經(jīng)不再是人類(lèi),而是AI了,你會(huì)怎么想?也許此前我們想象過(guò)單詞聽(tīng)寫(xiě)、句子翻譯甚至寫(xiě)作都可以被AI完成,但是閱讀理解這件事人類(lèi)已經(jīng)被甩在了AI身后,大概很多人都沒(méi)想到。

可事實(shí)就是這樣,近日,斯坦福大學(xué)著名的機(jī)器閱讀理解賽事SQuAD刷新了全球排名,阿里巴巴憑借82.440的精準(zhǔn)率打破了世界紀(jì)錄,超越了人類(lèi)82.304的平均得分。

當(dāng)然了,AI是不會(huì)去跟你比托福刷分的,這件事的背后,腦洞有點(diǎn)大哦…

什么是機(jī)器閱讀理解?

機(jī)器閱讀理解,雖然看起來(lái)只是讓AI上陣來(lái)一場(chǎng)考試。但是卻是自然語(yǔ)言處理技術(shù)中,繼語(yǔ)音判斷、語(yǔ)義理解之后最大的挑戰(zhàn):讓智能體理解全文語(yǔ)境。

而斯坦福大學(xué)發(fā)起的SQuAD挑戰(zhàn)賽,則是業(yè)內(nèi)公認(rèn)的機(jī)器閱讀理解最高水平賽事。

SQuAD挑戰(zhàn)賽的基本規(guī)則,是通過(guò)眾包的方式構(gòu)建一個(gè)包含10萬(wàn)個(gè)問(wèn)題左右的大規(guī)模數(shù)據(jù)集,并給出來(lái)源于維基百科長(zhǎng)度大約在幾百個(gè)單詞左右的文章。參賽者提交的AI模型在閱讀完數(shù)據(jù)集中的一篇短文之后,回答若干個(gè)基于文章內(nèi)容的問(wèn)題,答案與標(biāo)準(zhǔn)答案進(jìn)行比對(duì),最終得出成績(jī)。

由于閱讀理解這項(xiàng)“智能”調(diào)整,需要運(yùn)用到大量邏輯、細(xì)節(jié)和結(jié)構(gòu)分析能力,并且直接作用于現(xiàn)實(shí)中的文本資料,所以實(shí)際價(jià)值很大。

比如說(shuō),我們首先要面對(duì)的問(wèn)題就是,假如人工智能已經(jīng)比人類(lèi)平均水平更擅長(zhǎng)在對(duì)文本中精準(zhǔn)信息進(jìn)行理解和回答,會(huì)帶給我們什么呢?

當(dāng)AI的“閱讀理解”得分超越人類(lèi),意味著什么

舉個(gè)例子或許可以很簡(jiǎn)單的理解這個(gè)問(wèn)題:英語(yǔ)考試上,當(dāng)機(jī)器可以翻譯單詞的時(shí)候,我們一點(diǎn)都不驚奇;但機(jī)器可以聽(tīng)寫(xiě)整句話(huà)的時(shí)候,我們會(huì)感嘆技術(shù)進(jìn)步了;當(dāng)機(jī)器自己做閱讀理解的時(shí)候,我們大概會(huì)想:還要我考這個(gè)試干什么?

這里面的差別,在于處理閱讀理解相關(guān)問(wèn)題時(shí),AI不只是要運(yùn)算和記錄,而是要主動(dòng)去分析和理解,所以閱讀理解問(wèn)題一直被人問(wèn)是NLP的標(biāo)志性臨界點(diǎn)。但這個(gè)點(diǎn)被AI破解,直接意味著很多必須人類(lèi)才能完成的工作已經(jīng)正式能夠被AI接管。

因?yàn)殚喿x理解問(wèn)題,不只是要處理語(yǔ)音和簡(jiǎn)單的語(yǔ)義,而是要理解和關(guān)注詞匯、語(yǔ)句、篇章結(jié)構(gòu)、思維邏輯、輔助語(yǔ)句和關(guān)鍵句等等元素構(gòu)成的復(fù)雜組織網(wǎng)絡(luò)

機(jī)器閱讀理解“達(dá)標(biāo)”,最直接的產(chǎn)業(yè)影響,是大多數(shù)今天還必須由人工完成的規(guī)則、對(duì)話(huà)、服務(wù)信息類(lèi)的相關(guān)理解工作,都可以被人工智能所取代。比如說(shuō)客服、信息管理和推薦類(lèi)的工作,都可以考慮用不妙不休、高運(yùn)算速度的機(jī)器來(lái)取代。

機(jī)器閱讀理解如何工作

或許我們都注意到了這樣一個(gè)問(wèn)題:今天的互聯(lián)網(wǎng)世界,在變得越來(lái)越多文本內(nèi)容,各種各樣的信息爆炸而來(lái)。太多你知道的、你不知道的、你以為自己知道的卻實(shí)際不知道的事情呼嘯而過(guò)。甚至你雙11想要剁個(gè)手,都有各種各樣的游戲規(guī)則等著你。自己讀吧,太累太痛苦還沒(méi)時(shí)間,問(wèn)客服吧,很可能出錯(cuò)還很慢,簡(jiǎn)直是薛定諤式問(wèn)題。

這里或許就可以用機(jī)器閱讀理解來(lái)解決了。比如客戶(hù)對(duì)某個(gè)電商促銷(xiāo)規(guī)則有疑問(wèn),就可以直接向AI提問(wèn),而AI就可以把這個(gè)問(wèn)題當(dāng)做一道閱讀理解問(wèn)題來(lái)進(jìn)行解決方案回饋。

機(jī)器閱讀理解能力,將在如何向客戶(hù)提供非模板式的智能客服服務(wù)中發(fā)揮作用。而當(dāng)AI在這些能力上超越人工,那么機(jī)器客服的利用價(jià)值將可能快速提升。換句話(huà)說(shuō),機(jī)器客服終于可以不那么機(jī)器了.....

由此不難看出,這種關(guān)鍵能力的標(biāo)桿性突破,對(duì)大量強(qiáng)調(diào)與普通消費(fèi)者交互的產(chǎn)業(yè)線(xiàn)益處最多。

推而廣之,機(jī)器閱讀能力也是文娛領(lǐng)域進(jìn)行內(nèi)容尋找和推薦的有效方式,比如閱讀用戶(hù)提出的復(fù)雜需求,進(jìn)行精準(zhǔn)推薦;與IoT產(chǎn)品相結(jié)合,給出對(duì)用戶(hù)大段語(yǔ)言的回饋,乃至對(duì)話(huà)互動(dòng),都必須以機(jī)器理解能力為依托。

理解力,讓我們?cè)谖磥?lái)面前不僅是個(gè)孩子

除了知道AI可以充當(dāng)更好的客服之外,究竟我們?yōu)槭裁磻?yīng)該關(guān)注機(jī)器閱讀理解這件事?或許關(guān)鍵,是我們應(yīng)該知道“理解力”在目前AI世界中的重要程度和期待指數(shù)。

AI作為一種從計(jì)算機(jī)科學(xué)下的分支,一個(gè)智能體先天具備的是運(yùn)算能力,而希望進(jìn)行仿人類(lèi)智慧的智能模擬,第二步就是模仿人類(lèi)的感知。今天我們看到的機(jī)器視覺(jué)語(yǔ)音識(shí)別、語(yǔ)義理解,都是在做這件事。而第三步,就是讓AI產(chǎn)生理解力。

顯然,識(shí)別有著龐大的應(yīng)用場(chǎng)景,并會(huì)在接下來(lái)很長(zhǎng)一段時(shí)間內(nèi)占據(jù)主流。但是AI的理解能力是大多數(shù)識(shí)別能力的進(jìn)化,假如單純的識(shí)別出卻無(wú)法產(chǎn)生輸出,那么AI無(wú)非是更靈活的傳感器而已。

從這個(gè)邏輯上看,閱讀理解這道題絕不僅僅是個(gè)測(cè)試,或者商業(yè)應(yīng)用的技術(shù)加持,更重要的是開(kāi)啟AI紀(jì)元里理解力的加速器。

更廣闊的意義在于,我們或許距離永遠(yuǎn)不用測(cè)試機(jī)器閱讀理解更近了一步。當(dāng)我們不再考慮機(jī)器是否能理解人類(lèi)文本和語(yǔ)言,那么DeepNLP將可能達(dá)成,人機(jī)交互的范圍將級(jí)擴(kuò)大。機(jī)器智能可以開(kāi)始捕捉人類(lèi)的邏輯和函指。

可能那還很遠(yuǎn),也可能很近,但機(jī)器理解力讓我們?cè)谖磥?lái)面前不止是個(gè)孩子,應(yīng)該是毫無(wú)疑問(wèn)的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30898

    瀏覽量

    269129
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47282

    瀏覽量

    238534

原文標(biāo)題:AI不會(huì)主動(dòng)思考?他做閱讀題已經(jīng)比你厲害了

文章出處:【微信號(hào):gh_211d74f707ff,微信公眾號(hào):重慶人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于機(jī)器翻譯增加的跨語(yǔ)言機(jī)器閱讀理解算法

    近日,阿里云人工智能平臺(tái) PAI 與華南理工大學(xué)朱金輝教授團(tuán)隊(duì)、達(dá)摩院自然語(yǔ)言處理團(tuán)隊(duì)合作在自然語(yǔ)言處理頂級(jí)會(huì)議 EMNLP2023 上發(fā)表基于機(jī)器翻譯增加的跨語(yǔ)言機(jī)器閱讀理解算法 X
    的頭像 發(fā)表于 12-12 10:28 ?591次閱讀
    基于<b class='flag-5'>機(jī)器</b>翻譯增加的跨語(yǔ)言<b class='flag-5'>機(jī)器</b><b class='flag-5'>閱讀</b><b class='flag-5'>理解</b>算法

    【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 俯瞰全書(shū)

    上周收到《大語(yǔ)言模型應(yīng)用指南》一書(shū),非常高興,但工作項(xiàng)目繁忙,今天才品鑒體驗(yàn),感謝作者編寫(xiě)了一部?jī)?nèi)容豐富、理論應(yīng)用相結(jié)合、印刷精美的著作,也感謝電子發(fā)燒友論壇提供了一個(gè)讓我了解大語(yǔ)言模型和機(jī)器學(xué)習(xí)
    發(fā)表于 07-21 13:35

    機(jī)器人視覺(jué)——機(jī)器人的“眼睛”

    響應(yīng)市場(chǎng)要求,加強(qiáng)在國(guó)際市場(chǎng)的競(jìng)爭(zhēng)能力。 視覺(jué)是人類(lèi)獲取信息最重要的來(lái)源。人看到一幅圖像,馬上能夠理解圖像的內(nèi)容和含義。然而,機(jī)器視覺(jué)并非易事?,F(xiàn)有的機(jī)器人主要還是以壓力傳感器、位置傳
    發(fā)表于 01-23 15:02

    嵌入式的含義以及應(yīng)用

    本次課程,老師主要講述了“嵌入式”的含義以及應(yīng)用。老師總結(jié)說(shuō),嵌入式是在已有的硬件上移植操作系統(tǒng);在操作系統(tǒng)上做上層應(yīng)用開(kāi)發(fā),在操作系統(tǒng)之下做底層開(kāi)發(fā)。按照我的理解來(lái)說(shuō),嵌入式是對(duì)軟件和硬件之間
    發(fā)表于 11-08 07:07

    STM32變量的存儲(chǔ)和堆棧含義理解

    變量如上圖,這是在KEIL下生成的map文件的最后幾行。來(lái)理解一下這幾個(gè)含義,RO:只讀,RW:讀寫(xiě),ROM:這個(gè)不用解釋?zhuān)碳鎯?chǔ)。那么接下的就更好理解了:Code:編譯代碼段大小;RO Data
    發(fā)表于 01-20 06:04

    機(jī)器閱讀理解領(lǐng)域頂級(jí)賽事SQuAD刷新排名,阿里打破世界紀(jì)錄

    1月13日下午消息,兩天前,由斯坦福大學(xué)發(fā)起的機(jī)器閱讀理解領(lǐng)域頂級(jí)賽事SQuAD刷新了排名,AI的閱讀能力歷史上首次超越人類(lèi)。阿里巴巴稱(chēng),其憑借82.440的精準(zhǔn)率打破了世界紀(jì)錄,并且
    發(fā)表于 01-14 05:58 ?2453次閱讀

    剝開(kāi)機(jī)器閱讀理解的神秘外衣

    所謂的機(jī)器閱讀理解,基本概念跟咱們上學(xué)時(shí)做的閱讀理解題很相似,同樣都是給出一段材料和問(wèn)題,讓“考生”給出正確答案。所不同的,僅僅是
    發(fā)表于 03-19 18:47 ?758次閱讀
    剝開(kāi)<b class='flag-5'>機(jī)器</b><b class='flag-5'>閱讀</b><b class='flag-5'>理解</b>的神秘外衣

    小i機(jī)器人在國(guó)際權(quán)威機(jī)器閱讀理解評(píng)測(cè)SQuAD1.1挑戰(zhàn)賽中排名全球第三

    憑借最新研究成果——BERT+WWM+MT的單模型,在由斯坦福大學(xué)發(fā)起的國(guó)際權(quán)威機(jī)器閱讀理解評(píng)測(cè)SQuAD1.1挑戰(zhàn)賽中排名全球第三,超越人類(lèi)平均水平。不同于前兩名企業(yè)+學(xué)校的聯(lián)合模式,小i完全是由研究院團(tuán)隊(duì)獨(dú)立完成;
    的頭像 發(fā)表于 09-01 09:04 ?3636次閱讀

    深度學(xué)習(xí)與機(jī)器閱讀

    隨后,以傳統(tǒng)機(jī)器閱讀的方法作為引入,引出了深度學(xué)習(xí)的方法。先介紹了機(jī)器閱讀的主要步驟:文本表示(將文本表示成機(jī)器
    的頭像 發(fā)表于 09-20 16:01 ?3343次閱讀

    會(huì)話(huà)式機(jī)器閱讀理解概述

    1 會(huì)話(huà)式機(jī)器閱讀理解是什么? 如何在會(huì)話(huà)式閱讀理解里面能夠建模它的implicative reasoning,即如何去學(xué)習(xí)會(huì)話(huà)與
    的頭像 發(fā)表于 11-25 16:07 ?2296次閱讀

    總線(xiàn)、接口以及協(xié)議的含義

    在介紹AXI之前,先簡(jiǎn)單說(shuō)一下總線(xiàn)、接口以及協(xié)議的含義。總線(xiàn)、接口和協(xié)議,這三個(gè)詞常常被聯(lián)系在一起,但是我們心里要明白他們的區(qū)別。
    的頭像 發(fā)表于 02-08 11:38 ?7698次閱讀
    總線(xiàn)、接口<b class='flag-5'>以及</b>協(xié)議的<b class='flag-5'>含義</b>

    一種基于多任務(wù)聯(lián)合訓(xùn)練的閱讀理解模型

    機(jī)器閱讀理解是一項(xiàng)針對(duì)給定文本和特定問(wèn)題自動(dòng)生成或抽取相應(yīng)答案的問(wèn)答任務(wù),該任務(wù)是評(píng)估計(jì)機(jī)系統(tǒng)對(duì)自然語(yǔ)言理解程度的重要任務(wù)之一。相比于傳統(tǒng)的閱讀
    發(fā)表于 03-16 11:41 ?10次下載
    一種基于多任務(wù)聯(lián)合訓(xùn)練的<b class='flag-5'>閱讀</b><b class='flag-5'>理解</b>模型

    如何使用計(jì)算機(jī)讓機(jī)器理解人類(lèi)語(yǔ)言以及含義

    和文化背景的復(fù)雜性,讓機(jī)器很難理解和解釋客戶(hù)提供的觀點(diǎn)性數(shù)據(jù),因此提取見(jiàn)解極具挑戰(zhàn)性。自然語(yǔ)言處理(NLP)和機(jī)器學(xué)習(xí)(ML)等工具使計(jì)算機(jī)能夠理解人類(lèi)語(yǔ)言
    的頭像 發(fā)表于 05-17 16:19 ?3264次閱讀

    機(jī)器閱讀理解:人工智能技術(shù)的重要分支之一

    機(jī)器閱讀理解是近期自然語(yǔ)言處理領(lǐng)域的研究熱點(diǎn)之一,更是人工智能在處理和理解人類(lèi)語(yǔ)言進(jìn)程中的一個(gè)長(zhǎng)期目標(biāo)。
    發(fā)表于 06-22 09:51 ?2641次閱讀

    面向文本多片段答案的抽取式閱讀理解模式

    面向文本多片段答案的抽取式閱讀理解模式
    發(fā)表于 06-24 16:35 ?6次下載