提起閱讀理解這四個(gè)字,你會(huì)想到什么?
被四六級(jí)雅思托福支配的恐懼?語(yǔ)文試卷上連原作者都搞不懂的選擇題?
不管哪種答案,肯定都逃不出一個(gè)規(guī)律:進(jìn)行閱讀理解這項(xiàng)有益身心運(yùn)動(dòng)的主體,必然是跟你我一樣的人類(lèi)。
畢竟嘛,這東西需要閱讀一大段文字,然后理解了意義之后再做題目,堪稱(chēng)一場(chǎng)考試中最復(fù)雜最費(fèi)腦筋,也最考驗(yàn)綜合能力的一個(gè)環(huán)節(jié)。所以你的英語(yǔ)老師一定說(shuō)過(guò)這樣一句話(huà):得閱讀理解者得天下。
然而,可是,但是,如果告訴你今天得這個(gè)天下的已經(jīng)不再是人類(lèi),而是AI了,你會(huì)怎么想?也許此前我們想象過(guò)單詞聽(tīng)寫(xiě)、句子翻譯甚至寫(xiě)作都可以被AI完成,但是閱讀理解這件事人類(lèi)已經(jīng)被甩在了AI身后,大概很多人都沒(méi)想到。
可事實(shí)就是這樣,近日,斯坦福大學(xué)著名的機(jī)器閱讀理解賽事SQuAD刷新了全球排名,阿里巴巴憑借82.440的精準(zhǔn)率打破了世界紀(jì)錄,超越了人類(lèi)82.304的平均得分。
當(dāng)然了,AI是不會(huì)去跟你比托福刷分的,這件事的背后,腦洞有點(diǎn)大哦…
什么是機(jī)器閱讀理解?
機(jī)器閱讀理解,雖然看起來(lái)只是讓AI上陣來(lái)一場(chǎng)考試。但是卻是自然語(yǔ)言處理技術(shù)中,繼語(yǔ)音判斷、語(yǔ)義理解之后最大的挑戰(zhàn):讓智能體理解全文語(yǔ)境。
而斯坦福大學(xué)發(fā)起的SQuAD挑戰(zhàn)賽,則是業(yè)內(nèi)公認(rèn)的機(jī)器閱讀理解最高水平賽事。
SQuAD挑戰(zhàn)賽的基本規(guī)則,是通過(guò)眾包的方式構(gòu)建一個(gè)包含10萬(wàn)個(gè)問(wèn)題左右的大規(guī)模數(shù)據(jù)集,并給出來(lái)源于維基百科長(zhǎng)度大約在幾百個(gè)單詞左右的文章。參賽者提交的AI模型在閱讀完數(shù)據(jù)集中的一篇短文之后,回答若干個(gè)基于文章內(nèi)容的問(wèn)題,答案與標(biāo)準(zhǔn)答案進(jìn)行比對(duì),最終得出成績(jī)。
由于閱讀理解這項(xiàng)“智能”調(diào)整,需要運(yùn)用到大量邏輯、細(xì)節(jié)和結(jié)構(gòu)分析能力,并且直接作用于現(xiàn)實(shí)中的文本資料,所以實(shí)際價(jià)值很大。
比如說(shuō),我們首先要面對(duì)的問(wèn)題就是,假如人工智能已經(jīng)比人類(lèi)平均水平更擅長(zhǎng)在對(duì)文本中精準(zhǔn)信息進(jìn)行理解和回答,會(huì)帶給我們什么呢?
當(dāng)AI的“閱讀理解”得分超越人類(lèi),意味著什么
舉個(gè)例子或許可以很簡(jiǎn)單的理解這個(gè)問(wèn)題:英語(yǔ)考試上,當(dāng)機(jī)器可以翻譯單詞的時(shí)候,我們一點(diǎn)都不驚奇;但機(jī)器可以聽(tīng)寫(xiě)整句話(huà)的時(shí)候,我們會(huì)感嘆技術(shù)進(jìn)步了;當(dāng)機(jī)器自己做閱讀理解的時(shí)候,我們大概會(huì)想:還要我考這個(gè)試干什么?
這里面的差別,在于處理閱讀理解相關(guān)問(wèn)題時(shí),AI不只是要運(yùn)算和記錄,而是要主動(dòng)去分析和理解,所以閱讀理解問(wèn)題一直被人問(wèn)是NLP的標(biāo)志性臨界點(diǎn)。但這個(gè)點(diǎn)被AI破解,直接意味著很多必須人類(lèi)才能完成的工作已經(jīng)正式能夠被AI接管。
因?yàn)殚喿x理解問(wèn)題,不只是要處理語(yǔ)音和簡(jiǎn)單的語(yǔ)義,而是要理解和關(guān)注詞匯、語(yǔ)句、篇章結(jié)構(gòu)、思維邏輯、輔助語(yǔ)句和關(guān)鍵句等等元素構(gòu)成的復(fù)雜組織網(wǎng)絡(luò)。
機(jī)器閱讀理解“達(dá)標(biāo)”,最直接的產(chǎn)業(yè)影響,是大多數(shù)今天還必須由人工完成的規(guī)則、對(duì)話(huà)、服務(wù)信息類(lèi)的相關(guān)理解工作,都可以被人工智能所取代。比如說(shuō)客服、信息管理和推薦類(lèi)的工作,都可以考慮用不妙不休、高運(yùn)算速度的機(jī)器來(lái)取代。
機(jī)器閱讀理解如何工作
或許我們都注意到了這樣一個(gè)問(wèn)題:今天的互聯(lián)網(wǎng)世界,在變得越來(lái)越多文本內(nèi)容,各種各樣的信息爆炸而來(lái)。太多你知道的、你不知道的、你以為自己知道的卻實(shí)際不知道的事情呼嘯而過(guò)。甚至你雙11想要剁個(gè)手,都有各種各樣的游戲規(guī)則等著你。自己讀吧,太累太痛苦還沒(méi)時(shí)間,問(wèn)客服吧,很可能出錯(cuò)還很慢,簡(jiǎn)直是薛定諤式問(wèn)題。
這里或許就可以用機(jī)器閱讀理解來(lái)解決了。比如客戶(hù)對(duì)某個(gè)電商促銷(xiāo)規(guī)則有疑問(wèn),就可以直接向AI提問(wèn),而AI就可以把這個(gè)問(wèn)題當(dāng)做一道閱讀理解問(wèn)題來(lái)進(jìn)行解決方案回饋。
機(jī)器閱讀理解能力,將在如何向客戶(hù)提供非模板式的智能客服服務(wù)中發(fā)揮作用。而當(dāng)AI在這些能力上超越人工,那么機(jī)器客服的利用價(jià)值將可能快速提升。換句話(huà)說(shuō),機(jī)器客服終于可以不那么機(jī)器了.....
由此不難看出,這種關(guān)鍵能力的標(biāo)桿性突破,對(duì)大量強(qiáng)調(diào)與普通消費(fèi)者交互的產(chǎn)業(yè)線(xiàn)益處最多。
推而廣之,機(jī)器閱讀能力也是文娛領(lǐng)域進(jìn)行內(nèi)容尋找和推薦的有效方式,比如閱讀用戶(hù)提出的復(fù)雜需求,進(jìn)行精準(zhǔn)推薦;與IoT產(chǎn)品相結(jié)合,給出對(duì)用戶(hù)大段語(yǔ)言的回饋,乃至對(duì)話(huà)互動(dòng),都必須以機(jī)器理解能力為依托。
理解力,讓我們?cè)谖磥?lái)面前不僅是個(gè)孩子
除了知道AI可以充當(dāng)更好的客服之外,究竟我們?yōu)槭裁磻?yīng)該關(guān)注機(jī)器閱讀理解這件事?或許關(guān)鍵,是我們應(yīng)該知道“理解力”在目前AI世界中的重要程度和期待指數(shù)。
AI作為一種從計(jì)算機(jī)科學(xué)下的分支,一個(gè)智能體先天具備的是運(yùn)算能力,而希望進(jìn)行仿人類(lèi)智慧的智能模擬,第二步就是模仿人類(lèi)的感知。今天我們看到的機(jī)器視覺(jué)、語(yǔ)音識(shí)別、語(yǔ)義理解,都是在做這件事。而第三步,就是讓AI產(chǎn)生理解力。
顯然,識(shí)別有著龐大的應(yīng)用場(chǎng)景,并會(huì)在接下來(lái)很長(zhǎng)一段時(shí)間內(nèi)占據(jù)主流。但是AI的理解能力是大多數(shù)識(shí)別能力的進(jìn)化,假如單純的識(shí)別出卻無(wú)法產(chǎn)生輸出,那么AI無(wú)非是更靈活的傳感器而已。
從這個(gè)邏輯上看,閱讀理解這道題絕不僅僅是個(gè)測(cè)試,或者商業(yè)應(yīng)用的技術(shù)加持,更重要的是開(kāi)啟AI紀(jì)元里理解力的加速器。
更廣闊的意義在于,我們或許距離永遠(yuǎn)不用測(cè)試機(jī)器閱讀理解更近了一步。當(dāng)我們不再考慮機(jī)器是否能理解人類(lèi)文本和語(yǔ)言,那么DeepNLP將可能達(dá)成,人機(jī)交互的范圍將級(jí)擴(kuò)大。機(jī)器智能可以開(kāi)始捕捉人類(lèi)的邏輯和函指。
可能那還很遠(yuǎn),也可能很近,但機(jī)器理解力讓我們?cè)谖磥?lái)面前不止是個(gè)孩子,應(yīng)該是毫無(wú)疑問(wèn)的。
-
AI
+關(guān)注
關(guān)注
87文章
30898瀏覽量
269129 -
人工智能
+關(guān)注
關(guān)注
1791文章
47282瀏覽量
238534
原文標(biāo)題:AI不會(huì)主動(dòng)思考?他做閱讀題已經(jīng)比你厲害了
文章出處:【微信號(hào):gh_211d74f707ff,微信公眾號(hào):重慶人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論