0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能在模仿人類的道路上學(xué)到了偷懶

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-06-15 15:41 ? 次閱讀

人工智能在模仿人類的道路上,Get 到了一項(xiàng)精髓 —— 偷懶。

2018 年 4 月,OpenAI 公司舉辦了首屆針對(duì) AI 的強(qiáng)化學(xué)習(xí)競(jìng)賽。這場(chǎng)比賽讓 AI 們來玩 NES 平臺(tái)上的《刺猬索尼克》單機(jī)游戲。舉辦方希望 AI 能夠在學(xué)習(xí)游戲技巧之后,能夠擁有在其他地圖上自覺找到最佳通關(guān)方法的能力,以此來評(píng)估強(qiáng)化算法的泛化能力。

結(jié)果 AI 好像對(duì)游戲有著一套自己的理解,它們繞過研究員預(yù)期的目標(biāo)和設(shè)定,通過不斷 “卡 Bug” 的方式找到了通關(guān)的 “捷徑”。

谷歌 DeepMind AI 項(xiàng)目的研究人員維多利亞?克拉科夫納(Victoria Krakovna)在其他游戲中也發(fā)現(xiàn)了這種現(xiàn)象。在《海岸賽艇》里,AI 操縱的船只為了獲得更高分?jǐn)?shù),不斷利用 Bug 來撞擊獎(jiǎng)勵(lì)而忘了要抵達(dá)終點(diǎn)。甚至在玩《俄羅斯方塊》這種小游戲時(shí),AI 也找到了終極密碼:只要游戲暫停就永不會(huì)輸……

在最后,OpenAI 的強(qiáng)化學(xué)習(xí)競(jìng)賽雖然沒有認(rèn)可 “走捷徑” 獲勝的 AI,但研究人員還是認(rèn)為:“AI 展示了它如何在沒有人類介入的情況下贏得游戲勝利,出乎意料并極富有創(chuàng)造性,這可能完全顛覆人類對(duì)游戲如何運(yùn)行的理解?!?/p>

AI 是如何學(xué)會(huì)走捷徑的?

針對(duì)這一現(xiàn)象,北京大學(xué)王選計(jì)算機(jī)研究所和北京大學(xué)計(jì)算語言學(xué)教育部重點(diǎn)實(shí)驗(yàn)室的研究團(tuán)隊(duì)在 arXiv 上發(fā)表了研究論文《為什么機(jī)器閱讀理解模型學(xué)會(huì)走捷徑》 (Why Machine Reading Comprehension Models Learn Shortcuts)。

機(jī)器閱讀理解(Machine Reading Comprehension, MRC)為自然語言處理(NLP)的核心任務(wù)之一,也是評(píng)價(jià)模型理解文本能力的重要指標(biāo),可以將其視為一種句子關(guān)系匹配任務(wù)。通常任務(wù)是讓機(jī)器閱讀給定的一篇文章并回答關(guān)于該文章的一個(gè)問題。其常見任務(wù)形式有四種:完形填空、多想選擇、片段抽取和自由作答。

完形填空即將文章中的某些單詞隱去,讓模型根據(jù)上下文判斷被隱去的單詞最可能是哪個(gè);多項(xiàng)選擇是指讓模型從多個(gè)備選答案中選擇一個(gè)最有可能是正確答案的選項(xiàng);片段抽取是讓模型從文章中抽取連續(xù)的單詞序列;自由作答則是讓模型自主生成一個(gè)單詞序列,使之作為問題的答案,與片段抽取任務(wù)不同,自由作答的序列并不局限于文章中給定的句子。

論文中提到,許多 MRC 模型繞過了常規(guī)的推理路徑,通過 “走捷徑” 給出了出人意料的答案。但這些答案往往無法真正解決問題,無法幫助人類達(dá)到預(yù)期目標(biāo)。為了解決這一問題,該團(tuán)隊(duì)將關(guān)注點(diǎn)聚焦在為什么這些算法模型學(xué)會(huì)了 “走捷徑”。

研究者認(rèn)為,訓(xùn)練數(shù)據(jù)庫中的大量 “捷徑” 問題是導(dǎo)致模型過渡依賴 “偷懶行為” 的 “罪魁禍?zhǔn)住薄?/p>

北大研究者設(shè)計(jì)了一個(gè)經(jīng)過標(biāo)注的全新數(shù)據(jù)集,在這個(gè)數(shù)據(jù)集中,每個(gè)問題都會(huì)有 “捷徑式” 和 “挑戰(zhàn)式” 兩個(gè)版本的答案。他們還進(jìn)一步提出了兩種新的研究方法來量化分析在 “捷徑模式” 和 “挑戰(zhàn)模式” 下學(xué)習(xí)的難易程度,并試圖揭示在這兩種不同模式下的固有學(xué)習(xí)機(jī)制。

研究人員將能夠 “釋義”( Paraphrasing )作為更為復(fù)雜和高級(jí)的答案標(biāo)準(zhǔn),將那些只有關(guān)鍵字提取而沒有任何上下文理解和推理的答案定義為 “捷徑” 版答案。

研究人員發(fā)現(xiàn),在訓(xùn)練數(shù)據(jù)集中高占比的 “捷徑模式” 數(shù)據(jù)使得模型更加依賴 “偷懶”,致使其之后的訓(xùn)練中無法提升更為復(fù)雜的推理技巧,阻礙了模型去學(xué)習(xí) “釋義” 過程由此解決更具挑戰(zhàn)性的問題。文章表明,如果訓(xùn)練集中 “挑戰(zhàn)版” 問題足夠多的話,算法模型不但能吸收 “挑戰(zhàn)版” 問題,同時(shí)還能正確回答 “捷徑版” 的問題。

論文表示,在早期階段,模型通常會(huì)用最簡(jiǎn)單的方法來擬合訓(xùn)練數(shù)據(jù)?!白呓輳健?所消耗的資源最少,因此這種路徑會(huì)成為優(yōu)先選項(xiàng)。當(dāng)模型發(fā)現(xiàn) “偷懶” 可以解決大部分問題時(shí),其余問題便無法再激勵(lì) AI 去探索更為復(fù)雜的解決方法。

研究者認(rèn)為,導(dǎo)致 AI 習(xí)慣性偷懶的原因,除了 NLP 架構(gòu)的設(shè)計(jì)問題之外,也有可能是訓(xùn)練過程中標(biāo)準(zhǔn)優(yōu)化和資源保護(hù)的結(jié)果,此外,讓 AI 在有限時(shí)間內(nèi)迅速輸出答案也會(huì)使給其造成 “壓力”。

因此,人們可以通過修改 NLP 架構(gòu),讓 AI 優(yōu)先考慮更具挑戰(zhàn)的數(shù)據(jù)和問題,并且再數(shù)據(jù)預(yù)處理領(lǐng)域也需要將數(shù)據(jù)中的 “捷徑” 考慮進(jìn)去。

原文標(biāo)題:AI竟也學(xué)會(huì)偷懶?北大團(tuán)隊(duì):數(shù)據(jù)集“走捷徑”問題占比太高

文章出處:【微信公眾號(hào):DeepTech深科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30998

    瀏覽量

    269304
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47352

    瀏覽量

    238774

原文標(biāo)題:AI竟也學(xué)會(huì)偷懶?北大團(tuán)隊(duì):數(shù)據(jù)集“走捷徑”問題占比太高

文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    嵌入式和人工智能究竟是什么關(guān)系?

    領(lǐng)域,如工業(yè)控制、智能家居、醫(yī)療設(shè)備等。 人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它研究如何使計(jì)算機(jī)具備像人類一樣思考、學(xué)習(xí)、推理和決策的能力。人工智能的發(fā)展歷程可以追溯到上世紀(jì)50年代,經(jīng)
    發(fā)表于 11-14 16:39

    人工智能在智慧城市建設(shè)中的應(yīng)用

    傳感器和智能控制算法實(shí)時(shí)收集和分析交通數(shù)據(jù),實(shí)現(xiàn)智能信號(hào)控制,提高道路通行效率。 無人駕駛技術(shù) 結(jié)合智能車輛和無人駕駛技術(shù),人工智能可以實(shí)時(shí)
    的頭像 發(fā)表于 10-24 16:15 ?1298次閱讀

    人工智能對(duì)人類的影響有哪些

    人工智能(AI)作為現(xiàn)代科技的杰出代表,正在以前所未有的速度改變著人類的生活、工作和社會(huì)結(jié)構(gòu)。這種影響是全方位的,既帶來了顯著的積極變化,也伴隨著一系列挑戰(zhàn)和問題。 一、積極影響 工作變革與經(jīng)濟(jì)增長(zhǎng)
    的頭像 發(fā)表于 10-22 17:23 ?1968次閱讀

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書,特此來分享。感謝平臺(tái),感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細(xì)
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    農(nóng)業(yè)、環(huán)保等,為人類社會(huì)的可持續(xù)發(fā)展做出貢獻(xiàn)。 總結(jié) 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們展示了一個(gè)充滿希望和機(jī)遇的未來。在這個(gè)未來中,人工智能
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    ,無疑為讀者鋪設(shè)了一條探索人工智能(AI)如何深刻影響并推動(dòng)科學(xué)創(chuàng)新的道路。在閱讀這一章后,我深刻感受到了人工智能技術(shù)在科學(xué)領(lǐng)域的廣泛應(yīng)用潛力以及其帶來的革命性變化,以下是我個(gè)人的學(xué)習(xí)
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V在人工智能圖像處理領(lǐng)域的應(yīng)用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點(diǎn)。以下是對(duì)RISC-V在人工智能圖像處理應(yīng)用前景的詳細(xì)分析: 一、RISC-V的基本特點(diǎn) RISC-V
    發(fā)表于 09-28 11:00

    光庭信息在人工智能領(lǐng)域的最新成就

    光庭信息成功舉辦了AI DAY嘉年華,其間首次發(fā)布了最新研發(fā)的汽車軟件研發(fā)和管理智能平臺(tái)——Aily。此次活動(dòng)不僅彰顯了光庭在人工智能領(lǐng)域的最新成就,也標(biāo)志著公司在汽車軟件開發(fā)智能道路上
    的頭像 發(fā)表于 09-20 10:16 ?526次閱讀

    生成式人工智能在教育中的應(yīng)用

    生成式人工智能在教育中的應(yīng)用日益廣泛,為教育領(lǐng)域帶來了諸多變革和創(chuàng)新。以下是對(duì)生成式人工智能在教育中的幾個(gè)主要應(yīng)用方面的詳細(xì)闡述:
    的頭像 發(fā)表于 09-16 16:07 ?1141次閱讀

    人工智能ai4s試讀申請(qǐng)

    目前人工智能在繪畫對(duì)話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題,本書對(duì)ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會(huì)材料??茨芊裼兄谌腴T和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    材料基因組工程的推動(dòng)下,人工智能如何與材料科學(xué)結(jié)合,加快傳統(tǒng)材料和新型材料的開發(fā)過程。 第4章介紹了人工智能在加快藥物研發(fā)、輔助基因研究方面及在合成生物學(xué)中的普遍應(yīng)用。 第5章介紹了人工智能如何在提高
    發(fā)表于 09-09 13:54

    報(bào)名開啟!深圳(國(guó)際)通用人工智能大會(huì)將啟幕,國(guó)內(nèi)外大咖齊聚話AI

    ,得到了華為、騰訊、優(yōu)必選、中煤科工、中國(guó)聯(lián)通、云天勵(lì)飛、考拉悠然、智航、力維智聯(lián)等國(guó)內(nèi)人工智能企業(yè)的深度參與和大力支持。 報(bào)名后即可到現(xiàn)場(chǎng)領(lǐng)取禮品,總計(jì)5000份,先到先選! 點(diǎn)擊報(bào)名:https://bbs.elecfans.com/jishu_2447254_1
    發(fā)表于 08-22 15:00

    AI人工智能在新能源領(lǐng)域的創(chuàng)新應(yīng)用

    AI人工智能在新能源領(lǐng)域的應(yīng)用不僅推動(dòng)了技術(shù)的創(chuàng)新和發(fā)展,還促進(jìn)了整個(gè)汽車產(chǎn)業(yè)的綠色轉(zhuǎn)型和可持續(xù)發(fā)展。未來,隨著技術(shù)的不斷進(jìn)步和應(yīng)用的深化,AI將在新能源領(lǐng)域發(fā)揮更加重要的作用,為人類社會(huì)創(chuàng)造更加美好的明天。
    的頭像 發(fā)表于 07-21 09:50 ?868次閱讀

    人工智能在軍事方面的應(yīng)用

    智慧華盛恒輝人工智能在軍事方面的應(yīng)用廣泛且深入,主要包括以下幾個(gè)方面: 智慧華盛恒輝一、作戰(zhàn)效能提升 自動(dòng)目標(biāo)識(shí)別與跟蹤: 人工智能系統(tǒng)能夠在復(fù)雜環(huán)境中準(zhǔn)確識(shí)別和跟蹤目標(biāo),提高作戰(zhàn)效率。利用圖像識(shí)別
    的頭像 發(fā)表于 07-16 09:52 ?597次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時(shí)代背景下,嵌入式人工智能成為國(guó)家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。同時(shí)在此背景驅(qū)動(dòng)下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17