0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種新型的機器學習算法剛剛攻克了一些對人工智能來說非常困難的電子游戲

IEEE電氣電子工程師 ? 來源:lq ? 2018-12-04 10:14 ? 次閱讀

在蒙特祖瑪?shù)膹统穑∕ontezuma's Revenge)和瑪雅人的冒險(Pitfall!)這兩款游戲里,如果有一個算法能記住游戲里的探索過程,那么這個算法就能幫助計算機和機器人更好地學習和適應真實世界。

由懷俄明大學的副教授 Jeff Clune 領導,來自優(yōu)步在舊金山的人工智能研究團隊,提供了一種新型的機器學習算法剛剛攻克了一些對人工智能來說非常困難的電子游戲。

(圖片來源:麻省理工科技評論)

熟悉的人知道,人工智能算法已經在古老、優(yōu)雅的策略游戲——圍棋中擊敗了世界上最優(yōu)秀的人類選手,圍棋已經是是可以想象到的最困難的游戲之一。但是,來自上個世紀的 8 位計算機游戲時代的兩個經典像素游戲——蒙特祖瑪?shù)膹统鸷同斞湃说拿半U,一直困擾著人工智能研究人員。

這看似矛盾的背后其實是有原因的。蒙特祖瑪?shù)膹统鸷同斞湃说拿半U雖然看似簡單,但對本來就擅長征服電子游戲的強化學習來說仍是一大挑戰(zhàn)。DeepMind 是谷歌母公司 Alphabet 的子公司,專注于人工智能領域,以其算法能夠以專業(yè)玩家的水準來學習幾個經典的電子游戲的而著名。強化學習算法在大多數(shù)游戲里效果都不錯,因為它們可以根據(jù)正反饋(得分升高)調整他們的行為。強化學習的成功使人們產生了希望,認為人工智能算法可以自己教會自己做各種有用的事情,而這目前對機器來說是不可能做到的。

蒙特祖瑪?shù)膹统鸷同斞湃说拿半U的問題是所需要的獎勵(rewards)信號很少。兩個游戲都涉及典型場景:主角要探索充滿致命生物和陷阱的方塊世界,在游戲中許多所必需的行為都無助于提高分數(shù),只在長時間完成特定的一系列動作之后才會收到獎勵信號。普通的強化學習算法甚至過不去蒙特祖瑪?shù)膹统鸷同斞湃说拿半U的第一關,他們得分完全為零。

但是來自優(yōu)步在舊金山的人工智能研究團隊的算法,在一個給算法提供線索很少的環(huán)境中展示了一種完全不同的機器學習方法。這種方法引出了一些有趣的實際應用,Clune 和他的團隊在 11 月 26 日發(fā)布的博客文章中寫道,這可能可以應用在機器人學習中。這是因為未來的機器人需要弄清楚在一個只提供較少的獎勵的復雜的環(huán)境中應該做些什么。

Uber 于 2016 年 12 月建立人工智能實驗室,其目標是實現(xiàn)可能對其業(yè)務有用的基礎性突破。更好的強化學習算法最終可用于自動駕駛和優(yōu)化車輛路線等項目上。

很多人工智能研究人員經常通過指導強化學習算法不定時隨機探索、同時為探索過程增加獎勵——也就是所謂的”內在動機”(intrinsic motivation), 來試圖解決蒙特祖瑪?shù)膹统鹋c瑪雅人的冒險遇到的問題。

但 Uber 的研究人員認為,這種方法忽略了人類探索好奇心的一個重要角度?!拔覀冋J為目前的”內在動機”算法的一個主要弱點是 detachment,”他們寫道,“算法忘記了他們訪問過的有價值的區(qū)域,他們不會回到那些區(qū)域,看看是否會產生新的狀態(tài)?!?/p>

該團隊設計了新的強化學習算法,稱為 Go-Explore,這種算法可以記住之前的狀態(tài),并會在隨后返回特定區(qū)域或重復特定任務,看看這樣做是否會使效果變好。研究人員還發(fā)現(xiàn),通過讓人類玩家突出有趣或重要的區(qū)域來增加一些領域信息時,可以大大加快算法的學習過程。這一過程非常重要,因為在真實環(huán)境中,有很多情況是需要算法和人一起工作來解決一項艱巨的任務的。

他們的算法在蒙特祖瑪?shù)膹统鹬衅骄梅譃?400,000 分——比人類玩家的平均值高出一個數(shù)量級。在瑪雅人的冒險游戲中,平均得分為 21,000,同樣遠遠超過大多數(shù)人類玩家。

“這些結果令人印象深刻,”研究強化學習的斯坦福大學助理教授 Emma Brunskill 說,“令人驚訝和興奮的是,這些算法產生了如此巨大的優(yōu)勢?!?/p>

其他人工智能研究人員也一直在努力攻克這些電子游戲。10 月,舊金山的非營利組織——OpenAI 的一個團隊,展示了一種能夠在蒙特祖瑪?shù)膹统鹩螒蛑腥〉弥卮筮M展的算法。

就在最近,斯坦福大學的 Brunskill 小組在瑪雅人的冒險游戲方面也取得了一些的進展,他們使用的方法與 Uber 團隊類似。

現(xiàn)在人工智能算法可以解決這些視頻游戲,真正的挑戰(zhàn)是從街機游戲中脫離出來,解決現(xiàn)實問題。

Brunskill 同意這種算法可能對機器人技術產生重大影響。但是她表示,在其他現(xiàn)實世界的情況中,特別是那些涉及人類行為建模的情況,要遠遠困難得多?!跋肟纯催@種方法對于更復雜的環(huán)境表現(xiàn)的如何,這將非常有趣,”她說。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28560

    瀏覽量

    207697
  • 算法
    +關注

    關注

    23

    文章

    4624

    瀏覽量

    93110
  • 機器學習
    +關注

    關注

    66

    文章

    8428

    瀏覽量

    132839

原文標題:Uber公司設計新型AI算法,有望對機器人工作產生巨大影響

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【「具身智能機器人系統(tǒng)」閱讀體驗】1.全書概覽與第學習

    非常感謝電子發(fā)燒友提供的這次書籍測評活動!最近,我一直在學習大模型和人工智能的相關知識,深刻體會到機器人技術是個極具潛力的未來方向,甚至可
    發(fā)表于 12-27 14:50

    開源項目!OpenCat—— 個全能的平價四足機器

    感到厭倦?,F(xiàn)在孩子們可以在一種新型玩具上學習物理和編程。機器人專家可以在個便宜得多的平臺上專注于他們的行走
    發(fā)表于 12-16 11:44

    人工智能工程師高頻面試題匯總——機器學習

    隨著人工智能技術的突飛猛進,AI工程師成為了眾多求職者夢寐以求的職業(yè)。想要拿下這份工作,面試的時候得展示出你不僅技術過硬,還得能解決問題。所以,提前準備一些面試常問的問題,比如機器學習
    的頭像 發(fā)表于 12-04 17:00 ?930次閱讀
    <b class='flag-5'>人工智能</b>工程師高頻面試題匯總——<b class='flag-5'>機器</b><b class='flag-5'>學習</b>篇

    NPU與機器學習算法的關系

    人工智能領域,機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復雜度的提升,對計算資源
    的頭像 發(fā)表于 11-15 09:19 ?536次閱讀

    嵌入式和人工智能究竟是什么關系?

    嵌入式和人工智能究竟是什么關系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設備或機器中,以實現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強的適應性和靈活性,能夠根據(jù)用戶需求進行定制化設計。它
    發(fā)表于 11-14 16:39

    人工智能機器學習和深度學習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中個很大的子集是機器學習——讓
    發(fā)表于 10-24 17:22 ?2515次閱讀
    <b class='flag-5'>人工智能</b>、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區(qū)別

    《AI for Science:人工智能驅動科學創(chuàng)新》第6章人AI與能源科學讀后感

    、優(yōu)化等方面的應用有更清晰的認識。特別是書中提到的基于大數(shù)據(jù)和機器學習的能源管理系統(tǒng),通過實時監(jiān)測和分析能源數(shù)據(jù),實現(xiàn)能源的高效利用和智能
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅動科學創(chuàng)新》第4章-AI與生命科學讀后感

    很幸運社區(qū)給我個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創(chuàng)新》第4章關于AI與生命科學的部分,為我們揭示人工智能技術在生命科學領域中的廣泛應用和
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅動科學創(chuàng)新》第人工智能驅動的科學創(chuàng)新學習心得

    人工智能:科學研究的加速器 第章清晰地闡述人工智能作為科學研究工具的強大功能。通過機器學習
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    人工智能推薦系統(tǒng)中強大的圖形處理器(GPU)爭高下。其獨特的設計使得該處理器在功耗受限的條件下仍能實現(xiàn)高性能的圖像處理任務。 Ceremorphic公司 :該公司開發(fā)的分層學習處理器結合
    發(fā)表于 09-28 11:00

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創(chuàng)新

    活的世界? 編輯推薦 《AI for Science:人工智能驅動科學創(chuàng)新》聚焦于人工智能與材料科學、生命科學、電子科學、能源科學、環(huán)境科學五大領域的交叉融合,通過深入淺出的語言和諸多實際應用案例,介紹
    發(fā)表于 09-09 13:54

    FPGA在人工智能中的應用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現(xiàn)在以下幾個方面: 、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度
    發(fā)表于 07-29 17:05

    機器學習怎么進入人工智能

    ,人工智能已成為個熱門領域,涉及到多個行業(yè)和領域,例如語音識別、機器翻譯、圖像識別等。 在編程中進行人工智能的關鍵是使用機器
    的頭像 發(fā)表于 04-04 08:41 ?354次閱讀

    FPGA在深度學習應用中或將取代GPU

    提供商外,英偉達還成立了專業(yè)的人工智能研究實驗室。 不過,機器學習軟件公司 Mipsology 的首席執(zhí)行官兼聯(lián)合創(chuàng)始人盧多維奇?拉祖爾 (Ludovic Larzul) 表示,GPU 還存在著
    發(fā)表于 03-21 15:19

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新輪科技革命與產業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎建設與傳統(tǒng)產業(yè)升級的核心驅動力。同時在此背景驅動下,眾多名企也紛紛在嵌入式
    發(fā)表于 02-26 10:17