0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

當(dāng)前的AI還不擅長(zhǎng)處理哪些種類的問(wèn)題?

zhKF_jqr_AI ? 來(lái)源:未知 ? 作者:李倩 ? 2018-10-13 09:02 ? 次閱讀

編者按:數(shù)據(jù)科學(xué)家Shayaan Jagtap以馬里奧和精靈寶可夢(mèng)為例,解釋了當(dāng)前的AI還不擅長(zhǎng)處理哪些種類的問(wèn)題。

你大概早就聽(tīng)說(shuō)機(jī)器能以超人的水平玩游戲。這些機(jī)器可能經(jīng)過(guò)明確編程,對(duì)設(shè)定的輸入作出反應(yīng),給出設(shè)定的輸出,也可能自行學(xué)習(xí)演化,以不同的方式對(duì)相同的輸入作出反應(yīng),希望找到最優(yōu)的反應(yīng)。

一些著名的例子:

AlphaZero,24小時(shí)訓(xùn)練之后,成為地球上最強(qiáng)大的國(guó)際象棋選手。

AlphaGo,著名的圍棋機(jī)器人,擊敗了世界級(jí)棋手李世乭和柯潔。

MarI/O,可自行學(xué)習(xí)以任意等級(jí)進(jìn)行游戲的超級(jí)馬里奧機(jī)器人。

這些游戲很復(fù)雜,訓(xùn)練上面的機(jī)器需要精心組合復(fù)雜的算法,反復(fù)模擬,大量時(shí)間。本文將重點(diǎn)討論MarI/O,以及為何我們無(wú)法使用相似的方法通關(guān)精靈寶可夢(mèng)游戲。

在這方面,馬里奧和精靈寶可夢(mèng)有三個(gè)關(guān)鍵不同:

目標(biāo)數(shù)量

分支因子

全局優(yōu)化與局部?jī)?yōu)化

目標(biāo)數(shù)量

機(jī)器學(xué)習(xí)的方式是優(yōu)化某種目標(biāo)函數(shù)。不管它是最大化獎(jiǎng)勵(lì)函數(shù)(強(qiáng)化學(xué)習(xí))、適應(yīng)度函數(shù)(遺傳算法),還是最小化代價(jià)函數(shù)(監(jiān)督學(xué)習(xí)),目標(biāo)都是類似的:取得盡可能好的分?jǐn)?shù)。

馬里奧只有一個(gè)目標(biāo):到達(dá)本級(jí)別的終點(diǎn)。簡(jiǎn)單來(lái)說(shuō),在死亡之前,到達(dá)的地方越靠右,表現(xiàn)就越好。這是一個(gè)單一的目標(biāo)函數(shù),模型的能力可以由這一個(gè)數(shù)字直接衡量。

精靈寶可夢(mèng)的目標(biāo)……有很多。擊敗精英4級(jí)?捕獲所有寶可夢(mèng)?訓(xùn)練最強(qiáng)團(tuán)隊(duì)?上面所有這些?還是其他完全不同的目標(biāo)?

我們不僅需要定義什么是最終目標(biāo),還要定義進(jìn)展看起來(lái)是什么樣的?這樣,任意時(shí)刻,大量可能選擇之中的每種行動(dòng)才能和獎(jiǎng)勵(lì)或損失對(duì)應(yīng)起來(lái)。

這引出了下一項(xiàng)主題。

分支因子

簡(jiǎn)單說(shuō),分支因子是任意一步可以做出的可能選擇數(shù)量。國(guó)際象棋的分支因子平均是35,圍棋是250. 額外考慮的未來(lái)每一步,都有(分支因子)步數(shù)項(xiàng)選擇需要評(píng)估。

馬里奧中,要么向左,要么向右,要么起跳,要么什么也不做。機(jī)器需要評(píng)估的選擇數(shù)很小。同時(shí),從算力上說(shuō),分支因子越小,機(jī)器人可以預(yù)計(jì)的步數(shù)就越多。

精靈寶可夢(mèng)則是一個(gè)開(kāi)放世界游戲,這意味著,任意給定時(shí)刻都有大量選擇。簡(jiǎn)單的向上、向下、向左、向右無(wú)法有效計(jì)算分支因子數(shù)量。相反,我們需要查看下一個(gè)有意義的行動(dòng)。下一個(gè)行動(dòng)是進(jìn)入戰(zhàn)斗,和NPC交談,還是進(jìn)入左/右/上/下方的小地圖?隨著游戲的進(jìn)行,可能的選擇范圍越來(lái)越大。

創(chuàng)建一個(gè)可以找到最佳選擇組合的機(jī)器,需要考慮短期和長(zhǎng)期目標(biāo),這引出了最后一項(xiàng)主題。

全局優(yōu)化與局部?jī)?yōu)化

局部?jī)?yōu)化與全局優(yōu)化既包括空間層面,也包括時(shí)間層面。短期目標(biāo)和周圍地理區(qū)域?qū)儆诰植?,長(zhǎng)期目標(biāo)和城市、全地圖這樣較大的區(qū)域?qū)儆谌帧?/p>

拆分每一步可以是一種分解精靈寶可夢(mèng)問(wèn)題的方式。如何從A點(diǎn)到B點(diǎn)的局部?jī)?yōu)化是容易的,但決定哪個(gè)目的地是最優(yōu)的B點(diǎn)則是一個(gè)困難得多的問(wèn)題。貪心算法在這里無(wú)法奏效,因?yàn)榫植孔顑?yōu)的決策不一定導(dǎo)向全局最優(yōu)。

馬里奧地圖很小,而且是線性的。而精靈寶可夢(mèng)卻有著錯(cuò)綜復(fù)雜的非線性大地圖。為了達(dá)到高階目標(biāo),當(dāng)前優(yōu)先級(jí)會(huì)隨著時(shí)間而改變,將全局目標(biāo)轉(zhuǎn)換為優(yōu)先局部?jī)?yōu)化問(wèn)題不是一項(xiàng)容易的任務(wù)。這不是我們當(dāng)前的模型具有足夠能力可以處理的事情。

最后一點(diǎn)

從機(jī)器人的角度來(lái)說(shuō),精靈寶可夢(mèng)不是一個(gè)游戲。機(jī)器人都是專門(mén)的,當(dāng)你遭遇要戰(zhàn)斗的NPC時(shí),幫助你在地圖上移動(dòng)的機(jī)器人對(duì)此束手無(wú)策——這是兩個(gè)完全不同的任務(wù)。

在戰(zhàn)斗階段,每個(gè)回合有許多選項(xiàng)。選擇如何移動(dòng),切換到哪個(gè)寶可夢(mèng),何時(shí)使用不同的物品,本身就是一個(gè)復(fù)雜的優(yōu)化問(wèn)題。我看到過(guò)一篇介紹如何創(chuàng)建戰(zhàn)斗模擬器的文章,考慮得很周到,在沒(méi)有考慮物品使用這一決定戰(zhàn)斗結(jié)果的關(guān)鍵因素的前提下,復(fù)雜度已經(jīng)高得驚人了。

目前,我們能夠創(chuàng)造出能夠在我們自己的游戲中戰(zhàn)勝我們的機(jī)器人,我們?cè)摓榇烁械礁吲d。這些游戲在數(shù)學(xué)上很復(fù)雜,但在目標(biāo)上很簡(jiǎn)單。隨著AI技術(shù)的進(jìn)展,我們將創(chuàng)造能夠解決有越來(lái)越大影響力的真實(shí)世界問(wèn)題的機(jī)器人,這些機(jī)器人將通過(guò)自行學(xué)習(xí)復(fù)雜優(yōu)化問(wèn)題來(lái)解決真實(shí)世界問(wèn)題??梢苑判牡氖?,還是有很多事情我們要比機(jī)器更擅長(zhǎng),其中包括我們童年時(shí)玩的游戲——至少到目前為止是這樣。感謝閱讀!

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28580

    瀏覽量

    207806
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31336

    瀏覽量

    269733
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4344

    瀏覽量

    62835

原文標(biāo)題:為什么AI可以通關(guān)馬里奧,卻玩不好精靈寶可夢(mèng)?

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    觸控按鍵之無(wú)須做特別的絕緣處理

    `觸控按鍵之無(wú)須做特別的絕緣處理你的觸控按鍵還需做特別處理絕緣問(wèn)題嗎?女生一般對(duì)電器之類的都比較不擅長(zhǎng),特別是沒(méi)有把 絕緣處理好的情況下,更加不敢碰,深圳市沃邇瑪電子有限公司生產(chǎn)的觸控
    發(fā)表于 09-13 09:49

    CPU和GPU擅長(zhǎng)不擅長(zhǎng)的地方

    不擅長(zhǎng)”。 芯片的速度主要取決于三個(gè)方面:微架構(gòu)、主頻、IPC(每個(gè)時(shí)鐘周期執(zhí)行的指令數(shù))。 1.微架構(gòu)從微架構(gòu)上看,CPU和GPU看起來(lái)完全不是按照相同的設(shè)計(jì)思路設(shè)計(jì)的,當(dāng)代CPU的微架構(gòu)是按照兼顧
    發(fā)表于 12-03 15:43

    CPU和GPU擅長(zhǎng)不擅長(zhǎng)的地方

    不擅長(zhǎng)”。芯片的速度主要取決于三個(gè)方面:微架構(gòu)、主頻、IPC(每個(gè)時(shí)鐘周期執(zhí)行的指令數(shù))。1.微架構(gòu)從微架構(gòu)上看,CPU和GPU看起來(lái)完全不是按照相同的設(shè)計(jì)思路設(shè)計(jì)的,當(dāng)代CPU的微架構(gòu)是按照兼顧“指令
    發(fā)表于 12-03 20:08

    AD蛇形布線和等長(zhǎng)處理技巧

    添加類:做等長(zhǎng)處理的往往是多根線,需要將多根線歸成一類,設(shè)置netclass方法如下:在原理圖中:Place-directives-BlanketPlace-directives-NetClass標(biāo)記結(jié)果如下:僅作參考,比如將電源歸位電源類
    發(fā)表于 05-24 08:57

    請(qǐng)問(wèn)電路分析不擅長(zhǎng)該怎么抄板?

    電路分析不擅長(zhǎng),怎么抄板,有沒(méi)有大師分享點(diǎn)經(jīng)驗(yàn)
    發(fā)表于 07-03 05:35

    什么是數(shù)字信號(hào)處理器性價(jià)比的新標(biāo)桿?

    很強(qiáng)的數(shù)據(jù)處理能力,然而系統(tǒng)必要的控制功能是DSP所不擅長(zhǎng)的。什么是數(shù)字信號(hào)處理器性價(jià)比的新標(biāo)桿?我們需要注意什么?
    發(fā)表于 08-02 07:25

    為什么AI設(shè)計(jì)師要特別區(qū)分:相關(guān)性 VS. 因果性呢?

    最低(最佳)的組合(解)。 AI設(shè)計(jì)師很清楚:AI擅長(zhǎng)找規(guī)律,但不擅長(zhǎng)找正確(最佳)解,能有80%準(zhǔn)確度就很棒了,所以AI設(shè)計(jì)師跳出傳統(tǒng)程式
    發(fā)表于 11-26 10:21

    詮釋AI的兩大特征:黑盒子與不確定性

    for Uncertainty in Artificial Intelligence,簡(jiǎn)稱AUAI)。并且定期召開(kāi)大型會(huì)議,研討各種可能的解決途徑。 5.2 AI不擅長(zhǎng)<不確定性>
    發(fā)表于 11-26 10:45

    芯片的速度取決于哪幾個(gè)方面?

    芯片的速度取決于哪幾個(gè)方面?CPU和GPU擅長(zhǎng)不擅長(zhǎng)的地方看了就知道
    發(fā)表于 04-06 09:05

    探討一下用于單片機(jī)的幾種C語(yǔ)言算法

    單片機(jī)主要作用是控制外圍的器件,并實(shí)現(xiàn)一定的通信和數(shù)據(jù)處理。雖然單片機(jī)不擅長(zhǎng)實(shí)現(xiàn)算法和進(jìn)行復(fù)雜...
    發(fā)表于 02-25 07:21

    現(xiàn)在的人工智能系統(tǒng)是怎樣的狀態(tài)

    所謂窄AI,是指那些特別擅長(zhǎng)處理單一任務(wù)或者特定范圍內(nèi)工作的系統(tǒng)。
    發(fā)表于 04-22 17:41 ?1611次閱讀

    女性也能撐起人工智能的半邊天!

    誰(shuí)說(shuō)女性并不擅長(zhǎng)理科?!在各種硬核的科技領(lǐng)域,
    發(fā)表于 03-08 14:55 ?865次閱讀

    擅長(zhǎng)PCB畫(huà)板但不擅長(zhǎng)APP開(kāi)發(fā),如何才能克服不足,將家用電器改造成智能電器呢?

    正所謂術(shù)業(yè)有專攻,自從踏入電子信息這領(lǐng)域,從大學(xué)主攻模電數(shù)電,到上班后畫(huà)PCB、做EMC測(cè)試等等,我在硬件工程師的路上越走越遠(yuǎn)了,在計(jì)算機(jī)領(lǐng)域的Java、Swift等等語(yǔ)言,了解的也少了,更是不擅長(zhǎng)
    的頭像 發(fā)表于 03-17 10:50 ?635次閱讀
    我<b class='flag-5'>擅長(zhǎng)</b>PCB畫(huà)板但<b class='flag-5'>不擅長(zhǎng)</b>APP開(kāi)發(fā),如何才能克服不足,將家用電器改造成智能電器呢?

    蘋(píng)果發(fā)布研究論文:揭示Ferret-UI AI系統(tǒng),破解MLLMs移動(dòng)應(yīng)用理解難題

    目前圍繞人工智能(AI)技術(shù),出現(xiàn)了如ChatGPT這樣的大語(yǔ)言模型(LLMs),這些模型擅長(zhǎng)處理文本資料。然而,對(duì)于像圖片、視頻和聲音等多媒體類型的非文本n內(nèi)容,就需要擴(kuò)大AI模型的適用范圍,相應(yīng)地,多模態(tài)大語(yǔ)言模型(MLLM
    的頭像 發(fā)表于 04-10 10:17 ?448次閱讀

    李開(kāi)復(fù):中國(guó)擅長(zhǎng)打造經(jīng)濟(jì)實(shí)惠的AI推理引擎

    10月22日上午,零一萬(wàn)物公司的創(chuàng)始人兼首席執(zhí)行官李開(kāi)復(fù)在與外媒的交流中透露,其公司旗下的Yi-Lightning(閃電模型)在推理成本上已實(shí)現(xiàn)了顯著優(yōu)勢(shì),比OpenAI的GPT-4o模型低了31倍。他強(qiáng)調(diào),中國(guó)擅長(zhǎng)打造經(jīng)濟(jì)實(shí)惠的AI推理引擎,這是推動(dòng)
    的頭像 發(fā)表于 10-22 16:54 ?392次閱讀