人工智能(AI)已經(jīng)稱霸了不少世界上最復(fù)雜的游戲,擊敗了國(guó)際象棋、圍棋、甚至是星際爭(zhēng)霸II等即時(shí)戰(zhàn)略電腦游戲中的頂級(jí)玩家,但其軟肋卻是一些看似簡(jiǎn)單的游戲,一些需要具備溝通和合作能力的游戲。
這一情況可能即將發(fā)生改變。
谷歌母公司Alphabet的谷歌大腦項(xiàng)目和DeepMind的研究人員開發(fā)了曾在圍棋和星際爭(zhēng)霸II中擊敗人類的AI程序,現(xiàn)在他們將目光投向了一款新游戲:Hanabi(花火),一種玩家互相合作的紙牌游戲。這款游戲根據(jù)玩家在比賽中的溝通情況來(lái)確定每個(gè)人是贏還是輸。
參與該項(xiàng)目的研究人員認(rèn)為,弄清楚怎樣玩好Hanabi,這對(duì)于人工智能來(lái)說可能是一個(gè)重大進(jìn)步,并且有助于其在聊天和自動(dòng)駕駛等應(yīng)用場(chǎng)景中與人類進(jìn)行更加流暢的互動(dòng)。
“在日常生活中,人們一般不會(huì)相互競(jìng)爭(zhēng),而更多的是進(jìn)行溝通和合作,”牛津大學(xué)研究員JakobFoerster說,他在2月份合作發(fā)表了一篇相關(guān)論文。他還說,“Hanabi是一個(gè)關(guān)于溝通和合作的游戲,人工智能目前還沒有深入這一游戲領(lǐng)域”。
游戲提示
Hanabi游戲發(fā)明于2010年,由二到五個(gè)玩家參與,玩家需以正確的順序一起打出五種不同顏色的牌。游戲特點(diǎn):所有玩家都可以看到對(duì)方的牌,但卻看不到自己的牌。
根據(jù)游戲規(guī)則,玩家可以互相提示自己手里的牌(但僅限于牌的顏色或數(shù)字),讓其他玩家可以推斷他們應(yīng)該出什么牌,但提示的次數(shù)是有限制的。
正是這種高效溝通的行為使Hanabi具備了一種科學(xué)魅力。例如,人類可以很自然地理解其他玩家的提示,哪張卡片是可出的,但是機(jī)器本質(zhì)上無(wú)法理解這些提示。
NolanBard是DeepMind項(xiàng)目的研究員,也是上面提到的論文的合作作者。他認(rèn)為,“這些合作式的游戲各不相同且難度很大,因?yàn)闉榱送婧糜螒?,你需要與所有玩家進(jìn)行協(xié)作,共同就某種游戲方式達(dá)成一致。
到目前為止人工智能程序已經(jīng)可以在玩Hanabi花火游戲時(shí)贏得很高分?jǐn)?shù),但只限于與其他類似的智能機(jī)器人一起玩。在不熟悉其他玩家的游戲風(fēng)格或者有“臨時(shí)”(從未一起玩過的)玩家的情況下,對(duì)程序的挑戰(zhàn)最大,也更接近真實(shí)情況。
假設(shè)和推論
根據(jù)研究人員的說法,人類在不斷構(gòu)建一種關(guān)于他人的“心理認(rèn)知”,即假設(shè)其他人像我們一樣思考和行動(dòng),并以此為基礎(chǔ)預(yù)測(cè)其行為。例如,當(dāng)有人站在街角時(shí),路過的司機(jī)會(huì)認(rèn)為她正在考慮過馬路。
研究人員認(rèn)為,在人工智能中植入這樣的認(rèn)知能力可以改善自動(dòng)駕駛車輛在遇到新情況時(shí)的行為方式,使其能夠明白人們的行為背后意味著他們可能想做什么。例如,智能機(jī)器人可以學(xué)習(xí)并理解對(duì)話中的語(yǔ)境,以便推斷說話者的想法。
為了闡明人工智能目前還缺乏這種能力,Bard博士使用一臺(tái)已經(jīng)訓(xùn)練好的計(jì)算機(jī)來(lái)玩石頭剪刀布游戲。計(jì)算機(jī)出石頭、剪子和布的次數(shù)將相同,并預(yù)計(jì)有一半的機(jī)會(huì)會(huì)贏。
但是如果其人類對(duì)手每次都出同樣的手勢(shì),那么標(biāo)準(zhǔn)的算法就無(wú)法理解人類對(duì)手的想法,并據(jù)此轉(zhuǎn)變其策略。Bard說,計(jì)算機(jī)要在玩了10回后才會(huì)意識(shí)到人類總是出石頭而它應(yīng)該出布。
在其他游戲方面,人工智能程序在橋牌游戲中已經(jīng)取得了進(jìn)展,但還不是玩得很好,部分原因在于人工智能還需要溝通技能。許多紙牌類游戲都存在類似的問題,機(jī)器很難分辨玩家行為背后所隱含的信息。
位于舊金山的OpenAI是由諸多硅谷大亨聯(lián)合建立的人工智能非營(yíng)利組織,其工程師JeffWu開發(fā)了一種智能機(jī)器人,用一種稱為“猜帽子”的策略來(lái)玩Hanabi。這種策略以復(fù)雜的方式向其他玩家給出提示,告訴這些玩家哪些牌可以打。
注:“猜帽子”這個(gè)名字取自一個(gè)流行的邏輯訓(xùn)練,即一群人試圖猜測(cè)他們每個(gè)人頭頂帽子的顏色。
盡管Wu的機(jī)器人在玩Hanabi時(shí)分?jǐn)?shù)很高,但他認(rèn)為要使Hanabi機(jī)器人擁有可以和未知對(duì)手合作的認(rèn)知能力仍然是一個(gè)巨大的挑戰(zhàn)。
“在玩猜帽子時(shí),機(jī)器人沒有認(rèn)知能力,它們心中只有自我以及其副本的概念,如果你只是自己跟自己玩,這是可以的,”Wu說?!暗绻阍噲D開發(fā)一個(gè)真正具有心理認(rèn)知能力的機(jī)器人,并且它可以明白其他人在思考和做什么,那將是個(gè)大挑戰(zhàn)。”
DeepMind的Hanabi研究小組創(chuàng)建了一個(gè)開源平臺(tái),人們可以在其上測(cè)試相關(guān)的人工智能程序和算法,但小組成員并不期待很快能找到解決方案。Foerster博士說,如果只花了五年的時(shí)間就可以使人工智能具備能力和未知玩家進(jìn)行游戲,他覺得不靠譜。
盡管如此,紐約大學(xué)副教授JulianTogelius表示,像Hanabi這樣的游戲是創(chuàng)新的沃土?!半S著其不斷發(fā)展,游戲設(shè)計(jì)已經(jīng)成為人類智力能力發(fā)展的持續(xù)反映,”他說?!叭绻嬖谀撤N形式的人工智能場(chǎng)景,那么就會(huì)有人適時(shí)地設(shè)計(jì)出一種能夠運(yùn)用這種場(chǎng)景的游戲。”
-
游戲
+關(guān)注
關(guān)注
2文章
744瀏覽量
26329 -
人工智能
+關(guān)注
關(guān)注
1792文章
47373瀏覽量
238860
原文標(biāo)題:為什么紙牌游戲Hanabi是人工智能的下一個(gè)挑戰(zhàn)?
文章出處:【微信號(hào):szwlw26059696,微信公眾號(hào):物聯(lián)網(wǎng)之聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論