0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AlphaStar橫空出世 星際爭霸2人類1:10輸給AI

獨(dú)愛72H ? 來源:劉林華 ? 作者:電子發(fā)燒友 ? 2019-01-25 09:40 ? 次閱讀

AlphaStar橫空出世 星際爭霸2人類1:10輸給AI

剛剛,我們見證了 AI 與人類 PK 的又一次重大進(jìn)展!DeepMind 北京時(shí)間 1 月 25 日凌晨 2:00 起公布了其錄制的 AI 在《星際爭霸 2》中與2位職業(yè)選手的比賽過程:AlphaStar 5:0 戰(zhàn)勝職業(yè)選手TLO ,5:0戰(zhàn)勝 2018 年 WSC 奧斯汀站亞軍 MaNa 。與兩位人類對手的比賽相隔約兩周,AI 自學(xué)成才,經(jīng)歷了從與TLO 對戰(zhàn)時(shí)的菜鳥級別,進(jìn)化到完美操作的過程,尤其是與MaNa 的對戰(zhàn),已經(jīng)初步顯示了可以超越人類極限的能力。

這次的演示也是 DeepMind 的星際爭霸 2 AI AlphaStar 的首次公開亮相。除了此前比賽錄像的展示外,AlphaStar 還和MaNa 現(xiàn)場來了一局,不過,這局AlphaStar 輸給了人類選手MaNa 。

我們不難看出,盡管其神經(jīng)網(wǎng)絡(luò)已經(jīng)趨于長期優(yōu)化,但似乎仍然會在一定程度上陷入局部最優(yōu),被人類發(fā)現(xiàn)固定模式,落入圈套,而且從 5 個(gè)小叮當(dāng)抱團(tuán),到純追獵部隊(duì),都顯示出它對游戲兵種的理解尚不到位,如果最后一局它可以像人類一樣直接派出鳳凰防守棱鏡,或許它將繼續(xù)憑借超強(qiáng)的微操一波推平 MaNa。

比賽回放過程中,主持人問到 DeepMind 科學(xué)家,平時(shí)如何訓(xùn)練 AlphaStar,DeepMind 科學(xué)家 Oriol Vinyals、David Silver 表示,首先是模仿學(xué)習(xí),團(tuán)隊(duì)從許多選手那里獲得了很多比賽回放資料,并試圖讓 AI 通過觀察一個(gè)人所處的環(huán)境,盡可能地模仿某個(gè)特定的動(dòng)作,從而理解星際爭霸的基本知識。這其中所使用到的訓(xùn)練資料不但包括專業(yè)選手,也包括業(yè)余選手。這是 AlphaStar 成型的第一步。

之后,團(tuán)隊(duì)會使用一個(gè)稱為“Alpha League”的方法。在這個(gè)方法中,Alpha League 的第一個(gè)競爭對手就是從人類數(shù)據(jù)中訓(xùn)練出來的神經(jīng)網(wǎng)絡(luò),然后進(jìn)行一次又一次的迭代,產(chǎn)生新的 agent 和分支,用以壯大“Alpha League”。

圖 | Alpha League 示意圖

然后,這些 agent 通過強(qiáng)化學(xué)習(xí)過程與“Alpha League”中的其他競爭對手進(jìn)行比賽,以便盡可能有效地?fù)魯∷羞@些不同的策略,此外,還可以通過調(diào)整它們的個(gè)人學(xué)習(xí)目標(biāo)來鼓勵(lì)競爭對手朝著特定方式演進(jìn),比如說旨在獲得特定的獎(jiǎng)勵(lì)。

最后,團(tuán)隊(duì)在“Alpha League”中選擇了最不容易被利用的 agent,稱之為“the nash of League”,這就是 TLO 所對戰(zhàn)的5個(gè)。

近幾年,除了 DeepMind 以外,已經(jīng)有越來越多的人工智能公司或者研究機(jī)構(gòu)投身到開發(fā)游戲類AI的浪潮中,例如 OpenAI 和騰訊的 AI lab 等等。

歸根結(jié)底,這些團(tuán)隊(duì)對游戲AI的熱情,恐怕都源于打造通用型人工智能的這一終極目標(biāo):游戲AI的研發(fā)將會進(jìn)一步拓寬人類對于AI能力的認(rèn)知,這樣的研究最終將探索的問題 AI 能否能夠通過游戲規(guī)則進(jìn)行自主學(xué)習(xí),達(dá)到更高層次的智能乃至通用型人工智能。例如,在游戲AI的設(shè)計(jì)中,增強(qiáng)學(xué)習(xí)算法的改進(jìn)將至關(guān)重要。增強(qiáng)學(xué)習(xí)是一種能夠提高 AI 能力的核心算法,它讓 AI 能夠解決具有不確定性動(dòng)態(tài)的決策問題(比如游戲 AI,智能投資,自動(dòng)駕駛,個(gè)性化醫(yī)療),這些問題往往也更加復(fù)雜。

而 DeepMind 團(tuán)隊(duì)的成果已經(jīng)為此帶來了一絲曙光——AlphaGo Zero在短時(shí)間內(nèi)精通圍棋、象棋、國際象棋三種棋類游戲,已有棋類通用AI雛形。棋類游戲之后,最值得期待的進(jìn)展,就是各家開發(fā)的AI在即時(shí)戰(zhàn)略類 RTS 游戲或多人在線競技類 MOBA 游戲上的表現(xiàn)了。此前,騰訊 AI Lab 負(fù)責(zé)人之一姚星就介紹過,在游戲AI的研究上,騰訊 AI Lab 已從圍棋 AI “絕藝”等單個(gè) AI 的完全信息博弈類游戲,轉(zhuǎn)移到規(guī)則不明確、任務(wù)多樣化、情況復(fù)雜的游戲類型,如星際爭霸和 Dota2 等復(fù)雜的即時(shí)戰(zhàn)略類 RTS 游戲或多人在線競技類 MOBA 游戲。

在剛剛過去的2018年,OpenAI 開發(fā)出的 AI OpenAI Five 就是針對 Dota2 開發(fā)的AI,但是它與人類 PK 的過程可謂充滿戲劇性。2018 年 8 月初,OpenAI Five 戰(zhàn)勝一支人類玩家高水平業(yè)余隊(duì)伍(天梯 4000 分左右),然而,到了 8 月底 OpenAI Five 被兩支專業(yè)隊(duì)伍打敗, AI 提前結(jié)束了其在本屆 DOTA 2 國際頂尖賽事 TI 8 的旅程。回顧那次失敗的過程,其實(shí)OpenAI 的系統(tǒng)仍然無法全面理解 DOTA 復(fù)雜的游戲系統(tǒng)和規(guī)則。

現(xiàn)在,DeepMind 的星際爭霸2 AI 已經(jīng)以其超強(qiáng)實(shí)力打響游戲 AI 2019 年第一戰(zhàn),接下來還有哪些游戲AI將橫空出世呢?各大游戲AI又將如何邁向通用人工智能,讓我們拭目以待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31022

    瀏覽量

    269360
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47372

    瀏覽量

    238856
收藏 人收藏

    評論

    相關(guān)推薦

    AI 助力汽車電子測試:落地應(yīng)用的六大挑戰(zhàn)

    引言:AI的機(jī)遇與挑戰(zhàn)自從ChatGPT橫空出世以來,人工智能似乎一夜之間變得無處不在。在日常使用中,我們常常在驚艷與失望之間徘徊:它有時(shí)能展現(xiàn)出令人驚嘆的能力,洞察深刻、對答如流,有時(shí)卻又犯下
    的頭像 發(fā)表于 11-27 11:47 ?840次閱讀
    <b class='flag-5'>AI</b> 助力汽車電子測試:落地應(yīng)用的六大挑戰(zhàn)

    ZeeQuest推出尖端人工智能和預(yù)測分析工具Navigator

     ZeeQuest,作為科技前沿的領(lǐng)航者,其傾力打造的Navigator產(chǎn)品今日正式向全球璀璨發(fā)布。歷經(jīng)八載春秋的精心研發(fā)、嚴(yán)苛測試與實(shí)地驗(yàn)證,Navigator橫空出世,以革命性的姿態(tài)引領(lǐng)個(gè)人生活管理的新紀(jì)元。
    的頭像 發(fā)表于 08-26 15:28 ?470次閱讀

    識光發(fā)布突破性車載激光雷達(dá)芯片SQ100

    近日,車載激光雷達(dá)芯片領(lǐng)域的領(lǐng)軍企業(yè)識光科技宣布,其自主研發(fā)的高集成度大面陣SPAD-SoC芯片SQ100在一次流片中成功點(diǎn)亮,標(biāo)志著該產(chǎn)品即將正式對外發(fā)布。SQ100的橫空出世,無疑為ADAS前裝量產(chǎn)、L4/5自動(dòng)駕駛、機(jī)器及工業(yè)自動(dòng)化等前沿領(lǐng)域注入了新的活力。
    的頭像 發(fā)表于 08-05 14:37 ?660次閱讀

    意法半導(dǎo)體ST Edge AI Suite人工智能開發(fā)套件上線

    邊緣人工智能進(jìn)一步縮短了智能和決策能力與數(shù)據(jù)源之間的距離,是企業(yè)在當(dāng)今的互聯(lián)網(wǎng)時(shí)代實(shí)現(xiàn)產(chǎn)品智能化的關(guān)鍵技術(shù)。2023年年底,意法半導(dǎo)體ST Edge AI Suite人工智能開發(fā)套件橫空出世,將成為加快邊緣人工智能應(yīng)用,助力企業(yè)產(chǎn)品智能化轉(zhuǎn)型的利器。
    的頭像 發(fā)表于 07-04 10:52 ?815次閱讀

    CANXL標(biāo)準(zhǔn)發(fā)布 | (1)一文讀懂CANXL數(shù)據(jù)鏈路層總線,通信再進(jìn)化!

    2024年3月22日,期待已久的ISO 11898-2:2024版本橫空出世,標(biāo)志著新一代CAN總線的時(shí)代即將到來(ISO/FDIS 11898-1:2023也處于最終投票階段)。搭載著
    的頭像 發(fā)表于 04-12 16:12 ?1449次閱讀
    CANXL標(biāo)準(zhǔn)發(fā)布 | (<b class='flag-5'>1</b>)一文讀懂CANXL數(shù)據(jù)鏈路層總線,通信再進(jìn)化!

    火了這么久的大模型,到底能為模組產(chǎn)業(yè)帶來什么?

    全球新一輪產(chǎn)業(yè)技術(shù)變革加速來臨,大模型作為人工智能發(fā)展的核心引擎,正引發(fā)一場全新的工業(yè)革命,可能徹底改變人類社會的生產(chǎn)和生活方式。▌大模型:從橫空出世到百花齊放回顧上一年度,ChatGPT橫空出世
    的頭像 發(fā)表于 03-15 17:34 ?655次閱讀
    火了這么久的大模型,到底能為模組產(chǎn)業(yè)帶來什么?

    針對高速光模塊應(yīng)用,小華半導(dǎo)體推出HC32F472系列模擬豐富MCU新品

    2023年以來,生成式人工智能ChatGPT及橫空出世的視頻生成模型Sora極大地影響人類科技發(fā)展的方向。
    的頭像 發(fā)表于 03-15 17:28 ?1336次閱讀
    針對高速光模塊應(yīng)用,小華半導(dǎo)體推出HC32F472系列模擬豐富MCU新品

    新火種AI|秒殺GPT-4,狙殺GPT-5,橫空出世的Claude 3振奮人心!

    2024年第一季度才剛過半,AI領(lǐng)域就大動(dòng)作不斷,大家卯著勁的出新品,可謂卷出天際。 ? 3月4日,Anthropic發(fā)布了最新的Claude 3系列模型,用Anthropic的話說,Claude
    的頭像 發(fā)表于 03-06 22:22 ?682次閱讀
    新火種<b class='flag-5'>AI</b>|秒殺GPT-4,狙殺GPT-5,<b class='flag-5'>橫空出世</b>的Claude 3振奮人心!

    Sora出世 服務(wù)器產(chǎn)業(yè)鏈?zhǔn)芤鏄O大!

    繼ChatGPT后,又一生成式AI橫空出世,人工智能一年一階段的發(fā)展,給相關(guān)元器件帶來了哪些影響? 與2023年相似,就在今年的同一時(shí)間,生成式AI再次橫空出世。
    的頭像 發(fā)表于 02-27 10:28 ?393次閱讀

    賈揚(yáng)清質(zhì)疑Groq CEO“其芯片價(jià)格接近免費(fèi)” 前員工:不切實(shí)際!

    在人工智能的世界里,正在發(fā)生一場翻天覆地的變化,隨著 ChatGPT、Sora 的橫空出世
    的頭像 發(fā)表于 02-25 14:04 ?1036次閱讀
    賈揚(yáng)清質(zhì)疑Groq CEO“其芯片價(jià)格接近免費(fèi)” 前員工:不切實(shí)際!

    成都匯陽投資關(guān)于Sora 橫空出世,AI 產(chǎn)業(yè)鏈風(fēng)云再起!

    【Sora 在視頻生成和模擬能力實(shí)現(xiàn)重大突破】 2 月16 日,OpenAI 發(fā)布最新文生視頻大模型 Sora ,并在官網(wǎng)發(fā)布由其生成的 48 個(gè)視頻樣例。 目前,Sora 仍處于測試階段,僅對部分
    的頭像 發(fā)表于 02-20 09:43 ?860次閱讀
    成都匯陽投資關(guān)于Sora <b class='flag-5'>橫空出世</b>,<b class='flag-5'>AI</b> 產(chǎn)業(yè)鏈風(fēng)云再起!

    2024年全球半導(dǎo)體行業(yè)10大技術(shù)趨勢

    整個(gè)2023年,半導(dǎo)體行業(yè)下行期的陰霾似乎仍未散去,但業(yè)界已經(jīng)看到了一絲曙光。年初ChatGPT的橫空出世,引爆了全球?qū)τ谏墒饺斯ぶ悄?AIGC)的追捧。AI和大模型的興起催生多元化的落地場景,為
    的頭像 發(fā)表于 02-19 13:27 ?1181次閱讀
    2024年全球半導(dǎo)體行業(yè)<b class='flag-5'>10</b>大技術(shù)趨勢

    Wi-Fi設(shè)備故障如何排查找到錯(cuò)誤呢?

    隨著無線技術(shù)高速發(fā)展,Wi-Fi橫空出世,它可將個(gè)人電腦、手機(jī)登終端以無線技術(shù)互相連接,成為了人們上網(wǎng)必不可少的技術(shù)之一
    的頭像 發(fā)表于 01-24 09:27 ?806次閱讀

    英國將推出世界首個(gè)修路AI機(jī)器

    機(jī)器的應(yīng)用越加廣泛,之前各種建筑機(jī)器已經(jīng)有看到落地,粉刷匠說都快要失業(yè)了,現(xiàn)在英國將推出世界首個(gè)修路AI機(jī)器;不僅僅是比人工來做要快很
    的頭像 發(fā)表于 01-12 17:59 ?1106次閱讀

    全球首款可折疊137英寸MicroLED電視亮相CES 2024

    在近日的 CES 2024 展會上,一款引人注目的產(chǎn)品橫空出世,吸引了全球消費(fèi)者的廣泛關(guān)注。那就是由知名品牌 C SEED 推出的全球首款可折疊 137 英寸 MicroLED 電視——C SEED N1 電視。
    的頭像 發(fā)表于 01-12 14:46 ?1001次閱讀