欧美a色爱欧美综合v,免费a级毛片无码久久,人妻丰满熟妇无码区乱com

通過模仿人類大腦在日常生活中做出決策時(shí)使用的策略，可以顯著增強(qiáng)機(jī)器人智能。最近，科學(xué)家們找到了最新觀點(diǎn)。

本周五在國(guó)內(nèi)上映的《阿麗塔：戰(zhàn)斗天使》又掀起了一波智能熱，這部由著導(dǎo)演詹姆斯·卡梅隆（James Cameron）擔(dān)任編劇和制片的電影，講述了擁有人類大腦、機(jī)械身軀的女主角，不斷改變世界、認(rèn)識(shí)自我的故事。

這部背景發(fā)生在26世紀(jì)的電影，依舊把人類大腦作為承載智慧、情感和決策的關(guān)鍵能力。

而現(xiàn)在，一份來自韓國(guó)高等科學(xué)技術(shù)研究院（KAIST）、劍橋大學(xué)、日本國(guó)家信息通信技術(shù)研究所（NICT）和谷歌DeepMind的聯(lián)合研究認(rèn)為，通過模仿人類大腦在日常生活中做出決策時(shí)使用的策略，可以顯著增強(qiáng)機(jī)器人智能，他們的方法是：將神經(jīng)科學(xué)應(yīng)用于機(jī)器人大腦。

最近，這項(xiàng)研究發(fā)表在了Science Robotics雜志上。

決策神經(jīng)科學(xué)：解決機(jī)器人技術(shù)中的關(guān)鍵挑戰(zhàn)

人類和自主機(jī)器人不斷需要學(xué)習(xí)和適應(yīng)新的環(huán)境。兩者的不同之處在于，人類能夠根據(jù)獨(dú)特情況做出決策，而機(jī)器人仍然依靠預(yù)定數(shù)據(jù)來做出決策，這是目前機(jī)器人的短板。

強(qiáng)化學(xué)習(xí)(RL)成為通過與世界交互來理解決策的主要理論框架，并且最近在構(gòu)建具有超人類表現(xiàn)的智能體方面取得成功。然而，哪怕是最新的強(qiáng)化算法仍然存在很大的局限性，例如，缺乏制定目標(biāo)導(dǎo)向策略的能力，或依賴大量經(jīng)驗(yàn)來學(xué)習(xí)。

這些限制阻礙了機(jī)器人在任務(wù)或背景頻繁變化的動(dòng)態(tài)環(huán)境中快速適應(yīng)的能力。

相比之下，人類在經(jīng)驗(yàn)有限的條件下迅速適應(yīng)環(huán)境變化方面具有非凡的能力。決策神經(jīng)科學(xué)(decision neuroscience)的最新發(fā)現(xiàn)表明，大腦不僅為RL使用多個(gè)控制系統(tǒng)，而且還使用一種靈活的元控制機(jī)制(metacontrol mechanism)來選擇控制選項(xiàng)，每個(gè)不同選項(xiàng)分別與預(yù)測(cè)性能、認(rèn)知負(fù)荷和學(xué)習(xí)速度相關(guān)。

理解大腦如何實(shí)現(xiàn)這些選項(xiàng)可能會(huì)讓RL算法解決機(jī)器人的實(shí)際控制問題。

在Science Robotics上發(fā)表的研究中，研究人員討論了人類RL相關(guān)的最新發(fā)現(xiàn)，這些發(fā)現(xiàn)可能會(huì)解決機(jī)器人技術(shù)中的幾個(gè)關(guān)鍵挑戰(zhàn)：性能—效率—速度權(quán)衡、多機(jī)器人設(shè)置中的沖突需求以及探索—開發(fā)困境。

詳細(xì)解讀：元控制可以類似大腦

首先，決策神經(jīng)科學(xué)的證據(jù)表明，人類利用兩種不同的行為控制策略：

刺激驅(qū)動(dòng)的習(xí)慣性(stimulus--driven habitual)；

目標(biāo)導(dǎo)向的認(rèn)知控制(goal--directed cognitive control)。

習(xí)慣性控制是自動(dòng)且快速的，盡管它在不穩(wěn)定的環(huán)境中很脆弱，并且能由model--free RL很好地解釋，model--free RL通過無環(huán)境模型下的試錯(cuò)過程來逐步學(xué)習(xí)行為的價(jià)值。

相反，目標(biāo)導(dǎo)向的控制可以迅速適應(yīng)環(huán)境的變化，但它具有認(rèn)知需求。它通過學(xué)習(xí)環(huán)境模型來指導(dǎo)行動(dòng)，并利用這個(gè)知識(shí)庫(kù)快速適應(yīng)環(huán)境結(jié)構(gòu)的變化，例如學(xué)習(xí)狀態(tài)-行動(dòng)空間中的潛在(隱藏)原因。

model--based RL和model--free RL之間的這種計(jì)算上的區(qū)別表明它們之間存在不可避免的妥協(xié)。model--free RL學(xué)習(xí)起來比較慢，但一旦策略被學(xué)習(xí)并實(shí)現(xiàn)自動(dòng)化，就可以快速地實(shí)現(xiàn)目標(biāo)。model--based RL通常比model--free RL提供更多的準(zhǔn)確預(yù)測(cè)，但計(jì)算量要大得多。每種策略都提供了關(guān)于準(zhǔn)確性、速度和認(rèn)知負(fù)荷的互補(bǔ)解決方案，突出了預(yù)測(cè)性能和計(jì)算效率之間的權(quán)衡。

其次，RL算法通常需要大量經(jīng)驗(yàn)來充分學(xué)習(xí)不同環(huán)境因素下的因果關(guān)系(incremen-tal learning)。然而，人類的學(xué)習(xí)速度很快——通常一個(gè)從未經(jīng)歷過的事件發(fā)生一次之后就已學(xué)習(xí)(“one--shot learn-ing”)。

神經(jīng)科學(xué)最近的研究發(fā)現(xiàn)，當(dāng)與環(huán)境的交互受到限制時(shí)，人類有很強(qiáng)的提高學(xué)習(xí)速度的傾向；他們會(huì)努力迅速弄清環(huán)境中未知的部分，即使這會(huì)危及安全。這些結(jié)果表明，大腦是直接執(zhí)行計(jì)算來尋找性能和速度之間的權(quán)衡。

第三，越來越多的證據(jù)支持這樣一種觀點(diǎn)，即前額葉皮層使元控制能夠靈活地在不同的學(xué)習(xí)策略之間進(jìn)行選擇，例如在model--based RL和model--free RL 之間，以及在incremental learning和one--shot learning之間。

在新的環(huán)境中，元控制通過選擇model--based RL來強(qiáng)調(diào)性能。因?yàn)檫@在計(jì)算上很昂貴，當(dāng)大腦發(fā)現(xiàn)進(jìn)一步學(xué)習(xí)沒有什么好處時(shí)，就會(huì)轉(zhuǎn)向model--free RL：要么環(huán)境非常穩(wěn)定，可以做出精確的預(yù)測(cè)；要么高度不穩(wěn)定，以至于基于模型的RL的預(yù)測(cè)不如無模型RL的預(yù)測(cè)可靠。

在其他情況下，元控制優(yōu)先考慮速度。當(dāng)預(yù)估的因果關(guān)系中的不確定性很高時(shí)，大腦傾向于轉(zhuǎn)換到one-shot學(xué)習(xí)，以快速解決預(yù)測(cè)結(jié)果中的不確定性。然而，當(dāng)agent對(duì)所有可能的因果關(guān)系都同樣不確定時(shí)，它會(huì)重新轉(zhuǎn)向incremental learning以確保安全的學(xué)習(xí)。

這些機(jī)制表明類似于大腦的元控制可以處理性能-效率-速度的權(quán)衡。

第四，人類的RL可以解釋在人類進(jìn)化中起重要作用的社會(huì)現(xiàn)象。在多主體相互作用的人類社會(huì)中，存在著具有部分競(jìng)爭(zhēng)性和部分一致性激勵(lì)機(jī)制的社會(huì)困境。

使用model--based的RL方法成功地在更復(fù)雜的時(shí)間擴(kuò)展設(shè)置中實(shí)現(xiàn)了協(xié)作。

人類似乎通過使用元認(rèn)知(metacognition)來繞過這個(gè)問題——元認(rèn)知是一種評(píng)估自己表現(xiàn)的能力，即評(píng)估自信和/或不確定性的水平。例如，較低的任務(wù)難度或較低的環(huán)境噪聲會(huì)使學(xué)習(xí)主體自信，從而導(dǎo)致更果斷的行動(dòng)，而失去自信則會(huì)導(dǎo)致更謹(jǐn)慎和防御性的策略。元認(rèn)知學(xué)習(xí)因此可以快速適應(yīng)環(huán)境的變化，同時(shí)保持對(duì)環(huán)境噪聲的魯棒性。這樣的策略有可能增強(qiáng)機(jī)器人的決策能力。

總之，將人類決策神經(jīng)科學(xué)的發(fā)現(xiàn)整合起來，可以為機(jī)器人的動(dòng)作控制系統(tǒng)提供有價(jià)值的見解，從而實(shí)現(xiàn)更安全、更有能力、更高效的學(xué)習(xí)。

對(duì)大腦建模，算法能否支撐起意識(shí)？

另外，研究團(tuán)隊(duì)還認(rèn)為，這種跨學(xué)科的方法也應(yīng)該引起神經(jīng)科學(xué)的注意，為開發(fā)新的人類決策計(jì)算理論提供一個(gè)可靠的測(cè)試基礎(chǔ)。

最近對(duì)焦慮、抑郁和成癮等精神疾病背后的興趣引起了很多人的興趣，這使得一系列復(fù)雜的理論在沒有某種先進(jìn)的情境平臺(tái)的情況下難以測(cè)試。這種情況需要一種對(duì)人類大腦進(jìn)行建模的方法，以找出它在現(xiàn)實(shí)生活中如何與世界相互作用，以測(cè)試這些模型中的不同異常是否以及如何引起某些疾病。

例如，如果我們可以在機(jī)器人中重現(xiàn)焦慮行為或強(qiáng)迫癥，那么就可以預(yù)測(cè)需要做些什么來治療。研究團(tuán)隊(duì)預(yù)計(jì)，開發(fā)不同精神疾病的機(jī)器人模型，與研究人員現(xiàn)在使用動(dòng)物模型的方式類似，將成為臨床研究的關(guān)鍵未來技術(shù)。

最后再回到電影《阿麗塔》。

電影中所有的機(jī)器人都擁有人類的生命、有機(jī)大腦。機(jī)器人能從脊髓或大腦直接將信號(hào)傳遞到假體中的代碼，使截癱或四肢癱瘓的人能夠隨著機(jī)器人技術(shù)的進(jìn)步再次獲得行動(dòng)能力。

如果放到現(xiàn)在的時(shí)代，這種技術(shù)看上去非常棒；但電影設(shè)定發(fā)生在五百年后，AI依然只是作為支撐軀體的技術(shù)，核心還是人類的大腦而不是由算法主導(dǎo)意識(shí)與行動(dòng)，看來卡梅隆和羅德里格斯導(dǎo)演的腦洞還是小了點(diǎn)：）

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

控制系統(tǒng)

控制系統(tǒng)

+關(guān)注

關(guān)注
41

文章
6642

瀏覽量
110720
機(jī)器人

機(jī)器人

+關(guān)注

關(guān)注
211

文章
28557

瀏覽量
207689
代碼

代碼

+關(guān)注

關(guān)注
30

文章
4808

瀏覽量
68812

原文標(biāo)題：Science子刊：為機(jī)器人復(fù)制腦代碼，無限接近人類決策

文章出處：【微信號(hào)：AI_era，微信公眾號(hào)：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊

具身智能機(jī)器人的基礎(chǔ)模塊，這個(gè)是本書的第二部分內(nèi)容，主要分為四個(gè)部分：機(jī)器人計(jì)算系統(tǒng)，自主機(jī)器人的感知系統(tǒng)，自主機(jī)器人的定位系統(tǒng)，自主機(jī)器人

發(fā)表于 01-04 19:22

《具身智能機(jī)器人系統(tǒng)》第10-13章閱讀心得之具身智能機(jī)器人計(jì)算挑戰(zhàn)

閱讀《具身智能機(jī)器人系統(tǒng)》第10-13章，我對(duì)具身智能機(jī)器人的工程實(shí)踐有了全新認(rèn)識(shí)。第10章從實(shí)時(shí)性角度剖析了機(jī)器人計(jì)算加速問題。機(jī)器人定位中

發(fā)表于 01-04 01:15

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型

的局限性以及衡量大模型的關(guān)鍵指標(biāo)。閱讀了該部分后，我感受到了一種前所未有的震撼，這種震撼不僅來源于技術(shù)本身的先進(jìn)性，更來源于它對(duì)傳統(tǒng)機(jī)器人控制方式的顛覆。傳統(tǒng)機(jī)器人的局限性與大模型的

發(fā)表于 12-29 23:04

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

現(xiàn)狀和前沿研究，詳細(xì)介紹大模型的構(gòu)建方法、訓(xùn)練數(shù)據(jù)、模型架構(gòu)和優(yōu)化技術(shù)。第4部分(第10章到第13章)深入探討提升機(jī)器人計(jì)算實(shí)時(shí)性、算法安全性、系統(tǒng)可靠性及具身智能數(shù)據(jù)挑戰(zhàn)的具身智能機(jī)器人

發(fā)表于 12-28 21:12

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.全書概覽與第一章學(xué)習(xí)

景不確定性、產(chǎn)業(yè)鏈成本高企、系統(tǒng)集成難度大、數(shù)據(jù)瓶頸、倫理規(guī)范的挑戰(zhàn)。其中系統(tǒng)集成難度大中，作者非常形象地將具身智能機(jī)器人分解為“大腦”、“小腦”和“軀干”三個(gè)關(guān)鍵技術(shù)，其中“大腦”就是機(jī)器

發(fā)表于 12-27 14:50

《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

醫(yī)療領(lǐng)域，手術(shù)輔助機(jī)器人需要毫米級(jí)的精確控制，書中有介紹基于視覺伺服的實(shí)時(shí)控制算法，以及如何利用大模型優(yōu)化手術(shù)路徑規(guī)劃。工業(yè)場(chǎng)景中，協(xié)作機(jī)器人面臨的主要挑戰(zhàn)是快速適應(yīng)新工藝流程。具身智

發(fā)表于 12-24 15:03

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值

的第二個(gè)挑戰(zhàn)是 “數(shù)據(jù)孤島”。獲取如此全面的數(shù)據(jù)充滿了挑戰(zhàn)，包括高成本、耗時(shí)要求和潛在的安全風(fēng)險(xiǎn)。大多數(shù) EAI 機(jī)器人組織僅限于在特定的受控環(huán)境中收集數(shù)據(jù)。實(shí)體之間缺乏數(shù)據(jù)共享加劇

發(fā)表于 12-24 00:33

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

解決許多技術(shù)的和非技術(shù)的挑戰(zhàn)，如提高智能體的自主性、處理復(fù)雜環(huán)境互動(dòng)的能力及確保行為的倫理和安全性。未來的研究需要將視覺、語音和其他傳感技術(shù)與機(jī)器

發(fā)表于 12-20 19:17

《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

要給AI這個(gè)聰明的“頭腦”裝上一副“身體”。這個(gè)“身體”可以是一部手機(jī)，可以是一臺(tái)自動(dòng)駕駛汽車。而人形機(jī)器人則是集各類核心尖端技術(shù)于一體的載體，是具身智能的代表產(chǎn)品。與傳統(tǒng)的軟件智能體不同，具身智能

發(fā)表于 12-19 22:26

虹科攜手Seed Robotics，開啟機(jī)器人靈巧手合作新篇章

近日，虹科與SeedRobotics正式建立合作伙伴關(guān)系，雙方將在機(jī)器人靈巧手領(lǐng)域展開深入合作，共同推動(dòng)人工智能、神經(jīng)科學(xué)、心理學(xué)和認(rèn)知科學(xué)等領(lǐng)域的創(chuàng)新研究與應(yīng)用發(fā)展。此次合作，虹科

發(fā)表于 12-05 01:00 ?374次閱讀

名單公布！【書籍評(píng)測(cè)活動(dòng)NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下一個(gè)浪潮！

智能體的自主性、處理復(fù)雜環(huán)境互動(dòng)的能力及確保行為的倫理和安全性。未來的研究需要將視覺、語音和其他傳感技術(shù)與機(jī)器人技術(shù)結(jié)合，探索更加先進(jìn)的知識(shí)表示和記憶模塊，利用強(qiáng)化學(xué)習(xí)進(jìn)一步優(yōu)化決策

發(fā)表于 11-11 10:20

機(jī)器人神經(jīng)網(wǎng)絡(luò)系統(tǒng)的特點(diǎn)包括

腦啟發(fā)的計(jì)算模型，具有高度的并行性和自適應(yīng)性。機(jī)器人神經(jīng)網(wǎng)絡(luò)系統(tǒng)是將神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用于機(jī)器人領(lǐng)域的研究和應(yīng)用，具有以下特點(diǎn)：高度的復(fù)雜性：神經(jīng)

發(fā)表于 07-09 09:45 ?495次閱讀

機(jī)器人神經(jīng)網(wǎng)絡(luò)控制原理是什么

引言 機(jī)器人技術(shù)是當(dāng)今科技發(fā)展的重要方向之一，其應(yīng)用領(lǐng)域涵蓋了工業(yè)、醫(yī)療、農(nóng)業(yè)、軍事等多個(gè)方面。機(jī)器人控制技術(shù)是實(shí)現(xiàn)機(jī)器人自主化和智能化的

發(fā)表于 07-09 09:40 ?593次閱讀

「探索」康復(fù)機(jī)器人在神經(jīng)康復(fù)中的應(yīng)用

隨著社會(huì)的發(fā)展和人口老齡化的加劇，神經(jīng)性疾病的患者數(shù)量逐年上升。神經(jīng)康復(fù)作為提高患者生活質(zhì)量、恢復(fù)神經(jīng)功能的重要手段，正面臨著巨大的挑戰(zhàn)?？祻?fù)機(jī)器人

發(fā)表于 07-02 10:25 ?365次閱讀

其利天下技術(shù)·搭載無刷電機(jī)的掃地機(jī)器人的前景如何？

已經(jīng)取得了顯著的進(jìn)步，但在技術(shù)層面仍存在一些壁壘需要突破。首先，機(jī)器人的導(dǎo)航和定位技術(shù)仍有提升空間，特別是在復(fù)雜家居環(huán)境中的精準(zhǔn)導(dǎo)航和避障能力還需加強(qiáng)。其次，掃地

發(fā)表于 05-05 15:03

搜索歷史

決策神經(jīng)科學(xué)：解決機(jī)器人技術(shù)中的關(guān)鍵挑戰(zhàn)

評(píng)論

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊

《具身智能機(jī)器人系統(tǒng)》第10-13章閱讀心得之具身智能機(jī)器人計(jì)算挑戰(zhàn)

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.全書概覽與第一章學(xué)習(xí)

《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

虹科攜手Seed Robotics，開啟機(jī)器人靈巧手合作新篇章

名單公布！【書籍評(píng)測(cè)活動(dòng)NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下一個(gè)浪潮！

機(jī)器人神經(jīng)網(wǎng)絡(luò)系統(tǒng)的特點(diǎn)包括

機(jī)器人神經(jīng)網(wǎng)絡(luò)控制原理是什么

「探索」康復(fù)機(jī)器人在神經(jīng)康復(fù)中的應(yīng)用

其利天下技術(shù)·搭載無刷電機(jī)的掃地機(jī)器人的前景如何？