10月27日消息,據(jù)外媒報(bào)道,約翰斯霍普金斯大學(xué)博士生安德魯洪特(Andrew Hundt) 近日發(fā)布一篇新論文,指出應(yīng)通過正強(qiáng)化法訓(xùn)練機(jī)器人學(xué)習(xí)新技能。
這篇論文的核心思想是,在訓(xùn)練機(jī)器人的過程中,應(yīng)采用正強(qiáng)化法,即相比于在它做錯(cuò)時(shí)進(jìn)行懲罰,更應(yīng)在它做對(duì)時(shí)進(jìn)行激勵(lì)。而對(duì)于機(jī)器人來說,這種激勵(lì)機(jī)制是以評(píng)分系統(tǒng)的形式呈現(xiàn)的,類似玩游戲一樣,根據(jù)執(zhí)行任務(wù)的情況獲得積分。
安德魯表示,這種方法能夠大大縮短訓(xùn)練機(jī)器人執(zhí)行任務(wù)的時(shí)間?!皺C(jī)器人希望能得到更高的分?jǐn)?shù),所以它們很快就可以完成相關(guān)任務(wù)。過去機(jī)器人需要一個(gè)月的練習(xí)才能達(dá)到100%的準(zhǔn)確性,現(xiàn)在只用兩天就能做到?!?/p>
不過他也指出,目前機(jī)器人執(zhí)行的這些任務(wù)仍然是比較初級(jí)的,比如堆積木。但在未來,機(jī)器人有望通過正強(qiáng)化法完成更復(fù)雜和有意義的任務(wù)。
責(zé)任編輯:YYX
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
相關(guān)推薦
通用人形機(jī)器人旨在快速適應(yīng)現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復(fù)或體力要求高的任務(wù)。這些移動(dòng)機(jī)器人經(jīng)過設(shè)計(jì),能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療保健機(jī)構(gòu),它們的價(jià)值日益凸顯。
發(fā)表于 01-16 10:58
?143次閱讀
工智能
認(rèn)知發(fā)展機(jī)器人學(xué)
進(jìn)化機(jī)器人學(xué)
物理體現(xiàn)與互動(dòng)
五、具身智能的現(xiàn)代技術(shù)方向
另外,隨著GPT等大語言模型的發(fā)展,這些技術(shù)也在具身智能機(jī)器人領(lǐng)域掀起了一股浪潮,那就是基于大模型的具身智能技術(shù)
發(fā)表于 12-28 21:12
非常感謝電子發(fā)燒友提供的這次書籍測評(píng)活動(dòng)!最近,我一直在學(xué)習(xí)大模型和人工智能的相關(guān)知識(shí),深刻體會(huì)到機(jī)器人技術(shù)是一個(gè)極具潛力的未來方向,甚至可以說是推動(dòng)時(shí)代變革的重要力量。能參與這次活動(dòng)并有機(jī)會(huì)深入
發(fā)表于 12-27 14:50
和經(jīng)驗(yàn)積累,使機(jī)器人能夠自主發(fā)現(xiàn)工藝規(guī)律,優(yōu)化作業(yè)參數(shù)。家庭服務(wù)機(jī)器人則采用混合任務(wù)規(guī)劃策略:將預(yù)訓(xùn)練的基礎(chǔ)技能與實(shí)時(shí)規(guī)劃相結(jié)合,靈活應(yīng)對(duì)開放環(huán)境中的各種情況。
第9章深入探討了元
發(fā)表于 12-24 15:03
100 倍 。此外,Sim2Real 技術(shù)的進(jìn)步也促進(jìn)了技能與知識(shí)從模擬環(huán)境到實(shí)際應(yīng)用的轉(zhuǎn)移。這項(xiàng)技術(shù)在虛擬空間中訓(xùn)練機(jī)器人和 AI 系統(tǒng),使它們能夠安全有效地學(xué)習(xí)任務(wù),而不受現(xiàn)實(shí)世
發(fā)表于 12-24 00:33
動(dòng)態(tài)互動(dòng)的。
該理論強(qiáng)調(diào)智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務(wù)的能力。具身智能的實(shí)現(xiàn)涵蓋了機(jī)器學(xué)習(xí)、人工智能、機(jī)器人學(xué)、計(jì)算機(jī)視覺、自然語言處理及強(qiáng)化學(xué)
發(fā)表于 12-20 19:17
NVIDIA 在本周于德國慕尼黑舉行的機(jī)器人學(xué)習(xí)大會(huì)(CoRL)上發(fā)布了全新 AI 和仿真工具以及工作流。機(jī)器人開發(fā)者可以使用這些工具和工作流,大大加快 AI 機(jī)器人(包括人形機(jī)器人)
發(fā)表于 11-09 11:52
?309次閱讀
近日,據(jù)TechCrunch報(bào)道,麻省理工學(xué)院的研究團(tuán)隊(duì)展示了一種創(chuàng)新的機(jī)器人訓(xùn)練模型,該模型突破了傳統(tǒng)模仿學(xué)習(xí)方法的局限,不再依賴標(biāo)準(zhǔn)數(shù)據(jù)集,而是借鑒了大型語言模型(LLM)如GPT-4等所使用的大規(guī)模信息處理方式,為
發(fā)表于 11-04 14:56
?520次閱讀
在機(jī)器人學(xué)中,三大矩陣主要指的是與機(jī)器人位移、速度和力相關(guān)的矩陣,它們分別揭示了機(jī)器人在不同空間(如關(guān)節(jié)空間和作業(yè)空間)之間的映射關(guān)系。這三大矩陣及其關(guān)系式可以概括如下: 1. T矩陣(變換矩陣
發(fā)表于 09-04 09:37
?1675次閱讀
理解機(jī)器學(xué)習(xí)中的訓(xùn)練集、驗(yàn)證集和測試集,是掌握機(jī)器學(xué)習(xí)核心概念和流程的重要一步。這三者不僅構(gòu)成了模型學(xué)習(xí)
發(fā)表于 07-10 15:45
?4491次閱讀
豐富的知識(shí)儲(chǔ)備。它們可以涵蓋各種領(lǐng)域的知識(shí),并能夠回答相關(guān)問題。靈活性與通用性: AI大模型機(jī)器人具有很強(qiáng)的靈活性和通用性,能夠處理各種類型的任務(wù)和問題。持續(xù)學(xué)習(xí)和改進(jìn): 這些模型可以通過持續(xù)的訓(xùn)練
發(fā)表于 07-05 08:52
觀眾展示了用于人形機(jī)器人學(xué)習(xí)的通用基礎(chǔ)模型 Project GR00T(代表通用機(jī)器人 00 技術(shù))。Project GR00T 利用 NVIDIA Isaac 機(jī)器人平臺(tái)的各種工具來創(chuàng)建用于人形
發(fā)表于 06-04 18:00
?7745次閱讀
NVIDIA 宣布與 Intrinsic.ai 就工業(yè)機(jī)器人任務(wù)的基礎(chǔ)技能模型學(xué)習(xí)展開合作。
發(fā)表于 05-17 10:33
?1367次閱讀
NVIDIA Isaac機(jī)器人平臺(tái)近期實(shí)現(xiàn)重大升級(jí),通過引入最新的生成式AI技術(shù)和先進(jìn)的仿真技術(shù),顯著加速了AI機(jī)器人技術(shù)的發(fā)展步伐。該平臺(tái)正不斷擴(kuò)展其基礎(chǔ)模型、機(jī)器人學(xué)習(xí)框架、AI工作流編排以及
發(fā)表于 03-27 10:36
?715次閱讀
RGB顏色空間由紅綠藍(lán)三種基本色組成,疊加成任意色彩,同樣地,任意一種顏色也可以拆解為三種基本色的組合,機(jī)器人通過顏色坐標(biāo)值來理解“顏色”。
發(fā)表于 03-13 10:07
?320次閱讀
評(píng)論