0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI研究人員開發(fā)出新的機(jī)械臂

姚小熊27 ? 來(lái)源:人工智能實(shí)驗(yàn)室 ? 作者:人工智能實(shí)驗(yàn)室 ? 2021-02-23 10:40 ? 次閱讀

近日,兩個(gè)由 OpenAI 的研究人員開發(fā)的一模一樣的機(jī)械臂愛(ài)麗絲和鮑勃,可以在模擬情景中通過(guò)對(duì)弈互相學(xué)習(xí),而不需要人為輸入文本。

其中一個(gè)虛擬機(jī)械臂已經(jīng)學(xué)會(huì)解決各種不同的難題堆積木、擺放桌子、排列國(guó)際象棋棋子,并且每項(xiàng)任務(wù)不需要進(jìn)行再訓(xùn)練。這一切通過(guò)與另一個(gè)機(jī)械臂對(duì)弈得以實(shí)現(xiàn)。據(jù)了解,另一個(gè)機(jī)械臂經(jīng)過(guò)訓(xùn)練后,會(huì)給原本的機(jī)械臂臂帶來(lái)越來(lái)越難的挑戰(zhàn)。

這些機(jī)器人采用的是強(qiáng)化學(xué)習(xí)算法,即在不同情況下,通過(guò)試錯(cuò)來(lái)訓(xùn)練人工智能,并采取不同行動(dòng)來(lái)實(shí)現(xiàn)目標(biāo)。游戲包括在虛擬桌面上移動(dòng)物體。例如,通過(guò)以特定的方式排列物體,愛(ài)麗絲試圖設(shè)置對(duì)鮑勃來(lái)說(shuō)很難解決的謎題,而鮑勃會(huì)試圖解決愛(ài)麗絲的謎題。隨著它們的學(xué)習(xí),愛(ài)麗絲會(huì)設(shè)置更復(fù)雜的謎題,而鮑勃也會(huì)越來(lái)越會(huì)解謎。

經(jīng)過(guò)愛(ài)麗絲設(shè)置的積木謎題的訓(xùn)練后,鮑勃便可以通用于一系列任務(wù),包括擺放桌子和排列象棋棋子。

通常在多重任務(wù)處理中,深度學(xué)習(xí)模型必須在任務(wù)間進(jìn)行再訓(xùn)練。例如,AlphaZero (一款棋類 AI,可以通過(guò)自我博弈來(lái)學(xué)習(xí))會(huì)使用單一算法教自己下國(guó)際象棋、將棋和圍棋但每次只能下一盤棋。例如,下國(guó)際象棋的時(shí) AlphaZero 不能下圍棋,下圍棋時(shí)的 AlphaZero 不能下將棋。因此,造出真正能同時(shí)處理多任務(wù)的機(jī)器,是走向更通用的人工智能道路上的一大未解難題。

訓(xùn)練 AI 同時(shí)執(zhí)行多重任務(wù)時(shí)會(huì)遇到一個(gè)問(wèn)題,即需要大量的例子。OpenAI 則通過(guò)訓(xùn)練愛(ài)麗絲為鮑勃生成例子,用一個(gè) AI 訓(xùn)練另一個(gè) AI 來(lái)避免這個(gè)問(wèn)題。經(jīng)過(guò)訓(xùn)練,愛(ài)麗絲學(xué)會(huì)了設(shè)定目標(biāo),比如建造一座積木塔,然后把它撿起來(lái)并加以平衡。鮑勃學(xué)會(huì)了利用虛擬環(huán)境的屬性,如通過(guò)摩擦力來(lái)抓取和旋轉(zhuǎn)物體。

截至目前,虛擬現(xiàn)實(shí)的訓(xùn)練只在虛擬環(huán)境中進(jìn)行,但 OpenAI 和其他機(jī)構(gòu)的研究人員正在將虛擬環(huán)境中訓(xùn)練的模型轉(zhuǎn)移到物理環(huán)境中,且越來(lái)越有起色。據(jù)悉,模擬環(huán)境可以讓 AI 在短時(shí)間內(nèi)處理大型數(shù)據(jù)集,然后研究人員會(huì)根據(jù)現(xiàn)實(shí)世界的環(huán)境再對(duì)其進(jìn)行微調(diào)。

該團(tuán)隊(duì)的研究人員表示,他們的最終目標(biāo)是訓(xùn)練這些機(jī)械臂去解決人類可能要求它做的任何任務(wù)。與 GPT-3 一樣(GPT-3 是一個(gè)能以各種不同方式使用語(yǔ)言的語(yǔ)言模型),這些機(jī)器人手臂是 OpenAI 打造多任務(wù)人工智能整體目標(biāo)的一部分,而使用一個(gè) AI 來(lái)訓(xùn)練另一個(gè) AI 也許是其中的關(guān)鍵所在。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30898

    瀏覽量

    269130
  • 機(jī)械臂
    +關(guān)注

    關(guān)注

    12

    文章

    515

    瀏覽量

    24590
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1089

    瀏覽量

    6527
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    OpenAI投資道德算法研究

    近日,據(jù)外媒最新報(bào)道,人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI正在積極投資學(xué)術(shù)研究,致力于開發(fā)一種能夠預(yù)測(cè)人類道德判斷的算法。這一舉措無(wú)疑將為人工智能的道德發(fā)展注入新的活力。 據(jù)了解,OpenAI
    的頭像 發(fā)表于 11-26 10:20 ?335次閱讀

    OrangePi AIpro應(yīng)用:機(jī)械應(yīng)用開發(fā)指南

    2024世界人工智能大會(huì)上,香橙派攜OrangePiAIpro20T在世博展覽館H1-A301展區(qū)亮相,給大家?guī)?lái)AI+互動(dòng)的沉浸式體驗(yàn)。其中,搭載OrangePiAIpro開發(fā)板的智能機(jī)械吸引了
    的頭像 發(fā)表于 08-19 16:42 ?588次閱讀
    OrangePi AIpro應(yīng)用:<b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b>應(yīng)用<b class='flag-5'>開發(fā)</b>指南

    大象機(jī)器人開源協(xié)作機(jī)械機(jī)械接入GPT4o大模型!

    本文已經(jīng)或者同濟(jì)子豪兄作者授權(quán)對(duì)文章進(jìn)行編輯和轉(zhuǎn)載 引言 隨著人工智能和機(jī)器人技術(shù)的快速發(fā)展,機(jī)械在工業(yè)、醫(yī)療和服務(wù)業(yè)等領(lǐng)域的應(yīng)用越來(lái)越廣泛。通過(guò)結(jié)合大模型和多模態(tài)AI,機(jī)械能夠?qū)?/div>
    的頭像 發(fā)表于 07-03 14:09 ?935次閱讀
    大象機(jī)器人開源協(xié)作<b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b><b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b>接入GPT4o大模型!

    OpenAI發(fā)出警告信:多國(guó)開發(fā)者面臨API封鎖 OpenAI API解決方案

    發(fā)出的警告信明確指出,如果開發(fā)者繼續(xù)在OpenAI不允許的國(guó)家使用其API,他們的訪問(wèn)權(quán)限將被封鎖。信中強(qiáng)調(diào)了公司政策的嚴(yán)肅性,并呼吁開發(fā)者遵守相關(guān)規(guī)定。信中具體提到: 違規(guī)行為 :
    的頭像 發(fā)表于 06-26 11:29 ?1308次閱讀
    <b class='flag-5'>OpenAI</b><b class='flag-5'>發(fā)出</b>警告信:多國(guó)<b class='flag-5'>開發(fā)</b>者面臨API封鎖 <b class='flag-5'>OpenAI</b> API解決方案

    基于六維力傳感器的機(jī)械自動(dòng)裝配應(yīng)用

    六維力傳感器是一種特殊的力覺(jué)傳感器,可以測(cè)量物體在笛卡爾坐標(biāo)系下三個(gè)軸向的力和力矩,其內(nèi)部采用高度敏感的材料和精密機(jī)械構(gòu)造,可以為機(jī)械提供更高的測(cè)量精度,滿足不同場(chǎng)景下的測(cè)量需求。作為機(jī)械
    的頭像 發(fā)表于 06-06 13:49 ?778次閱讀
    基于六維力傳感器的<b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b>自動(dòng)裝配應(yīng)用

    OpenAI推出ChatGPT大學(xué)教育版

    近日,OpenAI宣布推出了一款專為大學(xué)設(shè)計(jì)的人工智能產(chǎn)品——ChatGPT Edu。這款全新的AI工具旨在服務(wù)于學(xué)生、教職員工、研究人員以及校園運(yùn)營(yíng),以滿足他們?cè)诓煌瑘?chǎng)景下的智能化需求。
    的頭像 發(fā)表于 06-06 09:48 ?527次閱讀

    OpenAI推出ChatGPT Edu,助力教育及學(xué)術(shù)領(lǐng)域AI應(yīng)用普及

    OpenAI近日宣布推出全新服務(wù)——ChatGPT Edu,旨在推動(dòng)教育機(jī)構(gòu)與學(xué)術(shù)單位在人工智能領(lǐng)域的深入應(yīng)用與發(fā)展。此舉不僅彰顯了OpenAI在普及AI技術(shù)方面的決心,也為廣大師生及研究人員提供了強(qiáng)有力的技術(shù)支撐。
    的頭像 發(fā)表于 06-04 09:17 ?538次閱讀

    OpenAI推出專用的AI檢測(cè)工具

    OpenAI最近推出了一款全新的AI檢測(cè)工具,這款工具專門針對(duì)由DALL·E 3模型生成的圖片。令人印象深刻的是,該工具能夠精準(zhǔn)識(shí)別出這類圖片,其準(zhǔn)確率高達(dá)98%。這一舉措的主要目的是為了協(xié)助研究人員在內(nèi)容真實(shí)性方面進(jìn)行深入的研究
    的頭像 發(fā)表于 05-09 10:01 ?526次閱讀

    研究人員利用定制光控制二維材料的量子特性

    光波控制谷值選擇性帶隙修正 一個(gè)科學(xué)家團(tuán)隊(duì)開發(fā)出了一種利用光的結(jié)構(gòu)來(lái)扭曲和調(diào)整量子材料特性的方法。他們的研究成果發(fā)表在今天的《自然》(Nature)雜志上,為下一代量子電子學(xué)、量子計(jì)算和信息技術(shù)
    的頭像 發(fā)表于 05-06 06:29 ?251次閱讀
    <b class='flag-5'>研究人員</b>利用定制光控制二維材料的量子特性

    研究人員開發(fā)出高性能p型非晶氧化物半導(dǎo)體

    和 107 的開/關(guān)電流比,與早期 n 型氧化物薄膜晶體管的關(guān)鍵電氣屬性非常相似。此外,薄膜晶體管在長(zhǎng)時(shí)間偏置應(yīng)力下表現(xiàn)出顯著的穩(wěn)定性以及大面積薄膜的均勻性。 圖源:浦項(xiàng)工科大學(xué) 研究人員合作開發(fā)了碲硒復(fù)合氧化物半導(dǎo)體材料。他們成功創(chuàng)造了高性能和高穩(wěn)定性的p型薄膜晶體管(
    的頭像 發(fā)表于 04-30 14:58 ?512次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>開發(fā)出</b>高性能p型非晶氧化物半導(dǎo)體

    如何去提升機(jī)械的位置控制性能?

    1.背景介紹 機(jī)械的位置控制是機(jī)械最重要的功能。機(jī)械的位置控制精度也是
    的頭像 發(fā)表于 03-05 08:43 ?982次閱讀
    如何去提升<b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b>的位置控制性能?

    OpenAI發(fā)布首個(gè)文生視頻模型Sora

    開發(fā)出熱門聊天機(jī)器人ChatGPT后,OpenAI繼續(xù)在生成式人工智能上玩出新花樣。
    的頭像 發(fā)表于 02-19 13:56 ?1060次閱讀

    【先楫HPM5361EVK開發(fā)板試用體驗(yàn)】(原創(chuàng))5.手把手實(shí)戰(zhàn)AI機(jī)械

    HPM5361EVK開發(fā)板?,F(xiàn)在開始設(shè)計(jì)實(shí)戰(zhàn)AI機(jī)械的程序。 代碼結(jié)構(gòu) 由于編寫一個(gè)完整的用先楫HPM5361EVK開發(fā)板控制三組四自由度機(jī)械
    發(fā)表于 02-06 10:28

    【國(guó)產(chǎn)FPGA+OMAPL138開發(fā)板體驗(yàn)】(原創(chuàng))2.手把手玩轉(zhuǎn)游戲機(jī)械

    。但由于篇幅限制,下面是一個(gè)簡(jiǎn)化的項(xiàng)目方案和步驟: (我會(huì)盡量逐行解釋關(guān)鍵部分的代碼。謝謝?。?1. 硬件連接與配置 首先,需要將TI OMAP-L138 FPGA處理器開發(fā)板、三組四自由度機(jī)械以及紅外
    發(fā)表于 02-01 20:18

    無(wú)需電池、自供電,MIT開發(fā)出新型傳感器

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)近日,麻省理工學(xué)院(MIT)的研究人員發(fā)表論文稱,該團(tuán)隊(duì)開發(fā)出了一種無(wú)需電池、自供電的傳感器,可以從環(huán)境中獲取能量。由于它不需要必須充電或更換電池,也不需要特殊的布線
    的頭像 發(fā)表于 01-24 00:05 ?3445次閱讀
    無(wú)需電池、自供電,MIT<b class='flag-5'>開發(fā)出新</b>型傳感器