0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepMind全新AI項目曝光:可控制各類機器人,數據集有望開源

jf_WZTOguxH ? 來源:AI前線 ? 2023-10-09 15:41 ? 次閱讀

DeepMind 的新項目是什么?

開發(fā)機器人技術的一大挑戰(zhàn),就在于必須投入大量精力來為每臺機器人、每項任務和每種環(huán)境訓練機器學習模型。近日,谷歌 DeepMind 團隊及其他 33 個研究機構正共同發(fā)起新項目,旨在創(chuàng)建一套通用 AI 系統(tǒng)來應對這個挑戰(zhàn)。據稱該系統(tǒng)能夠與不同類型的物理機器人協(xié)同運作,成功執(zhí)行多種任務。

谷歌機器人部門高級軟件工程師 Pannag Sanketi 在采訪中表示,“我們觀察到,機器人在專項領域表現(xiàn)極佳,但在通用領域卻缺乏靈性。一般來講,大家需要為每項任務、每臺機器人和每種環(huán)境分別訓練一套模型,從零開始調整每一個變量。”

為了克服這個問題,讓機器人的訓練和部署變得更加輕松、快捷,谷歌 DeepMind 在名為 Open X-Embodiment 的大型共享數據庫項目中引入了兩大關鍵組件:一套包含了 22 種機器人類型數據的數據集,外加一系列能夠跨多種任務進行技能遷移的模型 RT-1-X(這是一個源自 RT-1 的機器人變壓器模型)。為了開發(fā) Open X-Embodiment 數據集,研發(fā)人員在超過 100 萬個場景中展示了 500 多種技能和 150,000 項任務,因此,該數據集也是同類中最全面的機器人數據集。

此外,研究人員還在機器人實驗室和不同類型的物理裝置之上對模型進行了測試,并發(fā)現(xiàn)與傳統(tǒng)機器人訓練方法相比,新方案確實能取得更好的成績。

139c5730-666d-11ee-939d-92fbcf53809c.png

來自 Open X-Embodiment 數據集的樣本展示了 500 多種技能和 150,000 項任務。

13b3be70-666d-11ee-939d-92fbcf53809c.png

Open X-Embodiment 數據集結合了跨實施例、數據集和技能的數據。

結合機器人數據

通常來講,不同類型的機器人往往擁有獨特的傳感器和執(zhí)行器,所以需要配合專門的軟件模型。這就類似于不同生物體的大腦和神經系統(tǒng)需要專門進化,從而適應該生物的身體結構與所處環(huán)境。

但 Open X-Embodiment 的誕生卻出于這樣一條先驗性的假設:將來自不同機器人和任務的數據結合起來,就能創(chuàng)建一套優(yōu)于專用模型的通用模型,足以驅動所有類型的機器人。這個概念在一定程度上受到大語言模型(LLM)的啟發(fā),即在使用大型通用數據集進行訓練時,模型成果的匹配度甚至可以優(yōu)于在特定數據集上訓練的小型針對性模型。而研究人員驚喜地發(fā)現(xiàn),此項原理果然也適用于機器人領域。

為了創(chuàng)建 Open X-Embodiment 數據集,研究團隊收集了來自不同國家 20 個機構的 22 臺機器人具身的真實數據。該數據集包含超 100 萬種情節(jié)(所謂情節(jié),是指機器人每次嘗試執(zhí)行任務時所采取的一系列動作),其中具體涉及 500 多種技能和 15 萬個任務示例。

隨附的各模型均基于 Transformer,一套在大語言模型中也得以應用的深度學習架構。RT-1-X 建立在 Robotics Transformer 1(簡稱 RT-1)之上,是一套適用于在真實環(huán)境下實現(xiàn)機器人技術規(guī)?;亩嗳蝿漳P汀T-2-X 則建立在 RT-1 后繼者 RT-2 的基礎之上——RT-2 是一種視覺語言動作(VLA)模型,能夠從機器人和網絡數據中學習,并具備響應自然語言命令的能力。

研究人員在五所不同研究實驗室的五臺常用機器人上測試了 RT-1-X 對各類任務的執(zhí)行能力。與針對這些機器人開發(fā)的專用模型相比,RT-1-X 在拾取和移動物體、以及開門等任務上的成功率高出 50%。該模型還能將技能遷移至多種不同環(huán)境,這也是在特定視覺場景下訓練出的專用模型所做不到的。由此可見,由不同示例集訓練而成的模型在大多數任務中都優(yōu)于專用模型。論文還提到,此模型適用于從機械手臂到四足動物在內的多種機器人。

加州大學伯克利分校副教授、論文聯(lián)合作者 Sergey Levine 寫道,“對于任何曾有機器人研究經驗的朋友來說,都能意識到這是多么了不起:這類模型「從來」就沒能第一次就嘗試成功,但這個模型卻做到了?!?/p>

13c8a75e-666d-11ee-939d-92fbcf53809c.png

值得注意的是,即使是規(guī)模較小的 RT-1-X 模型,也實現(xiàn)了對各實驗室內部專用模型的超越!對于任何曾有機器人研究經驗的朋友來說,都能意識到這是多么了不起:這類模型“從來”就沒能第一次就嘗試成功,但這個模型卻做到了。

在應急技能和處理訓練數據集中未涉及的新任務方面,RT-2-X 的成功率可達 RT-2 的 3 倍。具體來講,RT-2-X 在需要空間認知的任務上表現(xiàn)出更好的性能,例如理解“將蘋果放到布旁邊”和“將蘋果放到布上”兩種要求間的區(qū)別。

研究人員在 Open X 和 RT-X 的發(fā)布博文中寫道,“我們的結果表明,與其他平臺的數據進行聯(lián)合訓練之后,RT-2-X 獲得了原始數據集中并不具備的額外技能,使其能夠執(zhí)行前所未見的新任務?!?/p>

步步邁向機器人研究的新未來

展望未來,科學家們正在考慮將這些進展與 DeepMind 開發(fā)的自我改進模型 RoboCat 的見解相結合,希望探索出新的研究方向。RoboCat 能夠學會在不同機械臂上執(zhí)行各種任務,然后自動設計出新的訓練數據以提高自身性能。

Sanketi 認為,另一個潛在的研究方向,也可能是進一步研究不同數據集間的混合會如何影響跨機器人具身的能力泛化與改進效果。

該團隊目前已經開源了 Open X-Embodiment 數據集和小型 RT-1-X 模型,但并未公開 RT-2-X 模型。

Sanketi 總結道,“我們相信,這些工具將改變機器人的訓練方式,并加速該領域的研究進展。我們希望開源相關數據,并提供安全但受限的模型以減少障礙、加速研究。機器人技術的未來離不開機器人之間的相互學習,而這一切的前提,首先要求研究人員之間能夠相互學習?!?/p>

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28597

    瀏覽量

    207831
  • AI
    AI
    +關注

    關注

    87

    文章

    31364

    瀏覽量

    269765
  • 數據集
    +關注

    關注

    4

    文章

    1209

    瀏覽量

    24768
  • DeepMind
    +關注

    關注

    0

    文章

    131

    瀏覽量

    10901

原文標題:DeepMind 全新 AI 項目曝光:可控制各類機器人,數據集有望開源

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    《具身智能機器人系統(tǒng)》第10-13章閱讀心得之具身智能機器人計算挑戰(zhàn)

    閱讀《具身智能機器人系統(tǒng)》第10-13章,我對具身智能機器人的工程實踐有了全新認識。第10章從實時性角度剖析了機器人計算加速問題。機器人定位
    發(fā)表于 01-04 01:15

    開源項目!能夠精確地行走、跳舞和執(zhí)行復雜動作的機器人—Tillu

    認識Tillu——機器人 Tillu是一款融合先進機器人技術與創(chuàng)造力的獨特機器人,旨在激發(fā)學習與創(chuàng)新!它由運行Debian操作系統(tǒng)的UNIHIKER驅動,利用強大的控制系統(tǒng)實現(xiàn)逼真的動
    發(fā)表于 01-02 17:24

    【「具身智能機器人系統(tǒng)」閱讀體驗】+數據在具身人工智能中的價值

    數據。例如,自主導航機器人需要處理大量環(huán)境數據,以增強其路徑規(guī)劃和避障能力。此外,數據的精度直接影響
    發(fā)表于 12-24 00:33

    《具身智能機器人系統(tǒng)》第1-6章閱讀心得之具身智能機器人系統(tǒng)背景知識與基礎模塊

    要給AI這個聰明的“頭腦”裝上一副“身體”。這個“身體”可以是一部手機,可以是一臺自動駕駛汽車。而人形機器人則是各類核心尖端技術于一體的載體,是具身智能的代表產品。與傳統(tǒng)的軟件智能體
    發(fā)表于 12-19 22:26

    開源項目!OpenCat—— 一個全能的平價四足機器人

    Arduino。一個人工遙控器處于中間位置,可以攔截機器人對自身身體的控制。它仍將保留某些本能,比如拒絕跳下懸崖。 目前,我有兩個功能原型: 迷你模型是一個獨立的8 自由度(支持多達 16 自由度
    發(fā)表于 12-16 11:44

    名單公布!【書籍評測活動NO.51】具身智能機器人系統(tǒng) | 了解AI的下一個浪潮!

    試用評測資格! 早就聽大佬們說,具身智能是人工智能的下一波浪潮,也是AI未來的趨勢! 最近,具身智能的概念更是炙手可熱,備受矚目! 不論是這幾天稚暉君開源人形機器人全套圖紙+代碼,引發(fā)圈內熱議
    發(fā)表于 11-11 10:20

    “0元購”智元靈犀X1機器人,軟硬件全套圖紙和代碼全公開!資料免費下載!

    、仿真Sim2Sim、Sim2Real代碼、強化學習訓練代碼、模型轉換、推理工具,和調試工具(數據可視化、遙控器)等等,“一站式”全套圖紙和代碼幫助大家更好地學習人形機器人開發(fā)流程。作為業(yè)內首家全棧開源
    發(fā)表于 10-25 15:20

    認識機器人與CW32四足機器人控制項目

    認識機器人與CW32四足機器人控制項目 一、認識機器人 機器人是一種能夠自動執(zhí)行任務的
    的頭像 發(fā)表于 09-28 15:46 ?269次閱讀

    開源項目!用ESP32做一個可愛的無用機器人

    簡介 作者在完成碩士論文答辯后,利用空閑時間制作了一個他一直想做的機器人——可愛無用機器人。 無用機器人原理是一個連接到開關的電機,通過邏輯門控制。當開關被推到“開”時,
    發(fā)表于 09-03 09:34

    開源項目!用ESP32做一個可愛的無用機器人

    簡介 作者在完成碩士論文答辯后,利用空閑時間制作了一個他一直想做的機器人——可愛無用機器人。 無用機器人原理是一個連接到開關的電機,通過邏輯門控制。當開關被推到“開”時,
    發(fā)表于 08-30 14:50

    谷歌借助Gemini AI系統(tǒng)深化對機器人的訓練

    7月12日,國際科技界傳來新動態(tài),谷歌正借助其先進的Gemini AI系統(tǒng),深化對旗下機器人的訓練,旨在顯著提升它們的導航能力和任務執(zhí)行能力。DeepMind機器人團隊最新發(fā)布的研究論
    的頭像 發(fā)表于 07-12 16:29 ?659次閱讀

    Al大模型機器人

    理解能力強大: AI大模型機器人可以理解和生成自然語言,能夠進行復雜的對話和語言任務。它們能夠識別語言中的語義、語境和情感,并據此作出適當的回應。廣泛的知識儲備: 這些模型基于大規(guī)模的數據
    發(fā)表于 07-05 08:52

    智能機器人控制系統(tǒng)驅動高效生產

    MC系列控制器結合CODESYS編程環(huán)境和宏SC安全控制器,為用戶提供全方位的智能機器人運動控制
    的頭像 發(fā)表于 05-23 14:10 ?416次閱讀
    宏<b class='flag-5'>集</b>智能<b class='flag-5'>機器人</b><b class='flag-5'>控制</b>系統(tǒng)驅動高效生產

    其利天下技術·搭載無刷電機的掃地機器人的前景如何?

    大的吸力,有效清除各類污漬和顆粒物。同時,低噪音設計使得機器在工作時不會打擾到家庭成員的休息或工作。此外,無刷電機的壽命更長,減少了用戶的維護成本,提高了產品的性價比。 2.掃地機器人智能化程度的提升
    發(fā)表于 05-05 15:03

    英偉達推出全新AI聊天機器人

    近日,英偉達(Nvidia)宣布推出其全新AI聊天機器人——“Chat With RTX”。這款聊天機器人被視為英偉達版的ChatGPT,為用戶提供了一個
    的頭像 發(fā)表于 02-19 11:09 ?964次閱讀