国产一级做a爰片久久毛片,91麻豆精品国产91久久久久久,玩弄放荡人妻少妇系列视频

編者按：關(guān)于訓(xùn)練機器人抓手的研究并不少，大多都是從計算機視覺的角度出發(fā)，訓(xùn)練機器人“看得清”、“抓得準(zhǔn)”。本文同樣如此，不過與以往觀察彩色圖片不同，伯克利的研究者們借助“深度圖像”這個“利器”，提出了一種更加高效的方法，能讓機器人成功抓起此前并未見過的物體。

左：3D立方體。右：對應(yīng)深度圖像，距相機越近顏色越深。

早在AlexNet誕生的兩年前，微軟就為X-Box推出了Kinect。隨著深度學(xué)習(xí)加速了超參數(shù)函數(shù)的性能，這種低成本的深度感知器層出不窮，也使得深度學(xué)習(xí)在圖像分類、語音識別和語言翻譯中取得了驚人的效果。如今，深度學(xué)習(xí)在端到端的電子游戲、機器人操控等問題中也表現(xiàn)出大有前景的勢頭。

在機器人感知方面，類似于VGG或ResNet的卷積神經(jīng)網(wǎng)絡(luò)成為了主流選擇。在一些機器人或計算機視覺的任務(wù)中，常會用到這些框架，附帶有經(jīng)過與訓(xùn)練的權(quán)重，進行遷移學(xué)習(xí)或?qū)唧w數(shù)據(jù)進行微調(diào)。但是在某些任務(wù)中，只了解圖像的顏色是很有限的。當(dāng)你想訓(xùn)練機器人抓住一個陌生物體時，更重要的是讓機器人了解周圍環(huán)境的幾何結(jié)構(gòu)，而不僅僅是顏色和材質(zhì)。對目標(biāo)物體進行控制時的物理過程，即通過力量控制一個或多個物體，取決于目標(biāo)的形狀、擺放位置和其他和顏色無關(guān)的因素。例如，當(dāng)你手中拿筆時，不用看就能改變手中筆的位置。于是，這里有一個問題：這在彩色圖像上也能成立嗎？

與彩色圖像相對應(yīng)的是深度圖像，它是只有單個通道的灰度圖像，可以測量到相機的深度值，讓我們了解一幅圖像中目標(biāo)物體的除了顏色以外的特征。我們還可以用深度來“過濾”一定范圍之外的點，這可以用來去除背景噪聲（如文中開頭的圖像示例）。

這篇文章中，我們將深度圖像和深度學(xué)習(xí)結(jié)合起來，用在伯克利AUTOLab三個正在進行的項目中：用于機器人抓取的Dex-Net、復(fù)雜目標(biāo)分割以及讓機器人整理床鋪。

深度感知簡介

深度圖像將物體表面到相機的距離進行編碼，顯示出了特殊的視角。在文章開頭的案例圖片里，左邊的立方體3D結(jié)構(gòu)圖中有很多點都處于離相機不同的位置上。右邊的深度圖像中，顏色越深的地方表示距離相機越近。

深度感知最近的成果

在計算機視覺和深度學(xué)習(xí)不斷進步的同時，深度感知領(lǐng)域也出現(xiàn)了許多成果。

通常，深度感知會將兩個不同相機生成的RGB圖像結(jié)合在一起，然后利用生成的視差圖獲取物體在環(huán)境中的深度值。

目前常用的深度傳感器是結(jié)構(gòu)光傳感器，它可以用一種看不見的波長將一直物體的形狀投射到某場景中，比如我們熟知的Kinect。另一種深度感知的方法就是LIDAR，這種技術(shù)此前常用于地形測繪，最近在一些自動駕駛汽車上也出現(xiàn)了它的身影。LIDAR比Kinect生成的深度映射質(zhì)量更高，但是速度較慢、成本高昂，因為它需要掃描激光器。

總的來說，Kinect屬于消費級RGB-D系統(tǒng)，可以通過硬件直接捕捉到RGB圖像，以及每個像素的深度值，比此前的很多方法更快更便宜?，F(xiàn)在，很多用于研究或工業(yè)的機器人，例如AGV或人形輔助機器人，都含有類似的內(nèi)置深度感知相機。未來用于機器人的深度感知設(shè)備很可能會進一步升級。

相關(guān)研究

針對機器人的深度感知，研究人員將這一技術(shù)用于實時導(dǎo)航、實時映射和追蹤以及對室內(nèi)環(huán)境的建模。由于深度感知能讓機器人知道它們距離障礙物有多遠，就能使其進行定位，在導(dǎo)航時避免碰撞。除此之外，深度圖像還用于實時檢測、辨別、定位人的身體部位等研究中。

這都說明在某些任務(wù)中，深度圖像可以蘊涵很多除了顏色之外的有用信息。接下來，我們研究了三種不同任務(wù)

案例一：機器人抓取

讓機器人抓取從未見過的物體是目前一個重要的難題。雖然很多研究者使用RGB圖像，但他們的系統(tǒng)需要讓機器人訓(xùn)練好幾個月的抓取動作。利用3D目標(biāo)網(wǎng)格的關(guān)鍵有點就是，研究人員可以通過渲染技術(shù)精確地合成深度圖像。

我們的Dex-Net是AUTOLab正在進行的研究項目，它包括訓(xùn)練機器人抓取策略的算法、代碼。以及用于訓(xùn)練抓取的數(shù)據(jù)集。Dex-Net提出在抓取狀態(tài)下的域隨機算法，目的是用簡單的抓手抓取復(fù)雜目標(biāo)物體。在BAIR此前的博文中，我們介紹了含有670萬個樣本的數(shù)據(jù)集，我們用它來訓(xùn)練抓取模型。

數(shù)據(jù)集和深度圖像

上圖展示了Dex-Net的數(shù)據(jù)集生成過程。首先，我們從多個來源中得到大量目標(biāo)物的網(wǎng)格模型，并進行強化。每個模型都會被機械手抓起來進行采樣。有了網(wǎng)格模型和被抓起后的圖像，我們計算出它的魯棒性，并生成模擬深度圖像。通過計算擺放位置、摩擦力、質(zhì)量、外力（例如重力）和蒙特卡羅積分法，計算出抓取成功地概率，從而對魯棒性進行估計。上圖右邊，我們展示了正采樣（抓取成功）和負采樣（抓取失?。┑睦印?/p>

訓(xùn)練GQ-CNN

有了模擬數(shù)據(jù)集后，它們將用來訓(xùn)練一個抓取質(zhì)量卷積神經(jīng)網(wǎng)絡(luò)，來預(yù)測機器人抓取成功的概率。結(jié)構(gòu)如圖所示，一張圖像經(jīng)過處理后，調(diào)整了角度和抓取中心，同時對應(yīng)的96×96的深度圖像被當(dāng)做輸入，高度為z，用于預(yù)測抓取的成功概率。

下圖我們展示了Dex-Net用于在某個容器內(nèi)，對多個目標(biāo)物體進行抓取的模擬深度圖像：

上行：ABB Yumi機器人的攝像機捕捉到的真實深度圖像

下行：Dex-Net的模擬深度圖像，紅色表示抓取的位置

案例二：在箱子中分割物體

實例分割就是判斷圖像中的像素屬于哪個物體，同時也要將同一類別中的每個物體分開。實例分割在機器人感知中很常用。例如，想讓機器人從裝滿物體的紙箱中選擇目標(biāo)物體，首先就要對圖片進行分割，定位到目標(biāo)物體，再進行抓取。

先前的研究表明，Mask R-CNN可以用于訓(xùn)練對RGB圖像的目標(biāo)分割，但是這一訓(xùn)練需要大量經(jīng)過手動標(biāo)記的RGB圖像數(shù)據(jù)集。除此之外，用于訓(xùn)練的圖像必須是自然場景下包含有限的目標(biāo)物體種類。所以，預(yù)訓(xùn)練Mask R-CNN網(wǎng)絡(luò)可能不適用于倉庫這種雜亂的場景。

數(shù)據(jù)集和深度圖像

上圖是數(shù)據(jù)集的生成過程。和Dex-Net類似，我們對3D目標(biāo)物體進行采樣，然后通過模擬，將這些物體堆放在一個盒子中。生成對應(yīng)的深度圖像，以及用于訓(xùn)練的目標(biāo)物體掩碼和標(biāo)準(zhǔn)評估圖像。

對于基于幾何形狀的分割，我們可以用模擬和渲染技術(shù)，自動收集大量用于訓(xùn)練的數(shù)據(jù)集和經(jīng)過標(biāo)記的深度圖像。我們假設(shè)，這些深度圖像可能含有足夠的用于分割的信息，因為各物體之間的像素邊界不連貫。最終我們收集了5萬張深度圖像組成了數(shù)據(jù)集，并通過PyBullet模擬器將它們匯聚到盒子里。利用這一數(shù)據(jù)集，我們訓(xùn)練了另一個版本的Mask R-CNN，我們稱之為SD Mask R-CNN。

實際分割結(jié)果

雖然沒有在真實圖像上訓(xùn)練，我們提出的SD Mask R-CNN的表現(xiàn)超過了點云分割和經(jīng)過改進的Mask R-CNN。如上圖所示，我們的模型可以準(zhǔn)確進行分割。更重要的是，用于創(chuàng)造手動標(biāo)簽數(shù)據(jù)集的目標(biāo)物體并不是從SD Mask R-CNN的訓(xùn)練分布中選擇的，而是常見的家用物品，我們并沒有它們的3D模型。所以，SD Mask R-CNN可以預(yù)測此前從未見過的物體掩碼。

總的來說，我們的分割方法有三大優(yōu)點：

深度信息在分離目標(biāo)或者背景時，其中編碼了很多有用信息；

合成深度圖像可以快速生成，用它們訓(xùn)練可以高效地轉(zhuǎn)移到現(xiàn)實圖像中；

用深度圖像訓(xùn)練過的網(wǎng)絡(luò)對此前未見過的物體泛化結(jié)果更好

案例三：讓機器人整理床鋪

整理床鋪可以運用于家庭機器人身上，因為它沒有時間限制，并且可以允許出現(xiàn)小差錯。在此前的文章中，我們研究了用RGB圖像，將其看作是序列決策問題，實現(xiàn)更好的模擬學(xué)習(xí)。

數(shù)據(jù)集和深度圖像

我們將整理床鋪的任務(wù)看作是檢測毯子的四個角，家庭機器人需要抓起毯子，并且把它的角和床對齊。我們最初的假設(shè)是深度圖像含有足夠的有關(guān)毯子的幾何形狀的信息。

為了手機訓(xùn)練數(shù)據(jù)，我們使用的是白色的毯子，將四個角用紅色標(biāo)記，如上圖所示。重復(fù)幾次將毯子隨意仍在床上，然后從機器人內(nèi)置的RGB-D傳感器中采集RGB圖像和深度圖像。

接下來，我們訓(xùn)練一個深度卷積神經(jīng)網(wǎng)絡(luò)，只從深度圖像中檢測它的四個角。我們希望網(wǎng)絡(luò)可以泛化到能檢測出不同毯子的四角。我們的深度網(wǎng)絡(luò)使用了YOLO中的與訓(xùn)練權(quán)重，之后添加了幾個圖層。結(jié)果表明，利用預(yù)訓(xùn)練權(quán)重是非常有效果的。

毯子檢測結(jié)果

我們將訓(xùn)練策略實施之后，模型表現(xiàn)出了優(yōu)秀的結(jié)果，超越了無學(xué)習(xí)的基準(zhǔn)策略，幾乎和人類完成的效果相當(dāng)。雖然我們這里檢測的標(biāo)準(zhǔn)是毯子是否最大程度地覆蓋了床，不過這也說明，只有完成了精準(zhǔn)的檢測，才能實現(xiàn)高度覆蓋。

結(jié)語

通過這三個項目的實踐，我們的結(jié)果表明深度圖像在進行物體抓取、圖像分割和不規(guī)則物體頂點檢測三方面，包含了許多有用的線索。我們認為，隨著深度相機質(zhì)量的提高，深度圖像對機器人的應(yīng)用越來越重要。有了深度圖像，訓(xùn)練樣本的合成更加簡單，背景噪音也能更容易地過濾掉。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

傳感器

傳感器

+關(guān)注

關(guān)注
2552

文章
51325

瀏覽量
755375
機器人

機器人

+關(guān)注

關(guān)注
211

文章
28578

瀏覽量
207785
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5511

瀏覽量
121356

原文標(biāo)題：深度感知＋深度學(xué)習(xí)，伯克利的機器人面對陌生目標(biāo)也能成功取物

文章出處：【微信號：jqr_AI，微信公眾號：論智】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎(chǔ)模塊

，一次生成深度信息。自主機器人定位任務(wù)的本質(zhì)是對機器人自身狀態(tài)的估計問題，包括位置，朝向，速度等問題。路徑規(guī)劃旨在找到從起點到目標(biāo)區(qū)域的路徑，確保路徑的可行性和最優(yōu)性。路徑規(guī)劃方法

發(fā)表于 01-04 19:22

開源項目！能夠精確地行走、跳舞和執(zhí)行復(fù)雜動作的機器人—Tillu

和方向的6軸陀螺儀用于聲音交互的蜂鳴器以及為魅力加分的顯示屏！這款機器人不僅功能強大，更是一個創(chuàng)意平臺。無論你是使用Python編程其動作，還是通過Mind+探索可視化編程，Tillu都是

發(fā)表于 01-02 17:24

【「具身智能機器人系統(tǒng)」閱讀體驗】+兩本互為支持的書

如何使用PyTorch進行數(shù)字圖像處理，它借助攝像頭來獲取視頻的圖像信息，然后通過已有的圖像識別框架模型經(jīng)深度學(xué)習(xí)和優(yōu)化以達到更精準(zhǔn)的識別結(jié)

發(fā)表于 01-01 15:50

【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型

中取得了令人矚目的效果。閱讀感悟從傳統(tǒng)的手動編程到借助大模型實現(xiàn)智能化、自主化，從單一模態(tài)的交互到多模態(tài)信息的深度融合，再到擴散模型的應(yīng)用，機器人控制技術(shù)正在以驚人的速度進化。這不僅讓機器

發(fā)表于 12-29 23:04

【「具身智能機器人系統(tǒng)」閱讀體驗】1.全書概覽與第一章學(xué)習(xí)

，詳細介紹了具身智能機器人的基礎(chǔ)模塊，給讀者闡明了機器人如何感知環(huán)境以及對環(huán)境進行交互。在第三部分，結(jié)合最新的大模型技術(shù)，探討了大模型在機器人

發(fā)表于 12-27 14:50

《具身智能機器人系統(tǒng)》第7-9章閱讀心得之具身智能機器人與大模型

醫(yī)療領(lǐng)域，手術(shù)輔助機器人需要毫米級的精確控制，書中有介紹基于視覺伺服的實時控制算法，以及如何利用大模型優(yōu)化手術(shù)路徑規(guī)劃。工業(yè)場景中，協(xié)作機器人面臨的主要挑戰(zhàn)是快速適應(yīng)新工藝流程。具身智能通過在線

發(fā)表于 12-24 15:03

【「具身智能機器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)在具身人工智能中的價值

，數(shù)據(jù)對于訓(xùn)練增強和優(yōu)化機器人能力的深度學(xué)習(xí)模型至關(guān)重要。從財務(wù)上講，用戶數(shù)據(jù)對互聯(lián)網(wǎng)公司具有重要價值，估計每個用戶 600 美元，考慮到大規(guī)模商業(yè)化后每個機器人的估計成本為 350

發(fā)表于 12-24 00:33

【「具身智能機器人系統(tǒng)」閱讀體驗】+初品的體驗

解決許多技術(shù)的和非技術(shù)的挑戰(zhàn)，如提高智能體的自主性、處理復(fù)雜環(huán)境互動的能力及確保行為的倫理和安全性。未來的研究需要將視覺、語音和其他傳感技術(shù)與機器人技術(shù)相結(jié)合，以探索更加先進的知識表示和記憶模塊，利用強化

發(fā)表于 12-20 19:17

《具身智能機器人系統(tǒng)》第1-6章閱讀心得之具身智能機器人系統(tǒng)背景知識與基礎(chǔ)模塊

與環(huán)境持續(xù)互動來優(yōu)化決策策略。書中還進一步討論了強化學(xué)習(xí)的基本原理，包括狀態(tài)空間、動作空間、獎勵函數(shù)的設(shè)計，以及策略網(wǎng)絡(luò)的訓(xùn)練方法。具身智能機器人系統(tǒng)是一個多學(xué)科知識交叉的復(fù)雜工程體

發(fā)表于 12-19 22:26

鴻蒙機器人與鴻蒙開發(fā)板聯(lián)動演示

鴻蒙機器人與鴻蒙開發(fā)板聯(lián)動演示，機器人的角色為迎賓機器人，開發(fā)板負責(zé)人賓客出現(xiàn)監(jiān)聽

發(fā)表于 12-02 14:55

ROS讓機器人開發(fā)更便捷，基于RK3568J+Debian系統(tǒng)發(fā)布！

本帖最后由 Tronlong創(chuàng)龍科技于 2024-7-19 17:18 編輯 ROS系統(tǒng)是什么 ROS(Robot Operating System)是一個適用于機器人的開源的元操作系統(tǒng)。它

發(fā)表于 07-09 11:38

機器人視覺技術(shù)中常見的圖像分割方法

機器人視覺技術(shù)中的圖像分割方法是一個廣泛且深入的研究領(lǐng)域。圖像分割是將圖像劃分為多個區(qū)域或?qū)ο蟮?/div>
發(fā)表于 07-09 09:31 ?815次閱讀

Al大模型機器人

理解能力強大: AI大模型機器人可以理解和生成自然語言，能夠進行復(fù)雜的對話和語言任務(wù)。它們能夠識別語言中的語義、語境和情感，并據(jù)此作出適當(dāng)?shù)幕貞?yīng)。廣泛的知識儲備: 這些模型基于大規(guī)模的數(shù)據(jù)集進行訓(xùn)練，擁有

發(fā)表于 07-05 08:52

機器人視覺技術(shù)中圖像分割方法有哪些

機器人視覺技術(shù)是人工智能領(lǐng)域的一個重要分支，它涉及到圖像處理、模式識別、機器學(xué)習(xí)等多個學(xué)科。圖像分割

發(fā)表于 07-04 11:34 ?1093次閱讀

基于FPGA EtherCAT的六自由度機器人視覺伺服控制設(shè)計

和增強系統(tǒng)處理圖像的實時性，本文提出了一種伊瑟特的六自由度機器人視覺伺服控制系統(tǒng)，將攝像頭集成到基于 Zynq的伊瑟特主站上，提高了視覺伺服的實時性.經(jīng)測試，該平臺能夠?qū)σ曈X檢測目標(biāo)的變化做出及時的反應(yīng)

發(fā)表于 05-29 16:17

搜索歷史

深度圖像和深度學(xué)習(xí)結(jié)合用于機器人抓取的Dex-Net、復(fù)雜目標(biāo)分割以及讓機器人整理床鋪

評論

【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎(chǔ)模塊

開源項目！能夠精確地行走、跳舞和執(zhí)行復(fù)雜動作的機器人—Tillu

【「具身智能機器人系統(tǒng)」閱讀體驗】+兩本互為支持的書

【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型

【「具身智能機器人系統(tǒng)」閱讀體驗】1.全書概覽與第一章學(xué)習(xí)

《具身智能機器人系統(tǒng)》第7-9章閱讀心得之具身智能機器人與大模型

【「具身智能機器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)在具身人工智能中的價值

【「具身智能機器人系統(tǒng)」閱讀體驗】+初品的體驗

《具身智能機器人系統(tǒng)》第1-6章閱讀心得之具身智能機器人系統(tǒng)背景知識與基礎(chǔ)模塊

鴻蒙機器人與鴻蒙開發(fā)板聯(lián)動演示

ROS讓機器人開發(fā)更便捷，基于RK3568J+Debian系統(tǒng)發(fā)布！

機器人視覺技術(shù)中常見的圖像分割方法

Al大模型機器人

機器人視覺技術(shù)中圖像分割方法有哪些

基于FPGA EtherCAT的六自由度機器人視覺伺服控制設(shè)計

搜索歷史

深度圖像和深度學(xué)習(xí)結(jié)合用于機器人抓取的Dex-Net、復(fù)雜目標(biāo)分割以及讓機器人整理床鋪

評論

深度圖像和深度學(xué)習(xí)結(jié)合用于機器人抓取的Dex-Net、復(fù)雜目標(biāo)分割以及讓機器人整理床鋪