0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌Objectron數(shù)據(jù)集:3D目標(biāo)檢測數(shù)據(jù)集及檢測方案

新機器視覺 ? 來源:新機器視覺 ? 作者:新智元 ? 2020-11-27 09:49 ? 次閱讀

谷歌人工智能實驗室近日發(fā)布 Objectron 數(shù)據(jù)集,這是一個以3D目標(biāo)為中心視頻剪輯的集合,這些視頻剪輯從不同角度捕獲了較大的一組公共對象。數(shù)據(jù)集包括 15K 帶注釋的視頻剪輯,并補充了從地理多樣的樣本中收集的超過 4M 帶注釋的圖像(覆蓋五大洲的 10 個國家)。

機器學(xué)習(xí)(ML)的最新技術(shù)已經(jīng)在許多計算機視覺任務(wù)上取得了SOTA的結(jié)果,但僅僅是通過在2D照片上訓(xùn)練模型而已。 在這些成功的基礎(chǔ)上,提高模型對 3D 物體的理解力有很大的潛力來支持更廣泛的應(yīng)用場景,如增強現(xiàn)實、機器人、自動化和圖像檢索。 今年早些時候,谷歌發(fā)布了 MediaPipe Objectron,一套為移動設(shè)備設(shè)計的實時 3D 目標(biāo)檢測模型,這個模型是基于一個已標(biāo)注的、真實世界的 3D 數(shù)據(jù)集,可以預(yù)測物體的 3D 邊界。

然而,理解3D 中的對象仍然是一項具有挑戰(zhàn)性的任務(wù),因為與2D 任務(wù)(例如,ImageNet、 COCO 和 Open Images)相比,缺乏大型的真實世界數(shù)據(jù)集。 為了使研究團體能夠繼續(xù)推進3D 對象理解,迫切需要發(fā)布以對象為中心的視頻數(shù)據(jù)集,這些數(shù)據(jù)集能夠捕獲更多的對象的3D 結(jié)構(gòu),同時匹配用于許多視覺任務(wù)(例如,視頻或攝像機流)的數(shù)據(jù)格式,以幫助機器學(xué)習(xí)模型的訓(xùn)練和基準(zhǔn)測試。 近期谷歌發(fā)布了 Objectron 數(shù)據(jù)集,這是一個以對象為中心的短視頻剪輯數(shù)據(jù)集,從不同的角度捕捉了一組更大的普通對象。

每個視頻剪輯都伴隨著 AR 會話元數(shù)據(jù),其中包括攝像機姿態(tài)和稀疏點云。數(shù)據(jù)還包含為每個對象手動注釋的3D 邊界,這些 bounding box 描述了對象的位置、方向和尺寸。 每個視頻剪輯都隨附有 AR 的元數(shù)據(jù),其中包括相機姿勢和稀疏點云。數(shù)據(jù)還包含每個對象的手動注釋的 3D 邊界框,用于描述對象的位置,方向和尺寸。 該數(shù)據(jù)集包括15K 注釋視頻剪輯與超過4M 注釋圖像收集的地理多樣性樣本(涵蓋10個國家橫跨五大洲)。

3D 目標(biāo)檢測解決方案

除了這個數(shù)據(jù)集,谷歌還分享了一個 3D 目標(biāo)檢測解決方案,可以用于4類物體:鞋子、椅子、杯子和相機。 這些模型是在 MediaPipe 中發(fā)布的,MediaPipe 是谷歌的開源框架,用于跨平臺可定制的流媒體機器學(xué)習(xí)解決方案,它同時也支持機器學(xué)習(xí)解決方案,比如設(shè)備上的實時手勢、虹膜和身體姿態(tài)跟蹤。

與之前發(fā)布的 single-stage Objectron 模型相比,這些最新版本采用了兩級架構(gòu)。 第一級使用 TensorFlow 目標(biāo)檢測模型來尋找物體的 2D 裁剪,第二級使用圖像裁剪來估計三維bounding box,同時計算下一幀對象的二維裁剪,使得目標(biāo)檢測器不需要運行每一幀。第二階段的三維 bounding box 預(yù)測器是以83 FPS在 Adreno 650 GPU 上運行。

3D 目標(biāo)檢測的評估指標(biāo)

有了真實的注釋,我們就可以使用 3D IoU(intersection over union)相似性統(tǒng)計來評估 3D 目標(biāo)檢測模型的性能,這是計算機視覺任務(wù)常用的指標(biāo),衡量bounding box與ground truth的接近程度。 谷歌提出了一種計算一般的面向三維空間的精確 3D IoU 的算法。 首先使用 Sutherland-Hodgman Polygon clipping 算法計算兩個盒子面之間的交點,這類似于計算機圖形學(xué)的剔除技術(shù)(frustum culling),利用所有截斷多邊形的凸包計算相交的體積。最后,通過交集的體積和兩個盒子的并集的體積計算 IoU。 谷歌表示將隨數(shù)據(jù)集一起發(fā)布評估的源代碼。

數(shù)據(jù)格式

Objectron 數(shù)據(jù)集的技術(shù)細(xì)節(jié),包括使用和教程,均可在數(shù)據(jù)集網(wǎng)站上獲得。這些數(shù)據(jù)集中的物體包括自行車、書籍、瓶子、相機、麥片盒、椅子、杯子、筆記本電腦和鞋子等,和數(shù)據(jù)集一起發(fā)布的具有以下內(nèi)容: 1.視頻序列 2.帶注釋的標(biāo)簽(目標(biāo)的3D 邊界框) 3.AR 元數(shù)據(jù) (如照相機姿態(tài)、點云和平面表面) 4.處理過的數(shù)據(jù)集: 混合版本的帶注釋的幀、tf.example 格式的圖像和 SequenceExample 格式的視頻 5.支持基于上面描述的度量評估的腳本 6.支持腳本將數(shù)據(jù)加載到 Tensorflow、Pytorch、Jax并且可視化數(shù)據(jù)集 除了數(shù)據(jù)集,谷歌還開放了數(shù)據(jù)管道來解析 Tensorflow、 PyTorch 和 Jax 框架中的數(shù)據(jù)集。

還提供了 colab notebook 的實例 。 通過發(fā)布這個 Objectron 數(shù)據(jù)集,谷歌希望能夠使研究團體推進三維物體幾何理解的極限。同時也希望促進新的研究和應(yīng)用,如視圖合成,改進的 3D 表示和非監(jiān)督式學(xué)習(xí)等。 參考鏈接: https://ai.googleblog.com/2020/11/announcing-objectron-dataset.html?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+blogspot%2FgJZg+%28Google+AI+Blog%29

責(zé)任編輯:xj

原文標(biāo)題:重磅!谷歌發(fā)布3D目標(biāo)檢測數(shù)據(jù)集及檢測方案

文章出處:【微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2899

    瀏覽量

    107704
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6177

    瀏覽量

    105687
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47514

    瀏覽量

    239236

原文標(biāo)題:重磅!谷歌發(fā)布3D目標(biāo)檢測數(shù)據(jù)集及檢測方案

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    武漢環(huán)保節(jié)能裝備3D數(shù)據(jù)掃描采集分析檢測完成

    2024年3月,公司開展三維掃描數(shù)據(jù)采集業(yè)務(wù),成功在節(jié)能減排裝備葉片三D數(shù)據(jù)采集和檢測分析方面取得顯著成果,提供精確模型和
    的頭像 發(fā)表于 01-15 14:35 ?44次閱讀
    武漢環(huán)保節(jié)能裝備<b class='flag-5'>3D</b><b class='flag-5'>數(shù)據(jù)</b>掃描采集分析<b class='flag-5'>檢測</b>完成

    3D案例 破解細(xì)小、反光針腳檢測難題

    有效測量針腳的精準(zhǔn)數(shù)據(jù),人工檢測不但精度達(dá)不到要求,且檢測效率低。 那該如何破解這個檢測難題? 基于三極管針腳頂部面積小,且金屬反光材質(zhì)易受多重反射光影響。光子精密選用具有微米級測量精
    的頭像 發(fā)表于 10-09 16:33 ?281次閱讀
    <b class='flag-5'>3D</b>案例 破解細(xì)小、反光針腳<b class='flag-5'>檢測</b>難題

    3D激光線掃輪廓傳感器在汽車行業(yè)的汽車車縫檢測的應(yīng)用

    在實際應(yīng)用中,3D激光線掃傳感器可以集成到自動化檢測系統(tǒng)中,與機器人或自動化輸送系統(tǒng)配合,實現(xiàn)對汽車車縫的全面檢測。這些系統(tǒng)通常包括傳感器、控制軟件、數(shù)據(jù)處理單元和用戶界面,能夠自動分
    的頭像 發(fā)表于 09-14 09:00 ?535次閱讀
    <b class='flag-5'>3D</b>激光線掃輪廓傳感器在汽車行業(yè)的汽車車縫<b class='flag-5'>檢測</b>的應(yīng)用

    廣東3D掃描鈑金件外觀尺寸測量3D偏差檢測對比解決方案CASAIM

    3D掃描
    中科院廣州電子
    發(fā)布于 :2024年07月22日 16:13:45

    3D三維掃描儀的測量數(shù)據(jù)檢測和評估軟件

    ZEISSINSPECTOptical3D是蔡司旗下一款強大的三維測量數(shù)據(jù)檢測和評估軟件,原名GOMInspect。這款軟件在光學(xué)測量領(lǐng)域具有廣泛的應(yīng)用,并且已經(jīng)成為行業(yè)標(biāo)準(zhǔn)
    的頭像 發(fā)表于 07-15 17:20 ?681次閱讀
    <b class='flag-5'>3D</b>三維掃描儀的測量<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>檢測</b>和評估軟件

    PyTorch如何訓(xùn)練自己的數(shù)據(jù)

    PyTorch是一個廣泛使用的深度學(xué)習(xí)框架,它以其靈活性、易用性和強大的動態(tài)圖特性而聞名。在訓(xùn)練深度學(xué)習(xí)模型時,數(shù)據(jù)是不可或缺的組成部分。然而,很多時候,我們可能需要使用自己的數(shù)據(jù)
    的頭像 發(fā)表于 07-02 14:09 ?1893次閱讀

    蘇州吳中區(qū)多色PCB板元器件3D視覺檢測技術(shù)

    3D視覺檢測相較于2D視覺檢測,有其獨特的優(yōu)勢,不受產(chǎn)品表面對比度影響,精確檢出產(chǎn)品形狀,可以測出高度(厚度)、體積、平整度等。在實際應(yīng)用中可以與2
    的頭像 發(fā)表于 06-14 15:02 ?437次閱讀
    蘇州吳中區(qū)多色PCB板元器件<b class='flag-5'>3D</b>視覺<b class='flag-5'>檢測</b>技術(shù)

    工業(yè)鏡頭在3D結(jié)構(gòu)光檢測中實際應(yīng)用

    工業(yè)鏡頭在3D結(jié)構(gòu)光檢測中實際應(yīng)用
    的頭像 發(fā)表于 06-01 08:34 ?316次閱讀
    工業(yè)鏡頭在<b class='flag-5'>3D</b>結(jié)構(gòu)光<b class='flag-5'>檢測</b>中實際應(yīng)用

    請問NanoEdge AI數(shù)據(jù)該如何構(gòu)建?

    我想用NanoEdge來識別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數(shù)據(jù)的問題,請問我該怎么構(gòu)建數(shù)據(jù)?或者生成模型失敗還會有哪些原因?
    發(fā)表于 05-28 07:27

    大陸團的3D Flash激光雷達(dá)有何優(yōu)勢?

    在這一技術(shù)革命的前沿,激光雷達(dá)成為了不可或缺的一環(huán)。而在這其中,大陸團的3D Flash激光雷達(dá)引人矚目。
    發(fā)表于 04-11 10:28 ?377次閱讀
    大陸<b class='flag-5'>集</b>團的<b class='flag-5'>3D</b> Flash激光雷達(dá)有何優(yōu)勢?

    PLC如何應(yīng)用于建筑的3D打???

    MC Pi-Prime模塊化PLC采用EtherCat作為通信協(xié)議,有助于實現(xiàn)快速的反應(yīng)時間和精確的定位控制,為自動化工程師提供靈活的擴展與集成,并縮短實施時間,助力建筑行業(yè)引入3D打印。
    的頭像 發(fā)表于 03-22 10:46 ?361次閱讀
    宏<b class='flag-5'>集</b>PLC如何應(yīng)用于建筑的<b class='flag-5'>3D</b>打???

    自動駕駛車輛數(shù)據(jù)的中央控處理策略

    隨著毫米波雷達(dá)技術(shù)的演進,我們看到 4D 成像毫米波雷達(dá)的技術(shù)指標(biāo)比起傳統(tǒng) 3D 毫米波雷達(dá)有了大幅的改進,包括多了一個高度維度,看得更遠(yuǎn),點云更密集,有更好的角分辨率,對靜止目標(biāo)檢測
    發(fā)表于 03-19 14:03 ?325次閱讀
    自動駕駛車輛<b class='flag-5'>數(shù)據(jù)</b>的中央<b class='flag-5'>集</b>控處理策略

    Nullmax提出多相機3D目標(biāo)檢測新方法QAF2D

    今天上午,計算機視覺領(lǐng)域頂會CVPR公布了最終的論文接收結(jié)果,Nullmax感知部門的3D目標(biāo)檢測研究《Enhancing 3D Object Detection with 2
    的頭像 發(fā)表于 02-27 16:38 ?1180次閱讀
    Nullmax提出多相機<b class='flag-5'>3D</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>新方法QAF2<b class='flag-5'>D</b>

    基于深度學(xué)習(xí)的方法在處理3D點云進行缺陷分類應(yīng)用

    背景部分介紹了3D點云應(yīng)用領(lǐng)域中公開可訪問的數(shù)據(jù)的重要性,這些數(shù)據(jù)對于分析和比較各種模型至關(guān)重要。研究人員專門設(shè)計了各種
    的頭像 發(fā)表于 02-22 16:16 ?1249次閱讀
    基于深度學(xué)習(xí)的方法在處理<b class='flag-5'>3D</b>點云進行缺陷分類應(yīng)用

    泰來三維| 高精度工業(yè)3D掃描助力模具檢測和逆向設(shè)計“數(shù)字化”發(fā)展

    相應(yīng)的,產(chǎn)品所需的模具結(jié)構(gòu)也變得愈發(fā)復(fù)雜精密,傳統(tǒng)檢測方式和測繪工具很難滿足些最新需求。高精度工業(yè)3D掃描技術(shù)的出現(xiàn),通過獲取工件完整的三維數(shù)據(jù),為模具檢測和逆向設(shè)計提供“數(shù)字化”破局
    的頭像 發(fā)表于 01-29 16:22 ?520次閱讀
    泰來三維| 高精度工業(yè)<b class='flag-5'>3D</b>掃描助力模具<b class='flag-5'>檢測</b>和逆向設(shè)計“數(shù)字化”發(fā)展