0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一項將2D RGB圖像的所有人類像素實時映射至3D模型的技術(shù)——DensePose

0wvm_ARchan_TT ? 來源:未知 ? 作者:李倩 ? 2018-06-25 16:13 ? 次閱讀

我們已經(jīng)介紹過很多僅用RGB相機進行動作捕捉的研究了,其中大多數(shù)是模擬出骨骼進行追蹤,少數(shù)則是通過模擬出的骨骼套上一個粗糙的模型,便可稱為3D模型了。

近日,F(xiàn)acebook AI Reaserch(FAIR)開源了一項將2D RGB圖像的所有人類像素實時映射至3D模型的技術(shù)——DensePose,而且采用的也不是我們經(jīng)常介紹的骨骼追蹤,而是一種十分密集的方案追蹤來構(gòu)建3D模型。

在戶外和穿著寬松衣服的 也表現(xiàn)良好。

還支持多人同時追蹤。

那這個密集如何來理解呢?

對于一般的骨骼追蹤,追蹤的點大多在十到二十個之間,再多也沒有多少實際的效果。而DensePose所追蹤的點一共有336個,密密麻麻全身都是點。(密集恐懼癥退避)

之所以要追蹤這么多的點,是構(gòu)建一個平滑流暢的3D模型所必須的數(shù)據(jù)。

辛苦的付出也是值得的,DensePose無論是在戶外還是多人下都表現(xiàn)良好,還能實時更換場景中人的衣服。

那就來看看他們是怎么做到的吧。

為了讓機器可以學(xué)習(xí),研究人員手動標記了5萬張照片中的336個點,光這個步驟就是一個巨大的工程了,如果按部就班的標記注釋,不知道要到什么時候完成了。

研究人員將一個人拆分成了24個部分,分別為頭、軀干上部、軀干下部、大臂、小臂、大腿、小腿、手、腳。每個部分標記14的點。

對于頭部、手部、腳部都由人手動標記。同時還要求注釋者在標記的時候標出被衣物掩蓋住的部位,比如寬松的裙子。

這些工作做完后進入第二階段,研究人員對每一個展開部位區(qū)域進行采樣,會獲得6個不同的標記圖,提供二維坐標地圖使標記者更直觀的判斷哪個標記是正確的。

最后再將平面重新組合成3D模型,進行最后一步校準。

這樣兩步下來,研究人員得以高效準確的獲得了準確的標記。不過在軀干、背部還有 臀部有較大的誤差。

接下來就是深度學(xué)習(xí)的階段了,這時一個好的方案就好比性能優(yōu)越的催化劑。

研究人員采用與Mask-RCNN架構(gòu)的DenseReg類似的方法,構(gòu)成了'DensePose-RCNN'系統(tǒng),還進一步開發(fā)使得訓(xùn)練的準確度提高。首先由外觀粗略的估算像素所在的位置,然后將其與準確的坐標對齊。

DenseReg MaskRCNN的關(guān)鍵點分支中使用相同的體系結(jié)構(gòu),由8個交替的3×3完全卷積和512個通道的ReLU層組成。得益于Caffe2,所產(chǎn)生的架構(gòu)實際上與Mask-RCNN一樣快。

為了降低錯誤率,還訓(xùn)練了一個“教師”網(wǎng)絡(luò)來重建地面,部署它完整的圖像域,產(chǎn)生一個密集的監(jiān)督信號。研究人員將人類監(jiān)督者半自動監(jiān)督和“教師網(wǎng)絡(luò)”進行對比,結(jié)果是“教師”完勝。

研究人員還將其方法與SMPLify進行了對比,在模型的模擬方面,研究人員的自下而上的前饋方法在很大程度上勝過了迭代的模型擬合結(jié)果。

同時在多人處理時,F(xiàn)CN明顯差于'DensePose-RCNN,再與其他方案比較時優(yōu)勢也十分突出。

最后,整體呈現(xiàn)的效果如開頭所講,能夠處理大量遮擋物,成功的模擬出了衣服后面的人,但有一點需要注意,那就是所有人都是通過固定的曲率擬合的。而且在多人狀況下表現(xiàn)十分良好。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54761
  • 3D模型
    +關(guān)注

    關(guān)注

    1

    文章

    72

    瀏覽量

    15716
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5503

    瀏覽量

    121174

原文標題:Facebook最新開源,普通RGB相機即可實時映射3D模型

文章出處:【微信號:ARchan_TT,微信公眾號:AR醬】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    3D LED液晶電視設(shè)計方案

    2D信號等功能。圖4 ECT223H信號處理框圖  信號模塊的功能:  60Hz的信號先經(jīng)過2D檢測分析將不同運動速度的信號進行特定的同靜態(tài)算法分析處理;2D轉(zhuǎn)換3D模塊
    發(fā)表于 07-11 18:05

    如何同時獲取2d圖像序列和相應(yīng)的3d點云?

    如何同時獲取2d圖像序列和相應(yīng)的3d點云?以上來自于谷歌翻譯以下為原文How to obtain the sequence of 2d image and corresponding
    發(fā)表于 11-13 11:25

    為什么3D2D模型不能相互轉(zhuǎn)換?

    AD17.1.5軟件,3D2D模型不能相互轉(zhuǎn)換,按3可以進入3D模型,按
    發(fā)表于 09-20 05:35

    AD的3D模型繪制功能介紹

    完成后,2D圖如下:    2D圖  我們按下鍵盤上的數(shù)字3,即可查看繪制的3D模型了,如圖(4)?!   D(4)0805電阻
    發(fā)表于 01-14 16:48

    3D制圖軟件如何進行多CAD混合設(shè)計?

    體化。2D3D數(shù)據(jù)的高效轉(zhuǎn)化浩辰3D可以直接打開DWG和DXF圖紙來進行編輯繪圖,并且可以通過快速建模設(shè)計環(huán)境DWG圖紙直接轉(zhuǎn)化為
    發(fā)表于 02-24 17:22

    使用DLP技術(shù)3D打印

    使用DLP技術(shù)3D打印光固化成形法 (SLA),個常見的3D打印工藝,與傳統(tǒng)打印很相似。與硒鼓碳粉沉積在紙張上很類似,
    發(fā)表于 11-18 07:32

    如何把OpenGL中3D坐標轉(zhuǎn)換成2D坐標

    在OpenGL中,切事物都在3D空間中,但我們的屏幕坐標確實2D像素數(shù)組,OpenGL大部分工作就是把3D坐標轉(zhuǎn)換成適應(yīng)屏幕的
    的頭像 發(fā)表于 07-09 10:40 ?8594次閱讀

    基于DensePose的姿勢轉(zhuǎn)換系統(tǒng),僅根據(jù)張輸入圖像和目標姿勢

    DensePose 是 Facebook 研究員 Natalia Neverova、Iasonas Kokkinos 和法國 INRIA 的 R?za Alp Guler 開發(fā)的個令人驚嘆的人體實時姿勢識別系統(tǒng),它在
    的頭像 發(fā)表于 09-24 09:21 ?1.1w次閱讀

    微軟新AI框架可在2D圖像上生成3D圖像

    已經(jīng)有不少機構(gòu)在 2D 圖像轉(zhuǎn)換為 3D 形式的方面進行了嘗試,包括 Facebook、Nvidia 等公司的 AI 研究實驗室,或是類似 Threedy.AI 這樣的初創(chuàng)公司。
    的頭像 發(fā)表于 03-07 14:23 ?3044次閱讀

    阿里研發(fā)全新3D AI算法,2D圖片搜出3D模型

    AI技術(shù)的研究正在從2D走向更高難度的3D。12月3日,記者獲悉,阿里技術(shù)團隊研發(fā)了全新3D A
    的頭像 發(fā)表于 12-04 15:49 ?3540次閱讀

    谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

    谷歌發(fā)明的由2D圖像生成3D圖像技術(shù),利用3D估計神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 12-24 12:55 ?4770次閱讀
    谷歌發(fā)明的由<b class='flag-5'>2D</b><b class='flag-5'>圖像</b>生成<b class='flag-5'>3D</b><b class='flag-5'>圖像</b><b class='flag-5'>技術(shù)</b>解析

    3d人臉識別和2d人臉識別的區(qū)別

    首先是3d人臉識別和2d人臉識別圖像數(shù)據(jù)獲取不同。3D人臉識別是以3D攝像頭立體成像,而2D是以
    發(fā)表于 02-05 16:00 ?4.6w次閱讀

    如何直接建立2D圖像中的像素3D點云中的點之間的對應(yīng)關(guān)系

    準確描述和檢測 2D3D 關(guān)鍵點對于建立跨圖像和點云的對應(yīng)關(guān)系至關(guān)重要。盡管已經(jīng)提出了大量基于學(xué)習(xí)的 2D3D 局部特征描述符和
    的頭像 發(fā)表于 10-18 09:20 ?8784次閱讀

    2D/3D圖表和圖形添加到WindowsForms應(yīng)用程序中

    ? 2D/3D圖表和圖形添加到WindowsForms應(yīng)用程序中 包括您可能需要的所有功能,并以100%托管代碼編寫。很好地集成到儀表板和商業(yè)智能軟件中。由響應(yīng)迅速的支持團隊提供支持
    的頭像 發(fā)表于 06-15 11:45 ?2236次閱讀

    2D3D視覺技術(shù)的比較

    作為個多年經(jīng)驗的機器視覺工程師,我詳細介紹2D3D視覺技術(shù)的不同特點、應(yīng)用場景以及它們能夠解決的問題。在這個領(lǐng)域內(nèi),
    的頭像 發(fā)表于 12-21 09:19 ?1136次閱讀