0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹一個(gè)用于點(diǎn)云生成的概率模型

工程師鄧生 ? 來(lái)源:CVPR 2021 ? 作者:Luo, Shitong, and Wei ? 2022-09-09 10:18 ? 次閱讀

摘要ce912ae4-2fcc-11ed-ba43-dac502259ad0.png??

我們提出了一個(gè)用于點(diǎn)云生成的概率模型,它可以被用于多種 3D 視覺(jué)任務(wù)的基礎(chǔ),例如形狀補(bǔ)全、上采樣、合成和數(shù)據(jù)增強(qiáng)。受非平衡熱力學(xué)中擴(kuò)散過(guò)程的啟發(fā),我們將點(diǎn)云中的點(diǎn)視為與熱庫(kù)(heat bath)接觸的熱力學(xué)系統(tǒng)中的粒子,其從原始分布擴(kuò)散成為噪聲分布。因此,點(diǎn)云生成相當(dāng)于學(xué)習(xí)將噪聲分布轉(zhuǎn)換為所需形狀分布的反向擴(kuò)散過(guò)程。

具體來(lái)說(shuō),我們提出將點(diǎn)云的反向擴(kuò)散過(guò)程建模為以某種隱式形狀(shape latent)為條件的馬爾可夫鏈。我們推導(dǎo)出訓(xùn)練時(shí)封閉形式的變分邊界,并提供了模型的實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果表明,我們的模型在點(diǎn)云生成和自動(dòng)編碼方面取得了有競(jìng)爭(zhēng)力的表現(xiàn)。

主要貢獻(xiàn)ce912ae4-2fcc-11ed-ba43-dac502259ad0.png??

文章受非平衡熱力學(xué)中的擴(kuò)散過(guò)程啟發(fā),提出了一種新的點(diǎn)云概率生成模型。 ? 作者從點(diǎn)云基于形狀的條件似然的變分下限推導(dǎo)出一個(gè)易于處理的訓(xùn)練目標(biāo)。

大量實(shí)驗(yàn)表明我們的模型實(shí)現(xiàn)了在點(diǎn)云生成和自動(dòng)編碼有競(jìng)爭(zhēng)力的性能

方法概述
ce912ae4-2fcc-11ed-ba43-dac502259ad0.png ? ????
本文中作者將點(diǎn)云看作是從概率分布中取樣生成的,每一個(gè)點(diǎn)都是該概率分布的獨(dú)立同分布(i.i.d)采樣。類似于圖像的擴(kuò)散概率模型,當(dāng)我們向點(diǎn)云引入噪音時(shí),點(diǎn)云會(huì)逐步從與形狀有關(guān)的復(fù)雜分布變?yōu)楦咚狗植嫉脑胍?,這一過(guò)程被稱作正向擴(kuò)散過(guò)程。點(diǎn)云的生成模型可以被視作是如圖二所示的逆向擴(kuò)散過(guò)程:根據(jù)一個(gè)高斯分布取樣作為噪音點(diǎn)云,訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)以形狀為條件逐步對(duì)該噪音點(diǎn)云減噪,直至點(diǎn)云恢復(fù)其本來(lái)的形狀。
cebcd392-2fcc-11ed-ba43-dac502259ad0.png ???

Figure 2 展示了從噪音點(diǎn)云逆擴(kuò)散生成點(diǎn)云的過(guò)程可以由一個(gè)馬爾科夫鏈模型表示。點(diǎn)云中的每一個(gè)點(diǎn)由 x(T) 開(kāi)始以轉(zhuǎn)移概率 p****θ(x(t-1)|x(t),z) 逐步減噪(逆擴(kuò)散)為目標(biāo)點(diǎn)云 x(0)。其中 θ 表示可學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)參數(shù)參數(shù),z 表示與形狀有關(guān)的潛變量。

生成點(diǎn)云時(shí),從正態(tài)分布取樣w,經(jīng)先驗(yàn)flow模型映射為形狀變量z。同時(shí)從正態(tài)分布取樣噪音點(diǎn)云 x(T)。通過(guò)一系列逆向擴(kuò)散過(guò)程,噪音點(diǎn)云以形狀z為條件逐漸減噪為目標(biāo)點(diǎn)云 x(0)。

cee42bb8-2fcc-11ed-ba43-dac502259ad0.png ????

訓(xùn)練時(shí),數(shù)據(jù)集中的點(diǎn)云經(jīng)過(guò)編碼器 φ 編碼為形狀潛碼 z 正態(tài)分布的均值和方差,再使用與變分編碼器(VAE)中的重新參數(shù)化技巧相同的方式取樣形狀潛碼 z。如下圖所示,輸入點(diǎn)云隨后經(jīng)過(guò)一系列前向擴(kuò)散過(guò)程逐漸變?yōu)樵胍酎c(diǎn)云。訓(xùn)練目標(biāo)函數(shù)采用條件似然概率的變分下限,以最大化似然訓(xùn)練數(shù)據(jù)集的似然概率。

cf070a48-2fcc-11ed-ba43-dac502259ad0.png ????

需要注意的是,變分自動(dòng)編碼器VAE的先驗(yàn)概率選用正態(tài)分布,本文應(yīng)用 Flow 模型將簡(jiǎn)單的正態(tài)分布映射 p(w) 到更復(fù)雜的分布模型 p(z)。訓(xùn)練時(shí),q(z|x(0) 經(jīng)過(guò)逆向的 Flow 映射回 w, 損失函數(shù)包含 w 的先驗(yàn)概率分布和后驗(yàn)概率分布之間 KL 散度。

實(shí)驗(yàn)結(jié)果

ce912ae4-2fcc-11ed-ba43-dac502259ad0.png ? ????

文章選用 ShapeNet 數(shù)據(jù)集進(jìn)行點(diǎn)云生成實(shí)驗(yàn)、點(diǎn)云重建以及點(diǎn)云特征提取實(shí)驗(yàn)。 Table 1 總結(jié)了擴(kuò)散概率模型與包括GAN、Flow模型在內(nèi)的其他點(diǎn)云生成方法相比在最小匹配距離 (MMD), 覆蓋分?jǐn)?shù) (COV), 最近鄰分類器準(zhǔn)確率(1-NNA)以及 Jenson-Shannon 散度 (JSD) 上可以 SOTA 方法媲美。

cf3b756c-2fcc-11ed-ba43-dac502259ad0.png ????

下圖展示了一些生成點(diǎn)云的樣例,包含了飛機(jī)和椅子兩個(gè)分類。

cf546a18-2fcc-11ed-ba43-dac502259ad0.png ???

Table 2 列出了擴(kuò)散概率模型自動(dòng)編碼重建性能。其重建點(diǎn)云與原始點(diǎn)云之間的 Chamfer 距離(CD) 和 動(dòng)土距離 (MD) 也可以達(dá)到與 SOTA 相近的數(shù)值。 cf7df432-2fcc-11ed-ba43-dac502259ad0.png ????

下圖給出了幾個(gè)點(diǎn)云重構(gòu)的例子,最左側(cè)一列是真實(shí)點(diǎn)云,然后依次是擴(kuò)散模型、ShapeGF 以及 AtlasNet。

cfa2ace6-2fcc-11ed-ba43-dac502259ad0.png ???

Table 3 顯示擴(kuò)散概率模型與其他模型在表征學(xué)習(xí)方面的比較。只使用一個(gè)線性SVM作為分類器,擴(kuò)散概率模型學(xué)習(xí)的表征在ModelNet10和ModelNet40數(shù)據(jù)集上分別可以達(dá)到94.2%和87.6%的準(zhǔn)確率,與SOTA方法相近或更好。 cfc3e776-2fcc-11ed-ba43-dac502259ad0.png ???

Figure 6展示在潛變量空間插值變換獲得相應(yīng)點(diǎn)云的變化:

cfe43382-2fcc-11ed-ba43-dac502259ad0.png


總結(jié)

文章將擴(kuò)散概率模型用于點(diǎn)云生成,推理時(shí)以形狀采樣為條件將噪音點(diǎn)云逆向擴(kuò)散為目標(biāo)點(diǎn)云;訓(xùn)練時(shí)將輸入正向擴(kuò)散為噪音點(diǎn)云,以從點(diǎn)云似然變分下限推導(dǎo)出的損失函數(shù)訓(xùn)練模型。? 實(shí)驗(yàn)表明這樣的擴(kuò)散模型實(shí)現(xiàn)了在點(diǎn)云生成、自動(dòng)編碼以及表征學(xué)習(xí)任務(wù)實(shí)現(xiàn)了有競(jìng)爭(zhēng)力的性能。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3643

    瀏覽量

    134524
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1935

    瀏覽量

    73445
  • MMD
    MMD
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    6697

原文標(biāo)題:3D點(diǎn)云生成的擴(kuò)散概率模型(CVPR 2021)

文章出處:【微信號(hào):3D視覺(jué)工坊,微信公眾號(hào):3D視覺(jué)工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    大語(yǔ)言模型優(yōu)化生成管理方法

    大語(yǔ)言模型的優(yōu)化生成管理是個(gè)系統(tǒng)工程,涉及模型架構(gòu)、數(shù)據(jù)處理、內(nèi)容控制、實(shí)時(shí)響應(yīng)以及倫理監(jiān)管等多個(gè)層面。以下,是對(duì)大語(yǔ)言
    的頭像 發(fā)表于 12-02 10:45 ?82次閱讀

    NVIDIA推出全新生成式AI模型Fugatto

    NVIDIA 開(kāi)發(fā)了個(gè)全新的生成式 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意的音樂(lè)、人聲和聲音組合的作品。
    的頭像 發(fā)表于 11-27 11:29 ?357次閱讀

    阿里開(kāi)源Qwen2.5-Coder代碼模型系列

    Qwen2.5-Coder-32B-Instruct,在代碼生成領(lǐng)域取得了顯著成就。據(jù)官方介紹,該模型在EvalPlus等十多個(gè)主流的代碼生成基準(zhǔn)測(cè)試中,均刷新了開(kāi)源
    的頭像 發(fā)表于 11-14 11:28 ?359次閱讀

    NVIDIA Nemotron-4 340B模型幫助開(kāi)發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    Nemotron-4 340B 是針對(duì) NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優(yōu)化的模型系列,該系列包含最先進(jìn)的指導(dǎo)和獎(jiǎng)勵(lì)模型,以及個(gè)
    的頭像 發(fā)表于 09-06 14:59 ?316次閱讀
    NVIDIA Nemotron-4 340B<b class='flag-5'>模型</b>幫助開(kāi)發(fā)者<b class='flag-5'>生成</b>合成訓(xùn)練數(shù)據(jù)

    lpm模型里的zi是什么

    個(gè)關(guān)鍵的參數(shù),用于表示個(gè)體特征或協(xié)變量。 LPM模型的基本概念 2.1 Logit模型 Logit模型
    的頭像 發(fā)表于 07-09 10:09 ?456次閱讀

    北京靈奧科技基于亞馬遜科技打造大模型中間件

    助力企業(yè)加速應(yīng)用生成式AI 北京2024年6月27日?/美通社/ --?北京靈奧科技基于亞馬遜科技的生成式AI、數(shù)據(jù)庫(kù)和容器等服務(wù),打造大模型
    的頭像 發(fā)表于 06-27 21:21 ?567次閱讀

    AD8275 spice模型“AD8275.cir”自動(dòng)生成個(gè)LTspice模型用來(lái)仿真,仿真時(shí)彈出圖片所示窗口如何處理?

    我用官網(wǎng)的AD8275 spice模型“AD8275.cir”自動(dòng)生成個(gè)LTspice模型用來(lái)仿真,仿真時(shí)彈出圖片所示窗口,如何處理?
    發(fā)表于 06-04 12:27

    基于stm32h743IIK在cubeai上部署keras模型,模型輸出結(jié)果都是同概率數(shù)組,為什么?

    基于stm32h743IIK,在cubeai上部署keras模型模型輸出結(jié)果都是同概率數(shù)組,一點(diǎn)也搞不明白,看社區(qū)也有相同的問(wèn)題,但沒(méi)
    發(fā)表于 05-20 08:18

    ISEDA首發(fā)!大語(yǔ)言模型生成的代碼到底好不好使

    在大模型席卷切、賦能百業(yè)的浪潮里,“碼農(nóng)”也沒(méi)能獨(dú)善其身。各種代碼自動(dòng)生成的大模型,似乎描繪了一個(gè)人人都能像資深工程師
    發(fā)表于 05-16 13:41 ?334次閱讀
    ISEDA首發(fā)!大語(yǔ)言<b class='flag-5'>模型</b><b class='flag-5'>生成</b>的代碼到底好不好使

    阿里通義大模型助力“小愛(ài)同學(xué)”強(qiáng)化多模態(tài)AI生成能力

    小米的人工智能助手“小愛(ài)同學(xué)”近期與阿里通義大模型達(dá)成戰(zhàn)略合作,共同提升其多模態(tài)AI生成能力,特別是在圖片生成與理解方面。這次合作不僅將強(qiáng)化“小愛(ài)同學(xué)”的功能,還將在小米的多個(gè)產(chǎn)品線
    的頭像 發(fā)表于 05-13 09:19 ?822次閱讀

    阿里視頻生成技術(shù)創(chuàng)新!視頻生成使用了哪些AI技術(shù)和算法

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)日前,阿里宣布通義實(shí)驗(yàn)室研發(fā)的視頻生成模型EMO正式上線通義App,免費(fèi)對(duì)所有人開(kāi)放。借助這功能,用戶可以在歌曲、熱梗、表情包中任選
    的頭像 發(fā)表于 05-08 00:07 ?3376次閱讀

    【大語(yǔ)言模型:原理與工程實(shí)踐】大語(yǔ)言模型的基礎(chǔ)技術(shù)

    概率推斷,利用共現(xiàn)矩陣學(xué)習(xí)每個(gè)詞的主題分布,進(jìn)而將其作為詞的表示向量。在大規(guī)模語(yǔ)料庫(kù)中進(jìn)行模型訓(xùn)練,使語(yǔ)義相似的詞具有相似的主題分布。然而,這類方法存在個(gè)問(wèn)題,即
    發(fā)表于 05-05 12:17

    生成式 AI 進(jìn)入模型驅(qū)動(dòng)時(shí)代

    隨著ChatGPT和大型語(yǔ)言模型(LLM)呈現(xiàn)爆炸式增長(zhǎng),生成式人工智能(GenerativeAI)成為近來(lái)的大熱詞。由此引發(fā)了場(chǎng)爭(zhēng)論:哪種AI
    的頭像 發(fā)表于 04-13 08:12 ?534次閱讀
    <b class='flag-5'>生成</b>式 AI 進(jìn)入<b class='flag-5'>模型</b>驅(qū)動(dòng)時(shí)代

    基于深度學(xué)習(xí)的方法在處理3D點(diǎn)進(jìn)行缺陷分類應(yīng)用

    背景部分介紹了3D點(diǎn)應(yīng)用領(lǐng)域中公開(kāi)可訪問(wèn)的數(shù)據(jù)集的重要性,這些數(shù)據(jù)集對(duì)于分析和比較各種模型至關(guān)重要。研究人員專門設(shè)計(jì)了各種數(shù)據(jù)集,包括用于
    的頭像 發(fā)表于 02-22 16:16 ?1161次閱讀
    基于深度學(xué)習(xí)的方法在處理3D<b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>進(jìn)行缺陷分類應(yīng)用

    【愛(ài)芯派 Pro 開(kāi)發(fā)板試用體驗(yàn)】人體姿態(tài)估計(jì)模型部署前期準(zhǔn)備

    模型,會(huì)先生成針對(duì)關(guān)鍵點(diǎn)的heatmap圖像,來(lái)預(yù)測(cè)關(guān)鍵點(diǎn)的位置;同時(shí)也會(huì)PAF圖像,也叫做關(guān)節(jié)的親和力場(chǎng),哪些關(guān)節(jié)的親和力大,那么把它們劃分為同
    發(fā)表于 01-01 01:04