0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

能創(chuàng)造出有逼真紋理和形狀的一個(gè)生成式AI系統(tǒng)

電子工程師 ? 來源:lq ? 2018-12-06 10:17 ? 次閱讀

AI 生成逼真三維物體模型并不像人們以為的那么困難。

近日,在 NeurIPS 2018 會(huì)議上接收的論文“視覺對(duì)象網(wǎng)絡(luò):圖像生成與分離式的3D表示”中,麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(MIT CSAIL)和 Google 的研究人員介紹了能創(chuàng)造出有逼真紋理和形狀的一個(gè)生成式 AI 系統(tǒng)。

該系統(tǒng)是視覺對(duì)象網(wǎng)絡(luò)(VON)系統(tǒng),不僅可以生成比某些最先進(jìn)的方法更真實(shí)的圖像,還可以進(jìn)行形狀和紋理編輯、視點(diǎn)轉(zhuǎn)換以及其他三維調(diào)整。

“現(xiàn)代深層生成模型學(xué)會(huì)了合成逼真的圖像,”研究人員寫道,“但大多數(shù)計(jì)算模型只專注于生成 2D 圖像,而忽略了 3D 世界的美好......這種視角不可避免地限制了它們?cè)谠S多領(lǐng)域的實(shí)際應(yīng)用,例如合成數(shù)據(jù)生成、機(jī)器人學(xué)習(xí)、虛擬現(xiàn)實(shí)和游戲行業(yè)。”

視覺對(duì)象網(wǎng)絡(luò)系統(tǒng)則可以通過合成三維形狀和二維圖像來解決這個(gè)問題,類似于研究人員所稱的“分離式的對(duì)象表示”。圖像生成模型被分解為三種因素:形狀、視點(diǎn)和紋理,另外,在計(jì)算“2.5 D”草圖和添加紋理之前,它需要學(xué)習(xí)合成三維形狀。

重要的是,由于這三個(gè)因素是條件獨(dú)立的,所以模型不需要二維和三維形狀之間的配對(duì)數(shù)據(jù)。這使得團(tuán)隊(duì)能夠在大規(guī)模的二維圖像和三維形狀集上進(jìn)行訓(xùn)練,如 Pix3D,Google 圖像搜索和ShapeNet,后者包含 55 個(gè)對(duì)象類別的數(shù)千個(gè) CAD 模型。

為了讓 VON 系統(tǒng)學(xué)習(xí)如何生成自己的形狀,該團(tuán)隊(duì)在上述三維形狀數(shù)據(jù)集上訓(xùn)練了一個(gè)生成式對(duì)抗網(wǎng)絡(luò)(GAN) 。而紋理生成被歸類了到另一個(gè)基于 GAN 的神經(jīng)網(wǎng)絡(luò)。

經(jīng)過大約兩到三天的訓(xùn)練,AI 系統(tǒng)始終如一地生成了令人信服的 128 x 128 x 128 模型,具有優(yōu)異的反射率、環(huán)境照明和反照率(一種漫射光的度量)。

為了評(píng)估圖像生成模型,團(tuán)隊(duì)計(jì)算了用于生成三維模型的 Fréchet Inception Distance(弗雷歇初始距離,F(xiàn)ID)——一種與人類感知相關(guān)的度量。此外,他們還向亞馬遜 Mechanical Turk 上的五名測(cè)試者展示了由 VON 和其他最先進(jìn)模型生成的 200 對(duì)圖像,這些受試者需要在這些圖像中選擇更真實(shí)的結(jié)果。

VON 的表現(xiàn)非常出色。它與所有 AI 模型相比具有最低的 FID 值,并且 Mechanical Turk 的受訪者表示更喜歡 VON 生成的 74% 到 85%的圖像。

研究人員未來將專注于從粗糙到精細(xì)化的建模,以產(chǎn)生更高分辨率的生成形狀和圖像,并將紋理分解為光照和外觀(lighting and appearance),并合成自然場(chǎng)景。

“我們的主要想法是將圖像生成過程分解為形狀、視點(diǎn)和紋理三種因素,”Google 團(tuán)隊(duì)寫道,“這種分離式 3D 表示使我們能夠在對(duì)抗學(xué)習(xí)框架下從 3D 和 2D 視覺數(shù)據(jù)集合中學(xué)習(xí)模型。與現(xiàn)有的 2D 生成模型相比,我們的模型合成了更逼真的圖像,它還可以做到以前的 2D 方法也無法實(shí)現(xiàn)的各種 3D 操作?!?/p>

近年來,GAN 的研究突飛猛進(jìn),特別是在機(jī)器視覺領(lǐng)域。

Google 的 DeepMind 子公司在 10 月推出了一個(gè)基于 GAN 的系統(tǒng),以此創(chuàng)建出令人信服的食物、風(fēng)景、肖像和動(dòng)物照片。9 月,Nvidia 的研究人員開發(fā)了一種 AI 模型,可以生成腦癌的合成掃描圖像,8 月,卡內(nèi)基梅隆大學(xué)的一個(gè)團(tuán)隊(duì)演示了 AI 可以將人們已存的動(dòng)作和面部表情轉(zhuǎn)換成另一張照片或視頻中的目標(biāo)對(duì)象。最近,愛丁堡大學(xué)感知研究所和天文學(xué)研究所的科學(xué)家設(shè)計(jì)了一種至少可以產(chǎn)生高分辨率星系圖像的 GAN。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1793

    文章

    47590

    瀏覽量

    239472
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1953

    瀏覽量

    73882
  • 計(jì)算機(jī)科學(xué)

    關(guān)注

    1

    文章

    144

    瀏覽量

    11380
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    512

    瀏覽量

    515

原文標(biāo)題:AI做不了“真”3D圖像?試試Google的新生成模型

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    生成AI工具好用嗎

    當(dāng)下,生成AI工具正以其強(qiáng)大的內(nèi)容生成能力,為用戶帶來了前所未有的便捷與創(chuàng)新。那么,生成
    的頭像 發(fā)表于 01-17 09:54 ?47次閱讀

    生成AI工具作用

    生成AI工具是指那些能夠自動(dòng)生成文本、圖像、音頻、視頻等多種類型數(shù)據(jù)的人工智能技術(shù)。在此,petacloud.ai小編為您整理
    的頭像 發(fā)表于 10-28 11:19 ?279次閱讀

    2024學(xué)習(xí)生成AI的最佳路線圖

    本文深入探討了2024年最佳生成AI路線圖的細(xì)節(jié),引領(lǐng)我們穿越動(dòng)態(tài)進(jìn)展、新興趨勢(shì)以及定義這尖端領(lǐng)域的變革應(yīng)用。引言在日新月異的人工智能領(lǐng)域,生成
    的頭像 發(fā)表于 07-26 08:28 ?632次閱讀
    2024學(xué)習(xí)<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的最佳路線圖

    如何用C++創(chuàng)建簡(jiǎn)單的生成AI模型

    生成AI(Generative AI)是種人工智能技術(shù),它通過機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)技術(shù),從大量歷史數(shù)據(jù)中學(xué)習(xí)對(duì)象的特征和規(guī)律,從而能夠
    的頭像 發(fā)表于 07-05 17:53 ?956次閱讀

    生成AI的定義和特征

    生成人工智能(Generative Artificial Intelligence, GAI)是人工智能領(lǐng)域的個(gè)重要分支,它利用機(jī)器學(xué)習(xí)算法,特別是深度學(xué)習(xí)技術(shù),使計(jì)算機(jī)能夠模擬人
    的頭像 發(fā)表于 07-05 17:33 ?1218次閱讀

    生成AI的基本原理和應(yīng)用領(lǐng)域

    生成人工智能(Generative Artificial Intelligence,簡(jiǎn)稱Generative AI)是種利用機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)技術(shù),通過模擬人類的
    的頭像 發(fā)表于 07-04 11:50 ?1649次閱讀

    商湯發(fā)布《2024生成AI教育未來》白皮書

    生成AI正在各個(gè)行業(yè)中展現(xiàn)出巨大的應(yīng)用前景。在關(guān)系國計(jì)民生的教育行業(yè),生成AI能夠催生哪些創(chuàng)
    的頭像 發(fā)表于 06-29 09:48 ?887次閱讀

    原來這才是【生成AI】??!

    隨著ChatGPT、文心言等AI產(chǎn)品的火爆,生成AI已經(jīng)成為了大家茶余飯后熱議的話題??墒?,為什么要在
    的頭像 發(fā)表于 06-05 08:04 ?290次閱讀
    原來這才是【<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>】!!

    聯(lián)發(fā)科發(fā)布天璣AI開發(fā)套件,賦終端生成AI應(yīng)用

    聯(lián)發(fā)科近日推出了全新的天璣AI開發(fā)套件,旨在為合作伙伴打造一站式解決方案,以加速終端生成AI應(yīng)用的開發(fā)。這款套件集合了四大核心模塊,為
    的頭像 發(fā)表于 05-10 11:19 ?612次閱讀

    生成AI手機(jī)出貨量或?qū)w速增長(zhǎng),市場(chǎng)份額提升顯著

    同時(shí),反轉(zhuǎn)點(diǎn)還預(yù)期,至2027年,生成AI智慧型手機(jī)的市場(chǎng)保有量將超過10億部。按照其定義,生成AI
    的頭像 發(fā)表于 04-16 16:55 ?646次閱讀

    生成 AI 進(jìn)入模型驅(qū)動(dòng)時(shí)代

    隨著ChatGPT和大型語言模型(LLM)呈現(xiàn)爆炸增長(zhǎng),生成人工智能(GenerativeAI)成為近來的大熱詞。由此引發(fā)了場(chǎng)爭(zhēng)論:
    的頭像 發(fā)表于 04-13 08:12 ?562次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 進(jìn)入模型驅(qū)動(dòng)時(shí)代

    NVIDIA生成AI研究實(shí)現(xiàn)在1秒內(nèi)生成3D形狀

    NVIDIA 研究人員使 LATTE3D (款最新文本轉(zhuǎn) 3D 生成 AI 模型)實(shí)現(xiàn)雙倍加速。
    的頭像 發(fā)表于 03-27 10:28 ?536次閱讀
    NVIDIA<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>研究實(shí)現(xiàn)在1秒內(nèi)<b class='flag-5'>生成</b>3D<b class='flag-5'>形狀</b>

    NPU是什么?為何它是開啟終端側(cè)生成AI的關(guān)鍵?

    生成AI變革已經(jīng)到來。隨著生成AI用例需求在有著多樣化要求和計(jì)算需求的垂直領(lǐng)域不斷增加,我們
    的頭像 發(fā)表于 03-07 11:25 ?2124次閱讀
    NPU是什么?為何它是開啟終端側(cè)<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的關(guān)鍵?

    字節(jié)跳動(dòng)發(fā)布文生圖開放模型,迅速?zèng)_上Hugging Face Spaces熱榜

    生成 AI 正憑借其根據(jù)文本提示(text prompts)創(chuàng)造出驚艷圖像乃至視頻的能力,贏得全球的矚目。
    的頭像 發(fā)表于 02-26 13:47 ?871次閱讀
    字節(jié)跳動(dòng)發(fā)布文生圖開放模型,迅速?zèng)_上Hugging Face Spaces熱榜

    撥靠Sora賺錢的人已經(jīng)出現(xiàn)

    隨著OpenAI最新發(fā)布的人工智能文生視頻大模型Sora的問世,科技與創(chuàng)意產(chǎn)業(yè)再掀熱潮。據(jù)悉,Sora不僅能根據(jù)文字說明創(chuàng)造出逼真且富有想象力的場(chǎng)景,更因其強(qiáng)大的生成能力引發(fā)了市場(chǎng)與消費(fèi)者的極大興趣。
    的頭像 發(fā)表于 02-22 14:05 ?771次閱讀