0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾研究院發(fā)布全新AI擴散模型,可根據(jù)文本提示生成360度全景圖

科技訊息 ? 來源:科技訊息 ? 作者:科技訊息 ? 2023-06-25 09:19 ? 次閱讀

LDM3D是業(yè)界領(lǐng)先的可創(chuàng)建深度圖的生成式AI模型,有望革新內(nèi)容創(chuàng)作、元宇宙和數(shù)字體驗

英特爾研究院宣布與Blockade Labs合作發(fā)布LDM3D(Latent Diffusion Model for 3D)模型,這一全新的擴散模型使用生成式AI創(chuàng)建3D視覺內(nèi)容。LDM3D是業(yè)界領(lǐng)先的利用擴散過程(diffusion process)生成深度圖(depth map)的模型,進而生成逼真的、沉浸式的360度全景圖。LDM3D有望革新內(nèi)容創(chuàng)作、元宇宙應用和數(shù)字體驗,改變包括娛樂、游戲、建筑和設(shè)計在內(nèi)的許多行業(yè)。

英特爾研究院人工智能機器學習研究專家Vasudev Lal表示:“生成式AI技術(shù)旨在提高和增強人類創(chuàng)造力,并節(jié)省時間。然而,目前的大部分生成式AI模型僅限于生成2D圖像,僅有少數(shù)幾種可根據(jù)文本提示生成3D圖像。在使用幾乎相同數(shù)量參數(shù)的情況下,不同于現(xiàn)存的潛在擴散模型,LDM3D可以根據(jù)用戶給定的文本提示同時生成圖像和深度圖。與深度估計中的標準后處理方法相比,LDM3D能夠為圖像中的每個像素提供更精準的相對深度,并為開發(fā)者省去了大量用于場景開發(fā)的時間?!?/p>

封閉的生態(tài)系統(tǒng)限制了規(guī)模。英特爾致力于推動AI的真正普及,通過開放的生態(tài)系統(tǒng)讓更多人從這項技術(shù)中受益。計算機視覺領(lǐng)域近年來取得了重大進展,特別是在生成式AI方面。然而,當今許多先進的生成式AI模型只能生成2D圖像。與通常只能根據(jù)文本提示生成2D RGB圖像的現(xiàn)有擴散模型不同,LDM3D可以根據(jù)用戶給定的文本提示同時生成圖像和深度圖。與深度估計(depth estimation)中的標準后處理(post-processing)方法相比,LDM3D在使用與潛在擴散模型Stable Diffusion幾乎相同數(shù)量參數(shù)的情況下,能夠為圖像中的每個像素提供更精準的相對深度(relative depth)。

這項研究有望改變我們與數(shù)字內(nèi)容的互動方式,基于文本提示為用戶提供全新的體驗。LDM3D生成的圖像和深度圖能夠?qū)⒅T如寧靜的熱帶海灘、摩天大樓、科幻宇宙等文本描述轉(zhuǎn)化為細致的360度全景圖。LDM3D捕捉深度信息的能力,可以即時增強整體真實感和沉浸感,使各行各業(yè)的創(chuàng)新應用成為可能,包括娛樂、游戲、室內(nèi)設(shè)計、房產(chǎn)銷售 ,以及虛擬博物館與沉浸式VR體驗等。

6月20日,在IEEE/CVF計算機視覺和模式識別會議(CVPR)的3DMV工作坊上,LDM3D模型獲得了“Best Poster Award”

LDM3D是在LAION-400M數(shù)據(jù)集包含一萬個樣本的子集上訓練而成的。LAION-400M是一個大型圖文數(shù)據(jù)集,包含超過4億個圖文對。對訓練語料庫進行標注時,研究團隊使用了之前由英特爾研究院開發(fā)的稠密深度估計模型DPT-Large,為圖像中的每個像素提供了高度準確的相對深度。LAION-400M數(shù)據(jù)集是基于研究用途創(chuàng)建而成的,以便廣大研究人員和其它興趣社群能在更大規(guī)模上測試模型訓練。

LDM3D模型在一臺英特爾AI超級計算機上完成了訓練,該超級計算機由英特爾?至強?處理器和英特爾?Habana Gaudi? AI加速器驅(qū)動。最終的模型和流程整合了RGB圖像和深度圖,生成360度全景圖,實現(xiàn)了沉浸式體驗。

為了展示LDM3D的潛力,英特爾和Blockade的研究人員開發(fā)了應用程序DepthFusion,通過標準的2D RGB圖像和深度圖創(chuàng)建沉浸式、交互式的360度全景體驗。DepthFusion利用了TouchDesigner,一種基于節(jié)點的可視化編程語言,用于實時互動多媒體內(nèi)容,可將文本提示轉(zhuǎn)化為交互式和沉浸式數(shù)字體驗。LDM3D是能生成RGB圖像及其深度圖的單一模型,因此能夠節(jié)省內(nèi)存占用和降低延遲。

LDM3D和DepthFusion的發(fā)布,為多視角生成式AI和計算機視覺的進一步發(fā)展鋪平了道路。英特爾將繼續(xù)探索如何使用生成式AI增強人類能力,并致力于打造一個強大的開源AI研發(fā)生態(tài)系統(tǒng),讓更多人能夠使用AI技術(shù)。延續(xù)英特爾對開放AI生態(tài)系統(tǒng)的大力支持,LDM3D正在通過HuggingFace進行開源,讓AI研究人員和從業(yè)者能對這一系統(tǒng)作出進一步改進,并針對特定應用進行微調(diào)。

在2023年6月18日至22日舉行的IEEE/CVF計算機視覺和模式識別會議上,英特爾將發(fā)表這項研究成果。欲了解更多信息,請參考論文《LDM3D: Latent Diffusion Model for 3D》。

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    9997

    瀏覽量

    172037
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31294

    瀏覽量

    269655
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1699

    瀏覽量

    46052
收藏 人收藏

    評論

    相關(guān)推薦

    英特爾發(fā)布全新神經(jīng)計算棒 構(gòu)建更智能AI邊緣設(shè)備

    英特爾人工智能大會于昨日(14日)在北京舉行。逾千名AI開發(fā)者、研究人員以及英特爾的客戶和伙伴齊聚,探討AI的發(fā)展,了解
    發(fā)表于 11-15 10:34 ?1387次閱讀

    英特爾研究院與聯(lián)想研究院簽署研究院合作框架協(xié)議

    英特爾研究院與聯(lián)想研究院日前在北京簽署了《研究院合作框架協(xié)議》,宣布雙方將在PC及移動互聯(lián)網(wǎng)領(lǐng)域,立足3~5年長遠技術(shù)研究,開展協(xié)同創(chuàng)新深度
    發(fā)表于 04-13 08:42 ?550次閱讀

    英特爾中國研究院院長:釋放數(shù)據(jù)的價值需要計算力

    8月22日,在南京舉行的第十六屆中國集成電路技術(shù)與應用研討會暨南京國際集成電路技術(shù)達摩論壇(CCIC 2018)上,英特爾中國研究院院長宋繼強發(fā)表了題為突破計算創(chuàng)新 共贏數(shù)據(jù)未來的演講。邁向數(shù)據(jù)洪流
    發(fā)表于 08-27 15:07 ?575次閱讀

    英特爾發(fā)布首款低溫控制芯片 基于22納米FinFET技術(shù)

    12月10日消息 根據(jù)英特爾官方的消息,英特爾研究院發(fā)布了代號為“Horse Ridge”的首款低溫控制芯片,實現(xiàn)了對多個量子位的控制。
    發(fā)表于 12-11 09:20 ?711次閱讀

    研究院AI產(chǎn)業(yè)的預測

    研究院發(fā)布2020十大科技趨勢預測,從2019年科技的蓬勃發(fā)展中提前展望2020。作為2019年最受關(guān)注的科技熱詞之一,“AI”自然成
    的頭像 發(fā)表于 12-26 16:06 ?3767次閱讀

    英特爾中國研究院科技創(chuàng)新,解鎖智能發(fā)展新機遇

    2022 年 4 月 12 日,以“智探索·匯無界”為主題的“2022 英特爾中國研究院探索創(chuàng)新日”在北京舉行,英特爾研究院副總裁、英特爾
    的頭像 發(fā)表于 04-13 11:34 ?1022次閱讀
    <b class='flag-5'>英特爾</b>中國<b class='flag-5'>研究院</b>科技創(chuàng)新,解鎖智能發(fā)展新機遇

    2022英特爾中國研究院探索創(chuàng)新日,探索科技創(chuàng)新無窮奧秘

    2022 年 4 月 12 日,“2022 英特爾中國研究院探索創(chuàng)新日”在北京舉行。此次活動以“智探索·匯無界”為主題,展示了英特爾中國研究院一系列前瞻性
    的頭像 發(fā)表于 04-13 11:50 ?1249次閱讀
    2022<b class='flag-5'>英特爾</b>中國<b class='flag-5'>研究院</b>探索創(chuàng)新日,探索科技創(chuàng)新無窮奧秘

    基于負責任AI框架,英特爾研究院構(gòu)建生成AI應用

    ChatGPT的爆火讓AI再次成為大眾熱議的焦點,作為英特爾所提出的搭建起從模擬時代到數(shù)字時代橋梁的五大“超級技術(shù)力量”之一,伴隨著無處不在的智能化,AI可將無窮的數(shù)據(jù)轉(zhuǎn)化為切實可行的洞察。 作為
    的頭像 發(fā)表于 02-16 09:35 ?552次閱讀

    英特爾研究院發(fā)布全新AI擴散模型,可根據(jù)文本提示生成360全景圖

    英特爾研究院宣布與Blockade Labs合作發(fā)布LDM3D(Latent Diffusion Model for 3D)模型,這一全新
    的頭像 發(fā)表于 06-30 19:50 ?383次閱讀

    英特爾? AMX 加速AI推理性能,助阿里電商推薦系統(tǒng)成功應對峰值負載壓力

    達沃斯論壇|英特爾王銳:AI驅(qū)動工業(yè)元宇宙,釋放數(shù)實融合無窮潛力 英特爾研究院發(fā)布全新
    的頭像 發(fā)表于 07-08 14:15 ?515次閱讀
    <b class='flag-5'>英特爾</b>? AMX 加速<b class='flag-5'>AI</b>推理性能,助阿里電商推薦系統(tǒng)成功應對峰值負載壓力

    英特爾研究院副總裁、英特爾中國研究院院長宋繼強:英特爾技術(shù)為全行業(yè)帶來卓越貢獻

    英特爾作為全球資深芯片廠商,為廣大消費者所認知的是其高性能的PC、服務器、移動端處理器,但是忽略了作為行業(yè)眾多協(xié)議標準的制定者和領(lǐng)導者,其技術(shù)底蘊是非常深厚的。近日,我們收到了來自英特爾研究院對于
    的頭像 發(fā)表于 09-26 14:06 ?493次閱讀

    2023英特爾on技術(shù)創(chuàng)新大會:英特爾研究院展示多項技術(shù)“魔法”

    中探索如何幫助人類應對在計算、連接、從云到邊緣的基礎(chǔ)設(shè)施、AI、傳感和感知等領(lǐng)域面臨的重大技術(shù)挑戰(zhàn)。 這就是英特爾研究院(Intel Labs)在做的事情。2023英特爾on技術(shù)創(chuàng)新大
    的頭像 發(fā)表于 09-26 17:25 ?512次閱讀
    2023<b class='flag-5'>英特爾</b>on技術(shù)創(chuàng)新大會:<b class='flag-5'>英特爾</b><b class='flag-5'>研究院</b>展示多項技術(shù)“魔法”

    英特爾研究院將在NeurIPS大會上展示業(yè)界領(lǐng)先的AI研究成果

    英特爾研究院將重點展示31項研究成果,它們將推進面向未來的AI創(chuàng)新。 ? ? ? ?英特爾研究院
    的頭像 發(fā)表于 12-08 09:17 ?732次閱讀

    英特爾研究院將在NeurIPS大會上展示業(yè)界領(lǐng)先的AI研究成果

    英特爾研究院將在NeurIPS 2023大會上展示一系列富有價值、業(yè)界領(lǐng)先的AI創(chuàng)新成果。面向廣大開發(fā)者、研究人員和學界人士,這一AI和計算
    的頭像 發(fā)表于 12-08 19:15 ?560次閱讀

    谷歌推出AI擴散模型Lumiere

    近日,谷歌研究院重磅推出全新AI擴散模型Lumiere,這款模型基于谷歌自主研發(fā)的“Space-
    的頭像 發(fā)表于 02-04 13:49 ?1069次閱讀