在线亚洲人成电影网站色,91精品久久久久久窝窝网 ,chinese中国丰满熟妇

0. 筆者個(gè)人體會(huì)

最近文本到圖像的工作很火，生成的圖像也非常真實(shí)。但還有個(gè)問(wèn)題，現(xiàn)有工作效率比較低，往往只能接受一次text指令，再修改就要重新輸入text重新生成，可能會(huì)影響原本的語(yǔ)義信息，這樣導(dǎo)出的圖像和最初圖像可能差距甚遠(yuǎn)。

今天筆者將為大家分享一項(xiàng)最新開(kāi)源的工作LEDITS++，可以一次輸入無(wú)限多的編輯指令，一次性生成真實(shí)圖像！而且LEDITS++是無(wú)參數(shù)方案，不需要微調(diào)和優(yōu)化。不得不感慨AI發(fā)展之迅速，距離人們真實(shí)生活也越來(lái)越近了。

下面一起來(lái)閱讀一下這項(xiàng)工作，文末附論文和代碼鏈接~

1. 效果展示

先看一下具體效果，輸入具體指令就可以直接產(chǎn)生對(duì)應(yīng)效果。PS要想在幾十秒內(nèi)達(dá)到同等效果應(yīng)該是有點(diǎn)困難。

LEDITS++很強(qiáng)調(diào)編輯前后的圖像一致性，也就是僅修改圖像的相關(guān)區(qū)域，保持原始圖像的語(yǔ)義信息。這里也推薦工坊推出的新課程《徹底搞懂視覺(jué)-慣性SLAM：VINS-Fusion原理精講與源碼剖析》。

代碼已經(jīng)開(kāi)源了，官方主頁(yè)也開(kāi)放了交互式demo，感興趣的讀者可以上傳自己的圖像和文本指令嘗鮮一下效果。

2. 具體原理是什么？

LEDITS++可以分為三個(gè)部分：（1）有效的圖像反轉(zhuǎn)；（3）多功能文本編輯；（3）圖像變化的語(yǔ)義基礎(chǔ)。

我們知道擴(kuò)散模型生成圖像是通過(guò)反轉(zhuǎn)采樣來(lái)進(jìn)行的，重點(diǎn)是識(shí)別噪聲。LEDITS++從DDPM反演中提取特征，并提出一種有效的反演方法，大大減少所需的步驟，同時(shí)降低重建誤差。當(dāng)將反向擴(kuò)散過(guò)程公式化為SDE時(shí)，DDPM可以被視為一階SDE解算器。使用高階微分方程解算器可以更有效地解算，因此作者推導(dǎo)出一種新的更快技術(shù)------DPM-solver++反演。

在創(chuàng)建重建序列之后，可以通過(guò)一組編輯指令操縱噪聲來(lái)編輯圖像。根據(jù)有條件和無(wú)條件估計(jì)，作者分別設(shè)計(jì)了一個(gè)專(zhuān)門(mén)的引導(dǎo)項(xiàng)，既反映了編輯的方向，又最大化了對(duì)所需編輯效果的細(xì)粒度控制。

最后，LEDITS++還包括一個(gè)Mask項(xiàng)，由交叉注意層生成的Mask和噪聲估計(jì)導(dǎo)出的Mask取交集計(jì)算得到。Mask可以捕捉與編輯概念相關(guān)的圖像區(qū)域，對(duì)于多次編輯特別有效。這里也推薦工坊推出的新課程《徹底搞懂視覺(jué)-慣性SLAM：VINS-Fusion原理精講與源碼剖析》。

3. 和其他SOTA方法對(duì)比如何？

不同編輯方法的指令對(duì)齊和圖像相似度權(quán)衡的比較，側(cè)重CLIP得分(越高越好)與LPIPS相似度(越低越好)，也就是圖中越靠近左上角效果越好。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

圖像

圖像

+關(guān)注

關(guān)注
2

文章
1084

瀏覽量
40468
AI

AI

+關(guān)注

關(guān)注
87

文章
30896

瀏覽量
269108
開(kāi)源

開(kāi)源

+關(guān)注

關(guān)注
3

文章
3349

瀏覽量
42501

原文標(biāo)題：放下你的PhotoShop！無(wú)限圖像編輯已開(kāi)源！

文章出處：【微信號(hào)：3D視覺(jué)工坊，微信公眾號(hào)：3D視覺(jué)工坊】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

開(kāi)源鴻蒙技術(shù)分論壇在武漢成功舉辦

舉行。本次論壇通過(guò)南北向開(kāi)發(fā)賦能，融合前沿的行業(yè)案例經(jīng)驗(yàn)，生動(dòng)展現(xiàn)了開(kāi)源鴻蒙在驅(qū)動(dòng)技術(shù)創(chuàng)新與產(chǎn)業(yè)升級(jí)中的優(yōu)勢(shì)與無(wú)限潛能。 開(kāi)源技術(shù)引領(lǐng)變革，構(gòu)建枝繁葉茂生態(tài)體系在萬(wàn)物智聯(lián)的時(shí)代浪潮中，開(kāi)源

發(fā)表于 12-24 13:38 ?132次閱讀

與鴻同行，探索無(wú)限！開(kāi)源鴻蒙技術(shù)分論壇在武漢成功舉辦

。本次論壇通過(guò)南北向開(kāi)發(fā)賦能，融合前沿的行業(yè)案例經(jīng)驗(yàn)，生動(dòng)展現(xiàn)了開(kāi)源鴻蒙在驅(qū)動(dòng)技術(shù)創(chuàng)新與產(chǎn)業(yè)升級(jí)中的優(yōu)勢(shì)與無(wú)限潛能。開(kāi)源技術(shù)引領(lǐng)變革，構(gòu)建枝繁葉茂生態(tài)體系在萬(wàn)物智聯(lián)的

發(fā)表于 12-23 21:29 ?177次閱讀

高倍金相自動(dòng)測(cè)量顯微鏡無(wú)限遠(yuǎn)光學(xué)系統(tǒng)

高倍金相自動(dòng)測(cè)量顯微鏡無(wú)限遠(yuǎn)光學(xué)系統(tǒng)在無(wú)限遠(yuǎn)處形成圖像，是通過(guò)在物鏡與目鏡之間的主鏡筒中設(shè)置鏡筒透鏡，構(gòu)建了一個(gè)能夠形成中間圖像的光學(xué)系統(tǒng)。并可以靈活添加各種輔助組件，豐富了顯微鏡的功

發(fā)表于 12-14 20:31 ?234次閱讀

字節(jié)發(fā)布SeedEdit圖像編輯模型

近日，字節(jié)跳動(dòng)公司在其豆包大模型團(tuán)隊(duì)的官方網(wǎng)站上，正式公布了其最新的通用圖像編輯模型——SeedEdit。這款創(chuàng)新性的圖像編輯模型，為用戶(hù)提供了前所未有的便捷圖像編輯體驗(yàn)。據(jù)官方介紹

發(fā)表于 11-12 10:43 ?264次閱讀

圖像采集卡的接口類(lèi)型有哪些？

圖像采集卡又稱(chēng)圖像捕獲卡，是一種能獲取數(shù)字視頻圖像信息并進(jìn)行存儲(chǔ)和播放的硬件設(shè)備。它的作用是將圖像信號(hào)采集到計(jì)算機(jī)中，以數(shù)據(jù)文件的形式保存在硬盤(pán)上，是

發(fā)表于 10-24 17:07 ?185次閱讀

vim編輯器如何使用

Vim編輯器是一個(gè)功能強(qiáng)大的文本編輯器，它基于Vi進(jìn)行改進(jìn)，并增加了許多新特性。Vim編輯器的使用主要涉及其不同的工作模式及相應(yīng)操作。以下是Vim編輯器的基本使用方法：一、Vim

發(fā)表于 08-30 14:58 ?448次閱讀

Matepad pro12.2 已上市半個(gè)月，但是還沒(méi)有在開(kāi)源網(wǎng)站看到該項(xiàng)目的開(kāi)源信息，違背開(kāi)源精神

Matepad pro12.2 已上市半個(gè)月，本人自己也購(gòu)買(mǎi)了同款12+256的pad，想要同步學(xué)習(xí)下這款pad的一些體驗(yàn)還不錯(cuò)的功能點(diǎn)，但是目前為止還沒(méi)有在開(kāi)源網(wǎng)站看到該項(xiàng)目的開(kāi)源信息，也查詢(xún)不到

發(fā)表于 08-27 17:25

Adobe在Illustrator和Photoshop設(shè)計(jì)軟件中引入新工具和生成性AI功能

Adobe正在其Illustrator和Photoshop設(shè)計(jì)軟件中引入一些新工具和生成性AI功能，旨在幫助加快創(chuàng)意工作流程。Illustrator最引人注目的更新來(lái)自Adobe最新的Firefly

發(fā)表于 07-29 17:10 ?852次閱讀

esp32無(wú)限重啟的原因？

esp32無(wú)限重啟，重啟記錄顯示 Software reset due to exception/panic，有誰(shuí)知道這是什么原因重啟嗎？

發(fā)表于 06-25 08:13

微軟AI新成果：將不可編輯PDF轉(zhuǎn)化為可編輯文檔

市面現(xiàn)有相關(guān)軟件雖能將PDF轉(zhuǎn)為可編輯版，但易喪失原始布局。微軟研究論文名為《從不可編輯文檔生成可編輯文檔的方法和系統(tǒng)》，其獨(dú)特之處在于運(yùn)用AI技術(shù)保持了字體、色彩、布局及圖像格式等視

發(fā)表于 05-30 10:11 ?699次閱讀

蘋(píng)果擬提升照片應(yīng)用AI技術(shù)，以實(shí)現(xiàn)Photoshop級(jí)別編輯功能

蘋(píng)果官方網(wǎng)站于今日更換了“起飛吧”頁(yè)面LOGO，用戶(hù)可通過(guò)鼠標(biāo)涂抹掉部分或整個(gè)標(biāo)識(shí)。此舉被視為同時(shí)為推廣新款A(yù)pple Pencil及增強(qiáng)后的編輯功能進(jìn)行宣傳。

發(fā)表于 05-07 17:18 ?712次閱讀

開(kāi)放原子開(kāi)源大賽—基于OpenHarmony的團(tuán)結(jié)引擎應(yīng)用開(kāi)發(fā)賽正式啟動(dòng)！

所有開(kāi)發(fā)者開(kāi)放，只要完成注冊(cè)并認(rèn)證，即可報(bào)名參與。你將有機(jī)會(huì)深入實(shí)踐OpenHarmony開(kāi)源項(xiàng)目與Unity中國(guó)團(tuán)結(jié)引擎，更有機(jī)會(huì)贏取豐厚的獎(jiǎng)勵(lì)與榮譽(yù)激勵(lì)。賽事共設(shè)立了62個(gè)獎(jiǎng)項(xiàng)，總獎(jiǎng)金池高達(dá)45萬(wàn)元

發(fā)表于 03-13 10:45

谷歌模型怎么用PS打開(kāi)文件和圖片

）或ONNX模型（.onnx）等。這些模型文件是二進(jìn)制的，并且是為特定的機(jī)器學(xué)習(xí)框架設(shè)計(jì)的，而不是為圖像編輯軟件如PS設(shè)計(jì)的。

發(fā)表于 02-29 18:25 ?1459次閱讀

谷歌模型怎么PS打開(kāi)文件格式不變

要將谷歌模型與Photoshop結(jié)合使用，并保持文件格式不變，這通常涉及將谷歌模型生成的圖像或圖形導(dǎo)入到Photoshop中進(jìn)行進(jìn)一步編輯或處理。

發(fā)表于 02-29 18:09 ?876次閱讀

三星AI手機(jī)有多神？引入智能顯示，自動(dòng)調(diào)節(jié)亮度、顏色…

Galaxy S24系列配備了Galaxy AI（設(shè)備端人工智能）以及三星Gauss（高斯）等生成式人工智能。換句話說(shuō)，關(guān)鍵功能可以通過(guò)設(shè)備上的人工智能來(lái)解決，而無(wú)需聯(lián)系外部服務(wù)器。生成式人工智能支持需要更多計(jì)算的任務(wù)，例如高級(jí)搜索或圖像編輯。

發(fā)表于 01-19 15:49 ?1228次閱讀

搜索歷史

放下你的PhotoShop！無(wú)限圖像編輯已開(kāi)源！

評(píng)論

開(kāi)源鴻蒙技術(shù)分論壇在武漢成功舉辦

與鴻同行，探索無(wú)限！開(kāi)源鴻蒙技術(shù)分論壇在武漢成功舉辦

高倍金相自動(dòng)測(cè)量顯微鏡無(wú)限遠(yuǎn)光學(xué)系統(tǒng)

字節(jié)發(fā)布SeedEdit圖像編輯模型

圖像采集卡的接口類(lèi)型有哪些？

vim編輯器如何使用

Matepad pro12.2 已上市半個(gè)月，但是還沒(méi)有在開(kāi)源網(wǎng)站看到該項(xiàng)目的開(kāi)源信息，違背開(kāi)源精神

Adobe在Illustrator和Photoshop設(shè)計(jì)軟件中引入新工具和生成性AI功能

esp32無(wú)限重啟的原因？

微軟AI新成果：將不可編輯PDF轉(zhuǎn)化為可編輯文檔

蘋(píng)果擬提升照片應(yīng)用AI技術(shù)，以實(shí)現(xiàn)Photoshop級(jí)別編輯功能

開(kāi)放原子開(kāi)源大賽—基于OpenHarmony的團(tuán)結(jié)引擎應(yīng)用開(kāi)發(fā)賽正式啟動(dòng)！

谷歌模型怎么用PS打開(kāi)文件和圖片

谷歌模型怎么PS打開(kāi)文件格式不變

三星AI手機(jī)有多神？引入智能顯示，自動(dòng)調(diào)節(jié)亮度、顏色…

搜索歷史

放下你的PhotoShop！無(wú)限圖像編輯已開(kāi)源！

評(píng)論

放下你的PhotoShop！無(wú)限圖像編輯已開(kāi)源！