前段時(shí)間,一個(gè)叫做“將朱茵的黃蓉?fù)Q成楊冪的臉”的熱門(mén)話題在微博上爆火。原以為又是一波P圖熱潮引發(fā)的粉絲狂歡,沒(méi)想到小智在瀏覽具體內(nèi)容之后發(fā)現(xiàn):這次換臉的形式不是圖片,而是視頻.
一位B站UP主用AI技術(shù),將楊冪的臉“貼”在了朱茵飾演的黃蓉臉上。
說(shuō)實(shí)話,看到視頻和gif的小智真的被驚到了。
一方面,大冪冪的顏+朱茵的演技,這真的是神仙搭配呀!
另一方面, 不同于傳統(tǒng)觀念里惡搞視頻的“五毛特效”,這次的特效視頻根本看不出P圖痕跡, 真實(shí)得宛如原作.
這到底是什么神奇操作? 又運(yùn)用了什么樣的智能技術(shù)? 小智立刻展開(kāi)了調(diào)查。
Deepfake技術(shù)
原來(lái),這種神奇的換臉效果使用的是一種叫做Deepfake的人工智能技術(shù).
什么是Deepfake?
Deepfake一詞由“Deep learning”(深度學(xué)習(xí))和“Fake”(假)組成, 其含義是在圖像或視頻中把一個(gè)人的臉替換成另一個(gè)人的臉. 這項(xiàng)技術(shù)的出現(xiàn)可以說(shuō)是人臉交換技術(shù)的一個(gè)重要突破.
Deepfake中文網(wǎng)站
幾年前的Deepfake技術(shù)并沒(méi)有像現(xiàn)在這樣廣泛的獲取渠道, 技術(shù)門(mén)檻也比較高。后來(lái), 有人推出了Windows程序FakeApp, 即使是對(duì)人工智能或是對(duì)視頻剪輯一竅不通的外行, 只需要一個(gè)GPU和一些訓(xùn)練數(shù)據(jù), 再通過(guò)按部就班的操作也能制作出換臉視頻.
同時(shí),Deepfake在GitHub 上也已經(jīng)開(kāi)源,這一系列的變化都大大降低了Deepfake的獲取門(mén)檻。
技術(shù)原理
從技術(shù)角度而言,Deepfake是深度圖像生成模型的一次成功應(yīng)用。
在模型訓(xùn)練期間,先把目標(biāo)人物A的臉摳出來(lái),定位好A的五官位置,訓(xùn)練出一個(gè)“無(wú)論怎么扭曲和變化A的臉,最后都能生成正常的A臉”的網(wǎng)絡(luò)。
五官定位示意圖
網(wǎng)絡(luò)訓(xùn)練好后,我們?cè)傧蚱渲休斎隑的臉。此時(shí),在神經(jīng)網(wǎng)絡(luò)的邏輯看來(lái),B的臉就是“以某種方式扭曲的A的臉”,需要它來(lái)進(jìn)行“糾正”。并且數(shù)據(jù)越多,效果越好。
操作流程
在FakeApp上的具體的操作大體分為3個(gè)步驟:原始數(shù)據(jù)集獲取,模型訓(xùn)練,視頻生成。
首先,我們需要一個(gè)包含Nvidia GPU的個(gè)人電腦,至少4GB的存儲(chǔ)空間。至于訓(xùn)練神經(jīng)網(wǎng)絡(luò)所需的材料,用戶則需要提供至少幾百?gòu)堈掌蛘邥r(shí)長(zhǎng)足夠的視頻,以便FakeApp從視頻中提取所有幀。然后調(diào)整合適的參數(shù),就可以開(kāi)始訓(xùn)練了。
圖片或視頻上傳操作
在訓(xùn)練過(guò)程中,F(xiàn)akeApp會(huì)顯示一個(gè)分?jǐn)?shù),數(shù)值越大則表示訓(xùn)練結(jié)果的偏差越大。當(dāng)這個(gè)值低于0.02時(shí)效果通常就OK了,此時(shí)可以停止訓(xùn)練程序。這一過(guò)程需要的總時(shí)長(zhǎng)從十幾到幾十小時(shí)不等。
最后選擇上面訓(xùn)練好的模型和需要的換臉視頻,再設(shè)置合適的幀率,就可以得到一段自制Deepfake視頻。
關(guān)鍵機(jī)制
其實(shí)AI換臉也不算是新鮮事,不過(guò)早期的換臉效果確實(shí)差強(qiáng)人意。
你看得出換上的是誰(shuí)的臉嗎?
那使用Deepfake生成的人臉為何如此逼真?
這很大程度上歸功于一種叫做GAN(生成式對(duì)抗網(wǎng)絡(luò))的關(guān)鍵機(jī)制。
在GAN中有兩個(gè)機(jī)器學(xué)習(xí)模型, 一個(gè)扮演“造假者”, 在數(shù)據(jù)集上訓(xùn)練后生成假視頻;另一個(gè)則扮演“檢測(cè)者”, 不斷地檢測(cè)這些假視頻, 一直到它再也不能檢測(cè)出結(jié)果是假的.
此外,用于訓(xùn)練的數(shù)據(jù)集越大,做出的Deepfake視頻越真實(shí)。這也是為什么我們看到的Deepfake視頻中出現(xiàn)的人物幾乎都是著名的政客和明星——他們有太多的公開(kāi)視頻素材可供訓(xùn)練了。
尼古拉斯·凱奇:作品太多怪我咯?
全網(wǎng)熱議
AI換臉的話題引發(fā)了眾多網(wǎng)友的熱議。吃瓜群眾們表示,這下“P圖寶貝”們可以名正言順地?fù)Q臉,假裝自己在演戲了。
還有群眾表示,“最強(qiáng)狗仔”卓偉就要失業(yè)了,以后明星的八卦視頻都可以直接甩鍋給“惡意換臉”,再也不用承認(rèn)了。
對(duì)于影視從業(yè)者來(lái)說(shuō),這也是個(gè)好消息。因?yàn)橐袁F(xiàn)在的技術(shù),一些大型數(shù)字特效公司想要將一位演員的面容“移植”到另一個(gè)身體上,至少需要幾個(gè)月的時(shí)間。特效公司工業(yè)光魔的首席運(yùn)營(yíng)官約翰·諾爾表示,如果這項(xiàng)技術(shù)能達(dá)到令人滿意的視覺(jué)效果,同時(shí)能大幅度提高制作效率、節(jié)省成本,那他們會(huì)很樂(lè)于嘗試。
《速度與激情7》中使用特效“復(fù)活”了保羅·沃克
當(dāng)然,也有不少網(wǎng)友對(duì)這一技術(shù)表示了擔(dān)憂
同樣感到擔(dān)憂的還有政界人物。美國(guó)總統(tǒng)大選佛羅里達(dá)州候選人盧比奧曾表示:過(guò)去想要威脅美國(guó),可能需要航母、核武器,還有洲際導(dǎo)彈?,F(xiàn)在只需要登錄互聯(lián)網(wǎng)系統(tǒng)、銀行系統(tǒng)、電網(wǎng),甚至只要弄出一段足以以假亂真的虛假視頻搞亂選舉,就足以讓美國(guó)陷入內(nèi)亂。
莫慌,造假有破綻
這些擔(dān)憂不無(wú)道理。
你永遠(yuǎn)不知道最厲害的技術(shù)會(huì)落到什么人的手里,況且這還是已經(jīng)開(kāi)源了的技術(shù)。
為了防范Deepfake背后的社會(huì)安全隱患,紐約大學(xué)的研究人員研究后發(fā)現(xiàn):在Deepfake生成的虛假視頻中,人物的頭部動(dòng)作和瞳孔顏色通常會(huì)很怪異,并且?guī)缀醪辉趺凑Q?。這成了目前Deepfake無(wú)法逃脫的bug。
觀察原視頻和造假視頻對(duì)應(yīng)的關(guān)鍵幀,可以看出,假臉人物在原視頻的眨眼處并沒(méi)有眨眼
據(jù)了解,這一bug并非來(lái)自算法本身的問(wèn)題,而是它使用的數(shù)據(jù)集。
當(dāng)訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)時(shí),我們使用的是來(lái)自網(wǎng)絡(luò)的靜態(tài)圖像。即便是像尼古拉斯·凱奇這樣的公眾人物,他的大多數(shù)照片也都是睜著眼睛的,一般很少有人會(huì)有大量的閉眼照。既然數(shù)據(jù)集中幾乎沒(méi)有眨眼圖像,那么Deepfake就無(wú)法“學(xué)會(huì)眨眼”,或者眨眼的時(shí)長(zhǎng)和頻率都遠(yuǎn)小于正常人。
這樣的進(jìn)展,可以算是“魔高一尺,道高一丈”了。
科技時(shí)代,“技術(shù)造假”和“技術(shù)打假”必會(huì)進(jìn)行曠日持久的戰(zhàn)爭(zhēng)。在鼓勵(lì)研究人員找出“打假”方法的同時(shí),小智覺(jué)得,我們還需要呼吁停止濫用技術(shù)以及傳播相應(yīng)的惡性作品。
畢竟, 科技的發(fā)展不僅需要頂尖科學(xué)家們的努力攻克, 還需要蕓蕓大眾的共同維護(hù).
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4777瀏覽量
100979 -
AI
+關(guān)注
關(guān)注
87文章
31335瀏覽量
269725 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5511瀏覽量
121362
原文標(biāo)題:把你的臉換到楊冪的電影里—AI換臉術(shù)是如何做到天衣無(wú)縫的?
文章出處:【微信號(hào):Deep_Learning-2018,微信公眾號(hào):深度學(xué)習(xí)和機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論