0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

AI Deepfake再升級,以假亂真!安全性令人擔憂

WpOh_rgznai100 ? 來源:YXQ ? 2019-06-12 13:54 ? 次閱讀

眾所周知,利用 Deepfake 技術可以自動生成虛假圖像,輕松達到以假亂真的結果。但這還不夠,隨著該技術的不斷升級,它還有更多意想不到的應用正在被挖掘?,F(xiàn)在,一個能更加方便快捷創(chuàng)建虛假視頻和錯誤信息的方法出現(xiàn)了。

最新的深度技術突破中,研究人員展示了一種新方法,該方法使用機器學習技術讓用戶編輯視頻文本內(nèi)容,來添加、刪除或更改視頻人物中的話語。

也就是說,如果你想對一段人物特寫視頻進行重新編輯,只需要對視頻所對應的文本內(nèi)容進行修改,隨后人臉會根據(jù)修改的文本內(nèi)容作出與之相配的動作表達。

研究人員在一段視頻講解中給出了一些例子,比如將電影《現(xiàn)代啟示錄》中的一段人物特寫鏡頭中的臺詞“我喜歡早晨的汽油彈的氣味”更改為“我喜歡早晨的法國土司的味道。”隨著臺詞的變化,系統(tǒng)自動會重新合成人物的臉部發(fā)聲動作,給出編輯后的視頻。

這項研究由斯坦福大學、馬克斯普朗克信息學研究所、普林斯頓大學和 Adobe 研究所的科學家共同合作完成,它表明人們能夠更輕松地編輯視頻人物所說的內(nèi)容并制作逼真的虛假視頻。

研究人員認為,他們的方法完全朝著基于文本編輯和合成一般視聽內(nèi)容的目標邁出了重要一步。

不過,該方法目前正處于研究階段,普通用戶還不能使用,但市面上已經(jīng)有類似的軟件。Adobe 就發(fā)布了一個叫 VoCo 原型軟件,該方法允許用戶像編輯圖片一樣輕松編輯語音內(nèi)容。

但該系統(tǒng)給出的結果要更加精細。根據(jù)論文《基于文本的頭部特寫視頻編輯》(https://www.ohadf.com/projects/text-based-editing/data/text-based-editing.pdf)介紹,該系統(tǒng)的輸入包括講話的頭部特寫視頻、講話的文本和指定的編輯操作,他們的工具支持三種類型的編輯操作:

增加新單詞:編輯器在視頻中的某一點添加一個或多個連續(xù)的單詞。

重新排列現(xiàn)有的單詞:編輯移動一個或多個存在于視頻中的單詞。

刪除現(xiàn)有單詞:編輯從視頻中刪除一個或多個單詞。

為了做出虛假視頻,研究者們主要分為五個階段來處理視頻。在音位排列階段,他們將轉錄文本與視頻進行比對,然后在跟蹤重建階段,用視頻生成了一個三維參數(shù)頭部模型。每個輸入視頻完成這樣的預處理步驟,然后執(zhí)行視位搜索(viseme search),在編輯器中找到音素的子序列和輸入視頻中音素的子序列之間的最佳視覺匹配。研究者們還提取了編輯位置周圍的區(qū)域作為背景序列,從中提取背景像素和姿態(tài)數(shù)據(jù)。對于每個子序列他們混合三維頭部模型的參數(shù),然后加上背景像素,最終呈現(xiàn)一個真實的全畫幅視頻(full-frame video)。

(注:視覺音素 / 視素(visual phoneme/viseme)是嘴唇和面部的姿勢或表達,其對應于特定的語音(音素),是具備可理解度的基本視覺單元。在計算機動畫中,我們可以使用視覺音素來制作虛擬角色的動作,令它們看起來像是在說話。)

當有人編輯視頻的文本內(nèi)容時,系統(tǒng)會將所有這些收集的數(shù)據(jù)(音素、視位和 3D 臉部模型)組合在一起,以構建與文本輸入相匹配的新素材,然后將其粘貼到源視頻上以創(chuàng)建最終的結果。

研究人員還將他們的方法與其他對講視頻合成技術進行了比較。他們分別用 5% 、10%、50% 和 100% 的訓練數(shù)據(jù)來測試結果。使用 100% 的數(shù)據(jù)量,每幅圖像的平均 RMSE(標準誤差) 為 0.018,使用 50% 的數(shù)據(jù)量為 0.019,只使用 5%的數(shù)據(jù)量為 0.021 。

他們還用各種合成短語進行測試,發(fā)現(xiàn)短語長度與結果質量沒有直接關系。而組成短語的視位和音素對齊質量等其他因素會影響最終結果。

他們還嘗試將 MorphCut 應用于單詞的加法問題。MorphCut 在兩幀圖像之間產(chǎn)生一個大的頭部跳躍。

將檢索到的viseme序列與MorphCut拼起來生成一個新單詞

同時,他們與 Face2Face[Thiesetal.2016]方法進行了比較,他們的方法生成了高質量結果,而基于檢索的 Face2Face 方法顯示出鬼影現(xiàn)象,并且不穩(wěn)定。

與 Face2Face 進行比較

為了定量評估基于文本的編輯系統(tǒng)生成的視頻質量,研究人員發(fā)起了一項基于 web 的用戶測試研究,參與者有 138 名。

在向 138 名志愿者進行虛假視頻的測試時,大約 60% 的參與者認為編輯過的視頻是真實的,雖然這個數(shù)據(jù)聽起來不怎么好,但另一數(shù)據(jù)顯示,同一組內(nèi)只有 80% 的參與者認為原始未經(jīng)編輯的鏡頭才是合理的。(研究人員指出,這可能是因為一些人在測試前被告知他們的答案會用于視頻編輯研究,這意味著受試者已經(jīng)準備好要找到虛假視頻。)

以上評估表明,他們的方法展示了令人信服的結果,但該研究也存在一定的局限性,還有進一步優(yōu)化的空間。

例如,新的合成方法需要重新計時(re-timed)的背景視頻作為輸入,但重新計時會改變動作的速度,因此眨眼和手勢可能不再與講話動作完全一致,為了減少這種影響,他們使用了比實際編輯更長的重新計時區(qū)間以修改更多原始視頻片段。

這里的算法只能用于對特寫風格的視頻施加影響,并且這需要 40 分鐘的輸入數(shù)據(jù)。編輯過的語音似乎與源材料的差別不大,并且在最優(yōu)質的虛假視頻中,研究人員要求拍攝對象錄制新的音頻以匹配這種變化,然后用 AI 生成視頻。

研究人員還指出,他們還不能改變?nèi)宋镎f話聲音的情緒或語調,因為這樣做會產(chǎn)生“不可思議的結果”,例如,如果人物在說話時揮手對臉部進行遮擋會讓算法完全失效。

在未來,研究人員指出,端到端學習可以用來學習一種從文本到視聽內(nèi)容的直接映射。

這些局限性始終存在于早期研究中,不過研究人員可以保證它們能夠及時得到克服,這意味著任何人都可以在沒有技術培訓的情況下使用系統(tǒng)來編輯人們在視頻中所說的內(nèi)容。

這項技術的潛在危害非常令人擔憂,該領域的研究人員經(jīng)常因未能考慮可能濫用其研究而受到批評。但參與這一特定項目的科學家表示,他們已經(jīng)考慮過這些問題。

在這篇論文附帶的博客文章中,他們寫道:“雖然圖像和視頻處理的方法與媒介本身一樣久遠,但當其應用于思想和意圖等權威證據(jù)的交流方式時,濫用的風險會更高?!八麄円渤姓J,不法分子可能會使用此類技術偽造個人陳述并用于誹謗知名人士。

為了防止人們混淆原始視頻和虛假視頻,他們給出的解決方案是人工智能編輯的視頻應該通過使用水印或通過上下文直接清楚地呈現(xiàn)(例如觀眾理解他們正在觀看的是虛構電影)。

但顯然,The Verge 指出,水印很容易被消除,而且網(wǎng)絡媒體在傳播會去掉上下文場景描述,虛假事物并不需要完美無瑕。很多虛假的新聞文章很容易被揭穿,但這并不能阻止它們的傳播,尤其是對于那些想要相信這種符合他們先入之見的謊言的社區(qū)。

當然,這樣的技術也有許多有益的用途,比如對電影和電視行業(yè)有很大的幫助,可以讓他們在不重新錄制鏡頭的情況下修復讀錯的臺詞,并幫助不同語言的演員進行無縫配音。不過,與潛在的濫用等威脅相比,這些益處好像并不足以使人們信任這項技術,反而,它在技術上的突破更大,人們會更加感到不安。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31025

    瀏覽量

    269363

原文標題:“篡改”視頻腳本,讓特朗普輕松“變臉”?AI Deepfake再升級

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    如何實現(xiàn) HTTP 協(xié)議的安全性

    協(xié)議的安全性,可以采取以下幾種方法: 1. 使用HTTPS HTTPS(安全超文本傳輸協(xié)議)是HTTP的安全版本,它在HTTP的基礎上通過SSL/TLS協(xié)議提供了數(shù)據(jù)加密、數(shù)據(jù)完整
    的頭像 發(fā)表于 12-30 09:22 ?229次閱讀

    集中告警管理如何提升設施安全性?

    在工業(yè)或商業(yè)建筑中,集中告警管理已成為確保安全性或檢測故障的必備工具。它是如何提升設施安全性的?歡迎大家閱讀文章了解~
    的頭像 發(fā)表于 12-13 15:51 ?134次閱讀
    集中告警管理如何提升設施<b class='flag-5'>安全性</b>?

    電池的安全性測試項目有哪些?

    電池的安全性測試是保證電池在實際使用過程中穩(wěn)定、安全的重要手段。通過一系列嚴格的測試項目,能夠有效評估電池在不同條件下的表現(xiàn),并提前發(fā)現(xiàn)潛在的安全隱患。對于消費者而言,了解這些測試項目不僅能幫助他們
    的頭像 發(fā)表于 12-06 09:55 ?426次閱讀
    電池的<b class='flag-5'>安全性</b>測試項目有哪些?

    在電氣安裝中通過負載箱實現(xiàn)最大效率和安全性

    在電氣安裝中,負載箱是一種常用的設備,主要用于模擬實際的電力負載,以便進行各種電氣設備的測試和調試。通過負載箱,可以實現(xiàn)最大效率和安全性,從而提高電氣設備的運行性能和使用壽命。 負載箱可以實現(xiàn)最大
    發(fā)表于 11-20 15:24

    深入探索:海外IP代理池的安全性與管理

    海外IP代理池的安全性與管理是使用這一工具時不可忽視的重要方面。
    的頭像 發(fā)表于 11-14 07:39 ?149次閱讀

    AI即服務平臺的安全性分析

    AIaaS平臺降低AI應用門檻,但面臨數(shù)據(jù)泄露、惡意攻擊等安全威脅。需加強數(shù)據(jù)加密、訪問控制、模型加固、供應鏈安全等措施,確保合法合規(guī),提供安全可靠的
    的頭像 發(fā)表于 11-07 09:32 ?146次閱讀

    socket編程的安全性考慮

    在Socket編程中,安全性是一個至關重要的考慮因素。以下是一些關鍵的安全性考慮和措施: 1. 數(shù)據(jù)加密 使用TLS/SSL協(xié)議 :TLS/SSL(傳輸層安全性/安全套接層)是網(wǎng)絡
    的頭像 發(fā)表于 11-01 16:46 ?275次閱讀

    UWB模塊的安全性評估

    UWB(超寬帶)模塊的安全性評估是一個復雜而關鍵的過程,涉及多個方面,包括技術特性、加密機制、抗干擾能力、物理層安全等。以下是對UWB模塊安全性評估的分析: 一、技術特性帶來的安全性
    的頭像 發(fā)表于 10-31 14:17 ?274次閱讀

    智能系統(tǒng)的安全性分析

    智能系統(tǒng)的安全性分析是一個至關重要的過程,它涉及多個層面和維度,以確保系統(tǒng)在各種情況下都能保持安全、穩(wěn)定和可靠。以下是對智能系統(tǒng)安全性的分析: 一、數(shù)據(jù)安全性 數(shù)據(jù)加密 : 采用對稱加
    的頭像 發(fā)表于 10-29 09:56 ?274次閱讀

    云計算安全性如何保障

    云計算的安全性是一個復雜而多維的問題,涉及多個層面和多種技術手段。為了保障云計算的安全性,需要采取一系列綜合措施,以下是具體的保障方法: 一、數(shù)據(jù)加密 數(shù)據(jù)加密是保護云計算安全性的核心手段之一
    的頭像 發(fā)表于 10-24 09:14 ?291次閱讀

    固態(tài)電池安全性怎么樣

    固態(tài)電池在安全性方面表現(xiàn)出顯著的優(yōu)勢,這主要得益于其獨特的固態(tài)電解質結構。以下是對固態(tài)電池安全性的詳細分析:
    的頭像 發(fā)表于 09-15 11:47 ?741次閱讀

    請問DM平臺訪問安全性如何控制?

    DM平臺訪問安全性如何控制?
    發(fā)表于 07-25 06:10

    藍牙模塊的安全性與隱私保護

    藍牙模塊作為現(xiàn)代無線通信的重要組成部分,在智能家居、可穿戴設備、健康監(jiān)測等多個領域得到了廣泛應用。然而,隨著藍牙技術的普及,其安全性和隱私保護問題也日益凸顯。本文將探討藍牙模塊在數(shù)
    的頭像 發(fā)表于 06-14 16:06 ?557次閱讀

    E-Val Pro Plus有線驗證解決方案,功能升級,優(yōu)化制藥流程,確保安全性和合規(guī)!

    有線驗證解決方案全新升級,虹科E-Val Pro Plus新品發(fā)布!幫助您減少停機和上市時間,優(yōu)化制藥流程,確保合規(guī)安全性,是任何熱驗證過程的理想解決方案!
    的頭像 發(fā)表于 04-18 13:36 ?357次閱讀
    E-Val Pro Plus有線驗證解決方案,功能<b class='flag-5'>升級</b>,優(yōu)化制藥流程,確保<b class='flag-5'>安全性</b>和合規(guī)<b class='flag-5'>性</b>!

    Rust效率領先C++兩倍,內(nèi)存安全成國家安全議題

    這項發(fā)現(xiàn)由谷歌安卓平臺工具及庫的工程總監(jiān)Lars Bergstrom在日前召開的Rust Nation英國峰會揭示。盡管此前業(yè)內(nèi)對Rust的安全性和穩(wěn)定性存在一定爭議,特別是其‘unsafe’關鍵字的存在令人擔憂。
    的頭像 發(fā)表于 04-01 15:37 ?943次閱讀