0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

伯克利打造AI識別系統(tǒng),DeepFake不再可怕!精準判斷真?zhèn)?/h1>

DeepFakes技術(shù)的安全性已然成為輿論的焦點。而近日,來自加州大學伯克利分校和南加州大學的研究人員打造了一款AI識別系統(tǒng),能從Deepfake制假者未注意到的面部細節(jié)入手,準確"揪出"假視頻

DeepFake假視頻的泛濫早已經(jīng)不只是惡搞和娛樂的問題了!這些假視頻衍生出的假新聞可能會成為2020美國大選的一場噩夢。

目前,越來越多的研究人員在努力尋找準確識別Deepfake的假視頻的方法。這場斗法已經(jīng)成為一場維護新聞真實性、甚至是關(guān)乎國家安全的一場軍備競賽。

近日,來自加州大學伯克利分校和南加州大學的研究人員在這場競賽中暫時走在了前面。他們打造的AI識別系統(tǒng),能從Deepfake制假者未注意到的面部細節(jié)入手,準確"揪出"假視頻。

現(xiàn)在使用神經(jīng)網(wǎng)絡深度學習偽造的視頻,其質(zhì)量和生產(chǎn)速度可能讓即將到來的總統(tǒng)大選成為一場噩夢。但是,利用當前深度技術(shù)中被忽視的一些東西,研究人員發(fā)現(xiàn)了一種自動識別這些虛假視頻的新方法。

DeepFake不再可怕,精準判斷真?zhèn)?/p>

利用Deepfake生成視頻現(xiàn)在還遠遠算不上完美。這些視頻是利用互聯(lián)網(wǎng)上抓取的海量圖像庫創(chuàng)建的,早期生成的視頻分辨率一般很低(因為更容易隱藏缺陷),而且是過度壓縮的。但Deepfake技術(shù)的發(fā)展速度非常驚人,而且這個過程中,不斷改進生成視頻中的缺陷,比如假視頻中人物從不眨眼的缺陷,很快得到了改善,使這些生成的假視頻變得越來越逼真可信。

早期的Deepfake生成的假視頻缺陷明顯,比如人物說話時從不眨眼,現(xiàn)在這個缺陷已被修復

假視頻的生成與識別已經(jīng)成為一場軍備競賽,任何一方都不會很快徹底打垮對手。不過最近,來自加州大學伯克利分校和南加州大學的研究人員在這場戰(zhàn)斗中開發(fā)了出了新的武器,可以更加準確地識別偽造的視頻。研究人員利用前總統(tǒng)奧巴馬的現(xiàn)有視頻,使用類似的過程來創(chuàng)建假視頻,訓練AI來尋找每個人的“軟性生物識別”標簽。

這聽起來很復雜,其實這東西我們并不陌生。每當我們開口說話時,都會以微妙但獨特的方式來移動身體,我們的頭、手、眼睛甚至嘴唇都會產(chǎn)生這樣的運動。這一切都是在潛意識里完成的,你沒有意識到你的身體正在做這件事,大腦也沒有立刻意識到身體其他部位的運動發(fā)生在何時,但從結(jié)果上看,這是一個目前Deepfake在創(chuàng)造假視頻時的時候沒有考慮到的因素。

在實驗中,這款新的AI準確發(fā)現(xiàn)偽造視頻的幾率達到了92%,實驗對象包括使用多種技術(shù)創(chuàng)建的假視頻,以及由于視頻文件被過度壓縮導致圖像質(zhì)量下降的視頻。

下一步,研究人員還打算通過識別人聲的獨特節(jié)奏和特征,來進一步提高AI識別假視頻的成功率。但目前的實際情況是,Deepfake的發(fā)展和改進速度非???,可能會在2020年之前迎頭趕上,成功欺騙目前的AI識別工具。這可能是一場曠日持久的戰(zhàn)斗,最終誰會獲勝現(xiàn)在還很難講。

深度學習的最新進展使得創(chuàng)建復雜且引人注目的假視頻變得更加容易?,F(xiàn)在,普通人就可以利用相對適度的數(shù)據(jù)和計算力,炮制出一段名人的演講視頻,這些所謂的“Deepfake”視頻可能會對國家安全和社會構(gòu)成重大威脅。為了應對這種日益嚴重的威脅,本文提出了一種技術(shù),可以模擬人物說話時潛在的面部表情和動作。雖然這些動作看上去不顯眼,但制造假視頻的方法沒有注意這一點,因此可用于驗證視頻的真假。

我們假設,當一個人說話時,會做出不同的(但可能不是唯一的)面部表情和動作。給定單個視頻作為輸入,首先跟蹤面部和頭部運動,然后檢測并提取特定動作單元的存在性和強度。由此可以構(gòu)建一個能夠區(qū)分真假視頻的新的檢測模型。

圖1 上面所示是來自250幀剪輯片段中的五個等距幀,顯示了對OpenFace的跟蹤結(jié)果。下半部分為此視頻剪輯上測量的一個動作單元AU01(眉毛抬起)的程度。

我們使用開源面部行為分析工具包OpenFace2 來提取視頻中的面部和頭部運動。該數(shù)據(jù)庫為給定視頻中的每幀提供2-D和3-D面部地標位置、頭部姿勢、眼睛注視和面部動作單元。提取量度標準如圖1所示。

具體來說,首先要明確的是,不同的人在說話時會表現(xiàn)出相對不同的面部和頭部運動模式。而Deepfake假視頻往往會破壞這些模式,因為假視頻中的這些模式的表達由模仿算法控制,可能導致嘴巴與臉部的其他部分不自然的分離。

本文構(gòu)建了高度個人化的“軟生物識別指標”,并利用這些指標來區(qū)分真實和虛假視頻。與以前的方法不同,這種方法能夠有效應對laundering,因為該方法依賴于不易破壞的相對粗略的量度。

表1. POI正在講話的下載視頻和段的總持續(xù)時間,以及從段中提取的段和10秒剪輯的總數(shù)。

圖2.從上到下依次是原始視頻,嘴唇同步Deepfake假視頻、喜劇模仿視頻、換臉Deepfake和木偶大師deepfake的10秒視頻剪輯的五個示例幀。

圖3. 希拉里·克林頓(棕色),巴拉克·奧巴馬(淺灰色帶框),伯尼·桑德斯(綠色),唐納德·特朗普(橙色),伊麗莎白·沃倫(藍色)的190-D特征的二維可視化),隨機任務(粉色),以及奧巴馬的Deepfake假視頻(深灰色帶框)

實驗結(jié)果:總體識別準確率超過95%

表2:奧巴馬視頻的三種不同假陽性率(FPR)曲線下面積(AUC)和真陽性率(TPR)的總體準確度。上半部分對應于使用完整190個特征的10秒視頻片段和完整視頻片段的識別準確度。下半部分為于僅使用29個特征的識別準確度。

表3:希拉里·克林頓,伯尼·桑德斯,唐納德·特朗普和伊麗莎白沃倫的10秒視頻剪輯的總體識別準確度

表4:對喜劇模仿假視頻(黑色方塊),隨機人物假視頻(白色方塊),嘴唇同步Deepfake假視頻(黑色圓圈),換臉Deepfake假視頻(白色圓圈)和木偶大師Deepfake假視頻(黑色菱形)的識別準確度

圖5:(a)真實的樣本框架; (b)喜劇模仿假視頻樣本框架; (c)四個名人的換臉Deepfake假視頻的樣本框架

研究局限與未來方向

本文提出的方法與現(xiàn)有的基于像素的檢測方法相比,可以更好地抵御圖像壓縮的影響。不過我們也發(fā)現(xiàn),本方法的適用性容易受到人們說話的不同背景的影響(直面鏡頭正式講話,與不看鏡頭的現(xiàn)場采訪)。我們建議通過以下兩種方式來應對。

在各種多樣化環(huán)境中收集更大、更多樣化的視頻集,或者構(gòu)建幾位名人基于特定環(huán)境下的講話模型。除了這種背景環(huán)境效應之外,我們發(fā)現(xiàn)當演講人始終遠離鏡頭時,動作單元的可靠性可能會受到嚴重影響。為了解決這些局限性,建議通過語言分析來增強模型性能,更好地捕獲所說內(nèi)容與說法方式之間的相關(guān)性。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31338

    瀏覽量

    269749
  • DeepFake
    +關(guān)注

    關(guān)注

    0

    文章

    15

    瀏覽量

    6688

原文標題:DeepFakes天敵來了!伯克利緊急研發(fā)“火眼金睛”防偽克星

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    兩大AI模型性能提升 登上國際榜單

    ,目前位列BFCLLeaderboard總榜單第一。據(jù)悉,榜單BFCLLeaderboard是由加州大學伯克利分校開發(fā)的評估LLM工具調(diào)用能力基準測試平臺。作為目前大
    的頭像 發(fā)表于 01-16 12:01 ?206次閱讀
    兩大<b class='flag-5'>AI</b>模型性能提升 登上國際榜單

    開源項目 ! 利用邊緣計算打造便攜式視覺識別系統(tǒng)

    利用邊緣計算打造便攜式人工智能解決方案,面向開發(fā)者的視覺識別項目! 自制視覺識別系統(tǒng) 我們將深入探究一套堪稱絕妙的軟硬件組合,以助力開發(fā)者輕松構(gòu)建便攜式、高效的視覺識別裝置。需要哪些
    發(fā)表于 12-16 16:31

    RFID識別系統(tǒng)

    隨著信息技術(shù)的快速發(fā)展,RFID(射頻識別)技術(shù)在各行各業(yè)的應用日益廣泛,其中RFID識別系統(tǒng)作為核心應用,已經(jīng)成為智能化管理不可或缺的基石。通過無線射頻信號的非接觸式識別與數(shù)據(jù)傳輸,RFID
    的頭像 發(fā)表于 12-06 17:57 ?309次閱讀
    RFID<b class='flag-5'>識別系統(tǒng)</b>

    RISC-V,即將進入應用的爆發(fā)期

    RISC-V是一種開放標準指令集架構(gòu) (ISA),最初由加州大學伯克利分校的研究人員于2010年開發(fā)。業(yè)界稱,這種開源特性為芯片設計者提供了極大的靈活性,可以根據(jù)具體需求定制AI加速器。 而AI
    發(fā)表于 10-31 16:06

    4K高清高速攝像頭在車牌識別技術(shù)中的革新應用與優(yōu)勢解析

    Horus AI?高速相機是一款極其優(yōu)秀的車牌識別相機開發(fā)平臺,不僅圖像性能優(yōu)秀,而且有良好的開發(fā)支持。Horus AI高速相機是快速打造您自己的車牌
    的頭像 發(fā)表于 10-15 16:27 ?687次閱讀
    4K高清高速攝像頭在車牌<b class='flag-5'>識別</b>技術(shù)中的革新應用與優(yōu)勢解析

    人員超員識別系統(tǒng) 作業(yè)區(qū)域超員預警系統(tǒng)

    在當今復雜的生產(chǎn)作業(yè)與社會管理場景中,人員管理的精準性和高效性變得愈發(fā)重要。人數(shù)識別、人員超員識別系統(tǒng)、作業(yè)區(qū)域超員預警系統(tǒng)以及特殊崗位人員達標監(jiān)測等,都是保障安全生產(chǎn)、提高運營效率和
    的頭像 發(fā)表于 10-08 17:08 ?203次閱讀
    人員超員<b class='flag-5'>識別系統(tǒng)</b> 作業(yè)區(qū)域超員預警<b class='flag-5'>系統(tǒng)</b>

    如何判斷進口示波器探頭的真?zhèn)?/b>

    真?zhèn)?/b>是非常重要的。以下是一些判斷方法: 1. 檢查包裝和標簽 真正的進口示波器探頭通常會有精美的包裝和清晰的標簽。包裝上應有制造商的名稱、型號、序列號、生產(chǎn)日期等信息。標簽應包含所有必要的安全和使用說明。假冒產(chǎn)品
    的頭像 發(fā)表于 08-16 10:20 ?288次閱讀
    如何<b class='flag-5'>判斷</b>進口示波器探頭的<b class='flag-5'>真?zhèn)?/b>

    基于FPGA的指紋識別系統(tǒng)設計

    隨著人們對安全問題的日益重視,指紋識別作為一種高效、可靠的生物識別技術(shù),在多個領(lǐng)域得到了廣泛應用。本文設計并實現(xiàn)了一種基于FPGA的嵌入式指紋識別系統(tǒng),該系統(tǒng)利用FPGA的高集成度、低
    的頭像 發(fā)表于 07-17 16:33 ?1445次閱讀

    多目標智能識別系統(tǒng)

    智慧華盛恒輝多目標智能識別系統(tǒng)是一種利用現(xiàn)代計算機視覺技術(shù)和人工智能算法,從圖像或視頻中同時識別和分類多個目標物體的系統(tǒng)。這種系統(tǒng)廣泛應用于自動駕駛、智能監(jiān)控、人機交互、軍事偵察、災害
    的頭像 發(fā)表于 07-16 10:42 ?1.4w次閱讀

    基于OpenCV的人臉識別系統(tǒng)設計

    基于OpenCV的人臉識別系統(tǒng)是一個復雜但功能強大的系統(tǒng),廣泛應用于安全監(jiān)控、人機交互、智能家居等多個領(lǐng)域。下面將詳細介紹基于OpenCV的人臉識別系統(tǒng)的基本原理、實現(xiàn)步驟,并附上具體的代碼示例。
    的頭像 發(fā)表于 07-11 15:37 ?1.3w次閱讀

    基于GIS的SAR多目標智能識別系統(tǒng)

    智慧華盛恒輝基于GIS的SAR多目標智能識別系統(tǒng)是一個集成了合成孔徑雷達(SAR)和地理信息系統(tǒng)(GIS)技術(shù)的先進系統(tǒng),旨在實現(xiàn)高分辨率雷達圖像中的多目標智能識別。以下是該
    的頭像 發(fā)表于 06-26 14:26 ?534次閱讀

    車載語音識別系統(tǒng)語音數(shù)據(jù)采集標注案例

    車載語音識別系統(tǒng)是指利用機器學習算法實現(xiàn)的一種自然語言處理技術(shù),載語音識別系統(tǒng)通過辨別聲音的語調(diào)、語速和音量,將所聽到的語音轉(zhuǎn)化成可讀取的語言數(shù)字,從而達到實現(xiàn)車輛控制、語音導航等多個汽車控制功能
    的頭像 發(fā)表于 06-19 15:52 ?387次閱讀
    車載語音<b class='flag-5'>識別系統(tǒng)</b>語音數(shù)據(jù)采集標注案例

    車載語音識別系統(tǒng)語音數(shù)據(jù)采集標注案例

    車載語音識別系統(tǒng)是指利用機器學習算法實現(xiàn)的一種自然語言處理技術(shù),載語音識別系統(tǒng)通過辨別聲音的語調(diào)、語速和音量,將所聽到的語音轉(zhuǎn)化成可讀取的語言數(shù)字,從而達到實現(xiàn)車輛控制、語音導航等多個汽車控制功能
    的頭像 發(fā)表于 06-19 15:49 ?540次閱讀

    斯坦福、伯克利大神教授創(chuàng)業(yè)給機器人造大腦,OpenAI紅杉搶著投5億

    還記得曾火遍全網(wǎng)的ALOHA家務機器人嗎?最近該項目導師,斯坦福計算機科學與電氣工程系教授ChelseaFinn在X宣布,正式與其他幾位伯克利大牛學者、谷歌DeepMind科學家共同創(chuàng)業(yè),全力為
    的頭像 發(fā)表于 04-14 08:04 ?135次閱讀
    斯坦福、<b class='flag-5'>伯克利</b>大神教授創(chuàng)業(yè)給機器人造大腦,OpenAI紅杉搶著投5億

    科學家如何加速下一代微電子技術(shù)的發(fā)展

    來源:《半導體芯科技》雜志 作者:特蕾莎·杜克(Theresa Duque),伯克利實驗室科學作家 由伯克利實驗室領(lǐng)導的多機構(gòu)團隊致力于幫助芯片制造商領(lǐng)先于摩爾定律 微芯片是用于從智能手機到智能
    的頭像 發(fā)表于 01-23 13:42 ?389次閱讀