0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個(gè)多層機(jī)器學(xué)習(xí)程序的誕生

IEEE電氣電子工程師 ? 來源:IEEE電氣電子工程師學(xué)會(huì) ? 作者:IEEE電氣電子工程師 ? 2020-09-04 14:19 ? 次閱讀

想象一下你正在看一部恐怖電影:女主角在一個(gè)黑暗的地下室里,高度警惕。背景中播放著懸疑的音樂,而一些看不見的,邪惡的生物在陰影中爬行……然后——砰!打到了一個(gè)物體。

如果沒有強(qiáng)烈但恰到好處的音效,這樣的場景很難有那么吸引人和恐怖。通常,這些音效是由工作室里的Foley藝術(shù)家錄制的,他們使用大量可供選擇的物體來產(chǎn)生聲音。錄制玻璃破碎的聲音可能涉及實(shí)際反復(fù)打碎玻璃,例如,直到聲音與視頻剪輯非常匹配。

據(jù)悉,研究人員已經(jīng)開發(fā)了一款自動(dòng)化程序,可以分析視頻幀中的運(yùn)動(dòng),并創(chuàng)建自己的人工聲音效果來匹配場景。在一項(xiàng)調(diào)查中,大多數(shù)被調(diào)查者表示他們相信這些假音效是真的。該模型名為AutoFoley,具體介紹發(fā)表在了6月25日出版的IEEE Transactions on Multimedia上面。

“自20世紀(jì)30年代以來,在后期制作中使用Foley藝術(shù)添加音效一直是電影和電視配樂的一個(gè)復(fù)雜部分,”參與創(chuàng)作AutoFoley的德克薩斯大學(xué)教授Jeff Prevost解釋道?!叭绻麤]有一個(gè)真實(shí)的Foley配樂的控制層,,電影看起來既空洞又遙遠(yuǎn)。然而,F(xiàn)oley聲音合成的過程也由此為電影的創(chuàng)作增加了大量的時(shí)間和成本?!?/p>

Prevost和他的博士生Sanchita Ghose被自動(dòng)Foley系統(tǒng)的想法所吸引,開始創(chuàng)建了一個(gè)多層機(jī)器學(xué)習(xí)程序。他們創(chuàng)建了兩種不同的模型,可以在第一步中使用,包括識(shí)別視頻中的動(dòng)作并確定合適的聲音。

第一個(gè)機(jī)器學(xué)習(xí)模型從快速移動(dòng)動(dòng)作片段的幀中提取圖像特征(如顏色和運(yùn)動(dòng)),以確定合適的聲音效果。

第二個(gè)模型來分析對(duì)象在不同幀中的時(shí)間關(guān)系。通過使用關(guān)系推理來比較不同時(shí)間段的不同幀,第二個(gè)模型可以預(yù)測視頻中發(fā)生的動(dòng)作。

在最后一步,合成聲音以匹配其中一個(gè)模型預(yù)測的活動(dòng)或運(yùn)動(dòng)。Prevost和Ghose使用AutoFoley為1000個(gè)短片創(chuàng)建聲音,這些短片捕捉了許多常見的動(dòng)作,比如下雨、騎馬和滴答作響的時(shí)鐘。

分析顯示,毫不奇怪的是,AutoFoley最擅長于在不需要與視頻完全一致的情況下(例如,傾盆大雨、噼啪作響的大火)發(fā)出聲音。但是,當(dāng)視覺場景包含隨時(shí)間變化的隨機(jī)動(dòng)作(例如打字、雷雨)時(shí),程序可能與視頻不同步。

接下來,Prevost和Ghose調(diào)查了57名當(dāng)?shù)卮髮W(xué)生,他們認(rèn)為哪些電影片段包括了原聲配樂。在評(píng)估第一個(gè)模型產(chǎn)生的聲音時(shí),73%的受訪學(xué)生選擇了合成的AutoFoley剪輯作為原始片段,而不是真正的原始聲音片段。在評(píng)估第二個(gè)模型時(shí),仍有66%的受訪者選擇了AutoFoley剪輯而不是原來的聲音剪輯。

“我們的方法的一個(gè)局限性是需要分類的主題出現(xiàn)在整個(gè)視頻幀序列中,”Prevost說,同時(shí)還指出AutoFoley目前依賴的Foley類別的數(shù)據(jù)集非常有限。不過,AutoFoley的專利仍處于早期階段,但Prevost說這些限制將在未來的研究中得到解決。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:又被AI騙了?人工智能欺騙人類相信合成的聲音效果是真實(shí)的

文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    用于開發(fā)生物學(xué)數(shù)據(jù)的機(jī)器學(xué)習(xí)方法。盡管深度學(xué)習(xí)般指神經(jīng)網(wǎng)絡(luò)算法)是個(gè)強(qiáng)大的工具,目前也非常
    的頭像 發(fā)表于 12-30 09:16 ?301次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智能數(shù)據(jù)分析技術(shù)的創(chuàng)新源之,
    的頭像 發(fā)表于 11-16 01:07 ?463次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長。NPU作為種專門為深度學(xué)習(xí)機(jī)
    的頭像 發(fā)表于 11-15 09:19 ?539次閱讀

    eda在機(jī)器學(xué)習(xí)中的應(yīng)用

    值和噪聲數(shù)據(jù)。通過繪制箱線圖、直方圖和散點(diǎn)圖,我們可以直觀地看到數(shù)據(jù)中的異常值和分布情況。例如,如果個(gè)數(shù)據(jù)集中的某個(gè)特征值遠(yuǎn)高于其他值,這可能是個(gè)異常值,需要進(jìn)
    的頭像 發(fā)表于 11-13 10:42 ?353次閱讀

    具身智能與機(jī)器學(xué)習(xí)的關(guān)系

    (如機(jī)器人、虛擬代理等)通過與物理世界或虛擬環(huán)境的交互來獲得、發(fā)展和應(yīng)用智能的能力。這種智能不僅包括認(rèn)知和推理能力,還包括感知、運(yùn)動(dòng)控制和環(huán)境適應(yīng)能力。具身智能強(qiáng)調(diào)智能體的身體和環(huán)境在智能發(fā)展中的重要性。 2. 機(jī)器學(xué)習(xí)的定義
    的頭像 發(fā)表于 10-27 10:33 ?438次閱讀

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中個(gè)很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)。
    發(fā)表于 10-24 17:22 ?2515次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來點(diǎn)也不輕松,加油。 作者首先說明了時(shí)間序列的信息提取是時(shí)間序列分析的個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)
    發(fā)表于 08-14 18:00

    如何構(gòu)建多層神經(jīng)網(wǎng)絡(luò)

    構(gòu)建多層神經(jīng)網(wǎng)絡(luò)(MLP, Multi-Layer Perceptron)模型是個(gè)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)
    的頭像 發(fā)表于 07-19 17:19 ?947次閱讀

    深度學(xué)習(xí)在視覺檢測中的應(yīng)用

    深度學(xué)習(xí)機(jī)器學(xué)習(xí)領(lǐng)域中的個(gè)重要分支,其核心在于通過構(gòu)建具有多層次的神經(jīng)網(wǎng)絡(luò)模型,使計(jì)算機(jī)能夠
    的頭像 發(fā)表于 07-08 10:27 ?799次閱讀

    個(gè)暑假如何學(xué)習(xí)單片機(jī)

    個(gè)暑假是學(xué)習(xí)和掌握單片機(jī)基礎(chǔ)知識(shí)的良好時(shí)機(jī)。以下是個(gè)關(guān)于如何在暑假期間學(xué)習(xí)單片機(jī)的建議計(jì)劃
    的頭像 發(fā)表于 07-03 09:19 ?551次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>暑假如何<b class='flag-5'>學(xué)習(xí)</b>單片機(jī)

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的個(gè)重要分支,其目標(biāo)是通過讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無需進(jìn)行明確的編程。本文將深入解讀幾種常見的
    的頭像 發(fā)表于 07-02 11:25 ?1223次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?1475次閱讀

    機(jī)器學(xué)習(xí)的經(jīng)典算法與應(yīng)用

    關(guān)于數(shù)據(jù)機(jī)器學(xué)習(xí)就是喂入算法和數(shù)據(jù),讓算法從數(shù)據(jù)中尋找種相應(yīng)的關(guān)系。Iris鳶尾花數(shù)據(jù)集是個(gè)經(jīng)典數(shù)據(jù)集,在統(tǒng)計(jì)
    的頭像 發(fā)表于 06-27 08:27 ?1696次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的經(jīng)典算法與應(yīng)用

    請(qǐng)問PSoC? Creator IDE可以支持IMAGIMOB機(jī)器學(xué)習(xí)嗎?

    。 我發(fā)現(xiàn)IMAGIMOB 是個(gè)很好的解決方案來滿足我的需求,但現(xiàn)在的問題是, PSoC? Creator 不支持 IMAGIMOB! PSoC? Creator 可以支持機(jī)器學(xué)習(xí)
    發(fā)表于 05-20 08:06

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    ,人工智能已成為個(gè)熱門領(lǐng)域,涉及到多個(gè)行業(yè)和領(lǐng)域,例如語音識(shí)別、機(jī)器翻譯、圖像識(shí)別等。 在編程中進(jìn)行人工智能的關(guān)鍵是使用機(jī)器學(xué)習(xí)算法,這是
    的頭像 發(fā)表于 04-04 08:41 ?354次閱讀