0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓音樂更柔和 MIT用AI過濾音源

jmiy_worldofai ? 來源:未知 ? 作者:胡薇 ? 2018-07-11 17:05 ? 次閱讀

一般利用均衡器可以將音樂中的低音部分調(diào)出來,但是麻省理工學(xué)院的計算機科學(xué)和人工智能實驗室(Computer Science and Artificial Intelligence Lab,CSAIL)的研究人員發(fā)現(xiàn)了更好的解決方案。他們所研發(fā)的新系統(tǒng) PixelPlayer,能夠利用人工智能來區(qū)分和過濾聲音,讓音樂聽起來更洪亮或更柔和。

將指定視頻錄入經(jīng)過充分訓(xùn)練的 PixelPlayer,系統(tǒng)隨機能夠過濾伴奏,同時識別音源,接著計算圖像中每個像素的音量,然后通過“空間定位”確定產(chǎn)生相似音波的片段。

今年9月,德國慕尼黑即將舉行歐洲計算機視覺會議(European Conference on Computer Vision),會議中要發(fā)表的一篇新論文則詳細(xì)論述了“像素的聲音(The Sound of Pixels)”。麻省理工學(xué)院計算機科學(xué)和人工智能實驗室的博士生,同時也是這篇論文的合著者 Zhao Hang 同學(xué)表示,“最好的情況就是,我們能識別出哪種樂器發(fā)出怎樣的聲音。”

PixelPlayer 的核心是一種基于樂器組合多模態(tài)訓(xùn)練的神經(jīng)網(wǎng)絡(luò),數(shù)據(jù)集采用了 Youtube 上 714 條未經(jīng)修剪且未經(jīng)標(biāo)記的視頻。其中,總時長為 60 小時的 500 條視頻用于訓(xùn)練,剩余的則用于驗證和測試。在訓(xùn)練過程中,研究人員分別根據(jù)原聲吉他、大提琴、單簧管、長笛和其他樂器向系統(tǒng)饋入了算法。

這只是 PixelPlayer 多重機器學(xué)習(xí)框架的一個部分。經(jīng)過訓(xùn)練后的視頻分析算法將從剪輯幀中提取出視覺特征,這就是系統(tǒng)的第二個神經(jīng)網(wǎng)絡(luò),即音頻分析網(wǎng)絡(luò)。音頻分析網(wǎng)絡(luò)將聲音拆分為片段,并從中提取特征。最后,音頻合成網(wǎng)絡(luò)將把上述兩個網(wǎng)絡(luò)輸出的特定像素和聲波關(guān)聯(lián)起來。

PixelPlayer 進(jìn)行完全自監(jiān)督的學(xué)習(xí),人們無需對數(shù)據(jù)注釋,而且系統(tǒng)目前已經(jīng)能識別 20 種樂器。Zhao Hang 說,較大的數(shù)據(jù)集增強了系統(tǒng)的識別量,但識別樂器子類的能力卻不佳。系統(tǒng)也可以識別音樂元素,例如小提琴的諧波頻率。

研究人員認(rèn)為 PixelPlayer 可以進(jìn)行聲音剪輯,或者幫助機器人理解動物、車輛和其他物體所制造的環(huán)境聲音。他們寫到,“我們希望我們的工作能夠開辟新的研究途徑,從視覺和聽覺信號角度實現(xiàn)聲源分離”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4773

    瀏覽量

    100861
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31025

    瀏覽量

    269363
  • MIT
    MIT
    +關(guān)注

    關(guān)注

    3

    文章

    253

    瀏覽量

    23412

原文標(biāo)題:MIT實現(xiàn)用AI過濾音源 讓音樂更悅耳

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    CAN協(xié)議的軟件過濾和硬件過濾

    CAN過濾是控制器局域網(wǎng)絡(luò)中用于控制哪些消息可以被節(jié)點接收的一種機制。在CAN網(wǎng)絡(luò)中,由于是CAN總線通信,所有節(jié)點都會接收到網(wǎng)絡(luò)上的所有消息。為了提高效率和減少處理無關(guān)數(shù)據(jù)的負(fù)擔(dān),節(jié)點可以配置
    的頭像 發(fā)表于 12-26 19:33 ?128次閱讀
    CAN協(xié)議的軟件<b class='flag-5'>過濾</b>和硬件<b class='flag-5'>過濾</b>

    TPA3110功放一接上音源就保護,為什么?

    TPA3110做的功放板,客戶退了幾個壞板子回來 實測大部分都是左聲道輸入端的耦合電容(1uf)損壞,一接音源就進(jìn)入保護 還有一個是耦合電容正常,但也是一接音源就進(jìn)入保護 還有一個播放
    發(fā)表于 10-24 08:27

    TAS5805M是否支持mono音頻格式的音源?

    1、TAS5805M是否支持mono音頻格式的音源?(TAS5805MEVM播放mono格式的掃頻音源沒有聲音,直接用電腦播放有聲音,示波器量測data有信號) 2、若要使TAS
    發(fā)表于 10-16 06:46

    PCM6360-Q1 MIC輸入的音源如何播放?

    我在調(diào)試EVB的時候如何把MIC入的音源播放出去,目前我是使用示波器觀察的TDM信號,可以通過模擬或者USB的方式把錄入的音源播放出來么?用來確認(rèn)輸入和輸出的音源匹配 謝謝
    發(fā)表于 09-30 08:03

    昆侖萬維發(fā)布全球首個AI流媒體音樂平臺Melodio

    昆侖萬維在科技創(chuàng)新領(lǐng)域再次邁出重要一步,正式推出了全球首個AI流媒體音樂平臺——Melodio,以及配套的AI音樂商用創(chuàng)作平臺Mureka。這兩款創(chuàng)新產(chǎn)品的問世,標(biāo)志著
    的頭像 發(fā)表于 08-14 17:44 ?851次閱讀

    請問蜂鳴器播放音樂的時候如何同時播放兩段音樂?

    PWM 控制的音樂播放,可以按照樂譜播放音符 但現(xiàn)在有個需求,是在播放背景音樂的時候同時疊加一個前景音樂進(jìn)去? 各位有什么好的思路嗎?
    發(fā)表于 06-14 08:23

    音樂大模型掀起AI音樂創(chuàng)作熱潮,AI“一語成歌”成為可能

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著大模型技術(shù)的發(fā)展,AI音樂生成悄然而生。音樂生成是一個結(jié)合了人工智能技術(shù)和音樂創(chuàng)作的領(lǐng)域,它涵蓋了從基本的音頻信號模擬到復(fù)雜的
    的頭像 發(fā)表于 05-30 01:01 ?4054次閱讀

    谷歌推新AI音樂工具,發(fā)布第六代TPU芯片

    谷歌近日宣布與YouTube合作,推出全新音樂工具M(jìn)usic AI Sandbox。這款AI音樂創(chuàng)作工具將與傳統(tǒng)AI
    的頭像 發(fā)表于 05-16 09:44 ?402次閱讀

    智能門鈴音樂芯片,為家的溫馨注入音樂的靈魂

    的輕音樂輕輕響起,那份舒適與愜意瞬間涌上心頭。這就是智能門鈴音樂芯片帶來的個性化音樂設(shè)置體驗,您的家更加符合您的品味與喜好。//02//多樣化的音效選擇更是
    的頭像 發(fā)表于 04-29 08:08 ?402次閱讀
    智能門鈴<b class='flag-5'>音樂</b>芯片,為家的溫馨注入<b class='flag-5'>音樂</b>的靈魂

    全球AI音樂會,第一次聽見中國聲音

    全球AI音樂盛宴中,中國首個音樂AIGC SOTA 的獨特旋律
    的頭像 發(fā)表于 04-19 11:01 ?399次閱讀
    全球<b class='flag-5'>AI</b><b class='flag-5'>音樂</b>會,第一次聽見中國聲音

    一鍵消原音智能AI芯片PTN1118芯片簡介

    PTN1118植入帕特納微AI(SVS),實現(xiàn)將任意音源中人聲部分消除,并在極大程度上保留伴奏,配合PTN 卡拉OK系列芯片,使傳統(tǒng)音頻設(shè)備富娛樂性。 支持模擬與數(shù)字輸入輸出,數(shù)字接口支持從模式 人聲消除深淺度可調(diào)(比如,保留
    發(fā)表于 04-12 17:40

    BGP路由過濾、引入與缺省路由的配置實踐

    第一個 AS-Path進(jìn)行路由過濾 利用 AS-Path 進(jìn)行路由過濾 R3只接收來自AS 100的 做正則表達(dá)式
    發(fā)表于 04-08 10:47 ?1410次閱讀
    BGP路由<b class='flag-5'>過濾</b>、引入與缺省路由的配置實踐

    音頻功放原理:音樂重現(xiàn)原貌

    在音響設(shè)備的世界里,音頻功放器是一個至關(guān)重要的組成部分。它負(fù)責(zé)將輸入的模擬信號轉(zhuǎn)換為足夠的電流,驅(qū)動揚聲器的振動,從而讓我們能夠欣賞到豐富多彩的音樂。那么,音頻功放器是如何實現(xiàn)這一功能的呢?一、音頻
    的頭像 發(fā)表于 03-28 15:57 ?900次閱讀
    音頻功放原理:<b class='flag-5'>讓</b><b class='flag-5'>音樂</b>重現(xiàn)原貌

    AI初創(chuàng)企業(yè)Suno發(fā)布首款音樂AI生成模型SunoV3

    美國人工智能初創(chuàng)企業(yè)Suno近日震撼發(fā)布其首款音樂AI生成模型——SunoV3。這款創(chuàng)新產(chǎn)品已正式登陸其官方網(wǎng)站,并向所有用戶免費開放使用,標(biāo)志著音樂創(chuàng)作領(lǐng)域邁入了全新的智能化時代。
    的頭像 發(fā)表于 03-26 09:17 ?1147次閱讀

    智慧路燈桿AI監(jiān)測應(yīng)用,高速出行安全

    針對更好監(jiān)測和管理高速公路上的交通狀況,可以基于智慧路燈桿打造AI交通監(jiān)測應(yīng)用,通過智能感知高速路段的路況、車況、環(huán)境狀況,實現(xiàn)實時風(fēng)險感知、風(fēng)險預(yù)警和協(xié)同處置,高速出行安全。
    的頭像 發(fā)表于 03-11 17:20 ?458次閱讀
    智慧路燈桿<b class='flag-5'>AI</b>監(jiān)測應(yīng)用,<b class='flag-5'>讓</b>高速出行<b class='flag-5'>更</b>安全