世界上的樂器種類繁多,但這還不夠。谷歌開發(fā)了一種名為NSynth Super的合成器,利用機器學(xué)習(xí)能夠造出獨一無二的新聲音。今天谷歌將這一工具的代碼開源,看看這個奇妙的“玩具”到底能變出什么花樣吧。
什么是NSynth Super?
NSynth Super是谷歌研究項目Magenta正在進(jìn)行的實驗中的一部分,該項目的目的是探索機器學(xué)習(xí)如何幫助藝術(shù)家一新方式創(chuàng)作藝術(shù)和音樂。
科技在創(chuàng)造新聲音方面一直發(fā)揮著重要作用——從聲音的扭曲到合成電音。今天,機器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的進(jìn)步為聲音的創(chuàng)作提供了新可能。
在過去研究的基礎(chǔ)上,Magenta創(chuàng)造了NSynth(神經(jīng)合成器)。這是一種機器學(xué)習(xí)算法,利用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)聲音的特征,然后根據(jù)這些特征創(chuàng)造出完全新的聲音。
相比于簡單的將聲音組合起來,NSynth利用原聲音的音色重新合成了全新的聲音,所以你可以聽到一半是笛子一半是西塔琴的聲音。
自從NSynth發(fā)布后,Magenta就不斷嘗試開發(fā)不同的音樂交互工具,想讓NSynth算法更容易上手。作為探索的一部分,Magenta與谷歌創(chuàng)意實驗室(Google Creative Lab)合作,創(chuàng)造出了NSynth Super。這是一款開源的實驗性工具,音樂家能通過里面默認(rèn)的4種原始聲音生成全新的聲音?,F(xiàn)在這款產(chǎn)品的原型正在音樂人圈子里進(jìn)行小范圍的實驗,評估他們使用的感受。
NSynth Super是如何工作的?
在這個實驗中,音樂家們在錄音室里錄制了跨15個音的16種原始聲音源,然后將其輸入到NSynth算法中,用算法生成新的聲音。然后將生成的超過10萬種新的聲音加載到產(chǎn)品原型中。
每個旋鈕代表四種不同的源聲音,音樂家能通過控制旋鈕選擇不同音色,然后手指在觸摸屏上滑動,將這四種聲音結(jié)合起來。
NSynth Super可以通過任何MIDI源播放,例如DAW,音序器或者鍵盤。
NSynth算法是如何工作的?
根據(jù)個人水平、風(fēng)格不同,NSynth利用深度神經(jīng)網(wǎng)絡(luò)生成不同的聲音。NSynth直接從數(shù)據(jù)中學(xué)習(xí),可以讓藝術(shù)家直接控制音色和節(jié)湊,并能夠手動探索創(chuàng)造新的聲音。
NSynth是一種算法,可以結(jié)合現(xiàn)有聲音的特征來生成新的聲音。為此,該算法將不同的聲音作為輸入。
使用自動編碼器,它可以從每個輸入中提取16個時間特征。然后將這些特征線性插入創(chuàng)建新的嵌入(每個聲音的數(shù)學(xué)表示)。然后將這些新的嵌入解碼成新的聲音,這些聲音具有兩個輸入的聲音質(zhì)量。
完整地介紹可以參見Magenta的博客,數(shù)據(jù)集合算法可以在原論文中找到。
如何才能得到NSynth Super?
觸摸屏可發(fā)現(xiàn)新聲音
音色選擇鈕
音色調(diào)整鈕
和Magenta其他項目一樣,NSynth Super建立在開源庫之上,例如TensorFlow和openFrameworks,目的是讓更多的藝術(shù)家、編程者和研究者體驗這一創(chuàng)造性的過程。NSynth Super的開源版本包含所有開源代碼、簡圖和設(shè)計模板,都可以在GitHub上下載。
-
合成器
+關(guān)注
關(guān)注
0文章
273瀏覽量
25400 -
谷歌
+關(guān)注
關(guān)注
27文章
6176瀏覽量
105678
原文標(biāo)題:用機器學(xué)習(xí)創(chuàng)造獨特聲音,谷歌開源NSynth Super
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論