0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python在音頻(Audio)領(lǐng)域中,如何進(jìn)行數(shù)據(jù)擴(kuò)充呢?

機(jī)器學(xué)習(xí)算法與人工智能 ? 來(lái)源:未知 ? 作者:李倩 ? 2018-04-15 10:35 ? 次閱讀

Python音頻的數(shù)據(jù)擴(kuò)充

經(jīng)典的深度學(xué)習(xí)網(wǎng)絡(luò)AlexNet使用數(shù)據(jù)擴(kuò)充(Data Augmentation)的方式擴(kuò)大數(shù)據(jù)集,取得較好的分類效果。在深度學(xué)習(xí)的圖像領(lǐng)域中,通過(guò)平移、 翻轉(zhuǎn)、加噪等方法進(jìn)行數(shù)據(jù)擴(kuò)充。但是,在音頻(Audio)領(lǐng)域中,如何進(jìn)行數(shù)據(jù)擴(kuò)充呢?

音頻的數(shù)據(jù)擴(kuò)充,主要有以下四種方式:

音頻剪裁(Clip)

音頻旋轉(zhuǎn)(Roll)

音頻調(diào)音(Tune)

音頻加噪(Noise)

音頻解析基于librosa音頻庫(kù);矩陣操作基于scipy和numpy科學(xué)計(jì)算庫(kù)。

以下是Python的實(shí)現(xiàn)方式

01

音頻剪裁

import librosa

from scipy.io import wavfile y, sr = librosa.load("../data/love_illusion.mp3")

# 讀取音頻print y.shape, sr wavfile.write("../data/love_illusion_20s.mp3", sr, y[20 * sr:40 * sr])

# 寫入音頻

02

音頻旋轉(zhuǎn)

import cv2

import librosa

from scipy.io import wavfile y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")

# 讀取音頻ly = len(y) y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze() lc = len(y_tune) - ly y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, sr wavfile.write("../data/raw/xxx_tune.mp3", sr, y_tune)

# 寫入音頻

03

音頻調(diào)音

import cv2

import librosa

from scipy.io import wavfile y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")

# 讀取音頻ly = len(y) y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze() lc = len(y_tune) - ly y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, sr wavfile.write("../data/raw/xxx_tune.mp3", sr, y_tune)

# 寫入音頻

04

音頻加噪

import librosa

from scipy.io import wavfile

import numpy as np

y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")

# 讀取音頻wn = np.random.randn(len(y)) y = np.where(y != 0.0, y + 0.02 * wn, 0.0)

# 噪聲不要添加到0上!print y.shape, sr wavfile.write("../data/raw/love_illusion_20s_w.mp3", sr, y)

# 寫入音頻

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 音頻
    +關(guān)注

    關(guān)注

    29

    文章

    3029

    瀏覽量

    83161
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4825

    瀏覽量

    86382

原文標(biāo)題:Python音頻的數(shù)據(jù)擴(kuò)充

文章出處:【微信號(hào):machinelearningai,微信公眾號(hào):機(jī)器學(xué)習(xí)算法與人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    labview中如何進(jìn)行數(shù)據(jù)存儲(chǔ)?

    labview中如何進(jìn)行數(shù)據(jù)存儲(chǔ)?
    發(fā)表于 07-26 09:19

    請(qǐng)問(wèn)問(wèn)手機(jī)與電腦之間沒(méi)有網(wǎng)絡(luò)的情況下如何進(jìn)行數(shù)據(jù)傳輸!

    請(qǐng)問(wèn)問(wèn)手機(jī)與電腦之間沒(méi)有網(wǎng)絡(luò)的情況下如何進(jìn)行數(shù)據(jù)傳輸!
    發(fā)表于 05-31 21:15

    HX711如何進(jìn)行數(shù)據(jù)處理?

    HX711如何進(jìn)行數(shù)據(jù)處理?
    發(fā)表于 11-21 22:03

    利用Python進(jìn)行數(shù)據(jù)分析之時(shí)間序列基礎(chǔ)

    《利用Python進(jìn)行數(shù)據(jù)分析》 112時(shí)間序列基礎(chǔ)
    發(fā)表于 03-20 09:30

    如何利用Python進(jìn)行數(shù)據(jù)分析

    《利用Python進(jìn)行數(shù)據(jù)分析》 122高階GroupBy應(yīng)用
    發(fā)表于 04-23 07:29

    何進(jìn)行數(shù)字信號(hào)處理?有哪幾個(gè)基本步驟

    數(shù)字信號(hào)處理是如何定義的?如何進(jìn)行數(shù)字信號(hào)處理?有哪幾個(gè)基本步驟?
    發(fā)表于 06-22 06:46

    串口通信中外設(shè)與開(kāi)發(fā)板串口通信是如何進(jìn)行數(shù)據(jù)傳輸?shù)模?/a>

    串口通信中外設(shè)與開(kāi)發(fā)板串口通信是如何進(jìn)行數(shù)據(jù)傳輸?shù)模?b class='flag-5'>在使用外設(shè)時(shí)怎樣將外設(shè)的數(shù)據(jù)返回給開(kāi)發(fā)板?
    發(fā)表于 07-07 07:58

    STM32 USART串口是如何進(jìn)行數(shù)據(jù)處理的

    STM32 USART串口接收數(shù)據(jù)的具體步驟有哪些?STM32 USART串口是如何進(jìn)行數(shù)據(jù)處理的
    發(fā)表于 11-25 08:56

    PC機(jī)的串口調(diào)試助手與STM32是如何進(jìn)行數(shù)據(jù)收發(fā)的

    怎樣通過(guò)PC機(jī)的串口調(diào)試助手將數(shù)據(jù)發(fā)送至STM32?PC機(jī)的串口調(diào)試助手與STM32是如何進(jìn)行數(shù)據(jù)收發(fā)的?
    發(fā)表于 12-09 07:17

    什么是信號(hào)處理?如何進(jìn)行數(shù)字信號(hào)處理?

    什么是信號(hào)處理?如何進(jìn)行數(shù)字信號(hào)處理? 我們的周圍存在著為數(shù)眾多的"信號(hào)"。如:從茫茫宇宙中的天體發(fā)出的微弱電波信號(hào),移動(dòng)電話發(fā)出
    發(fā)表于 03-06 10:13 ?3476次閱讀

    Python信息安全領(lǐng)域中的運(yùn)用

    Python信息安全領(lǐng)域中的運(yùn)用
    發(fā)表于 09-07 09:51 ?27次下載
    <b class='flag-5'>Python</b><b class='flag-5'>在</b>信息安全<b class='flag-5'>領(lǐng)域中</b>的運(yùn)用

    數(shù)據(jù)庫(kù)教程之如何進(jìn)行數(shù)據(jù)庫(kù)設(shè)計(jì)

    本文檔的主要內(nèi)容詳細(xì)介紹的是數(shù)據(jù)庫(kù)教程之如何進(jìn)行數(shù)據(jù)庫(kù)設(shè)計(jì)內(nèi)容包括了:1 數(shù)據(jù)庫(kù)設(shè)計(jì)概述 ,2 數(shù)據(jù)庫(kù)需求分析 ,3 數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì) ,4
    發(fā)表于 10-19 10:41 ?21次下載
    <b class='flag-5'>數(shù)據(jù)</b>庫(kù)教程之如<b class='flag-5'>何進(jìn)行數(shù)據(jù)</b>庫(kù)設(shè)計(jì)

    風(fēng)格遷移中如何進(jìn)行數(shù)據(jù)增強(qiáng)

    這是一篇關(guān)于風(fēng)格遷移中如何進(jìn)行數(shù)據(jù)增強(qiáng)的論文。introduction部分,informal--formal 的風(fēng)格遷移問(wèn)題,最大的障礙是訓(xùn)練數(shù)據(jù)的不足。為了解決此問(wèn)題,本篇論文提出三種數(shù)據(jù)
    的頭像 發(fā)表于 01-13 09:41 ?2785次閱讀

    藍(lán)牙m(xù)idi和藍(lán)牙音頻或者藍(lán)牙audio有什么區(qū)別

    、什么是藍(lán)牙m(xù)idi,這個(gè)一般問(wèn)這個(gè)問(wèn)題的人,基本都懂,藍(lán)牙m(xù)idi實(shí)際就是標(biāo)準(zhǔn)midi協(xié)議的基礎(chǔ)上擴(kuò)充為無(wú)線連接而已,原先的midi是靠usb傳輸,現(xiàn)在換成藍(lán)牙 3、什么是藍(lán)牙audio,這個(gè)就更簡(jiǎn)單了,藍(lán)牙音箱或者藍(lán)牙耳
    的頭像 發(fā)表于 01-09 15:22 ?1560次閱讀
    藍(lán)牙m(xù)idi和藍(lán)牙<b class='flag-5'>音頻</b>或者藍(lán)牙<b class='flag-5'>audio</b>有什么區(qū)別<b class='flag-5'>呢</b>

    e絡(luò)盟大幅擴(kuò)充PUI Audio產(chǎn)品系列以強(qiáng)化音頻產(chǎn)品組合

    安富利旗下全球電子元器件產(chǎn)品與解決方案分銷商e絡(luò)盟大幅擴(kuò)充了 PUI Audio產(chǎn)品種類。作為音頻、觸覺(jué)反饋及傳感器解決方案領(lǐng)域的全球創(chuàng)新者和供應(yīng)商,PUI
    的頭像 發(fā)表于 02-18 16:29 ?487次閱讀
    e絡(luò)盟大幅<b class='flag-5'>擴(kuò)充</b>PUI <b class='flag-5'>Audio</b>產(chǎn)品系列以強(qiáng)化<b class='flag-5'>音頻</b>產(chǎn)品組合

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品