電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>Agouti智能防風(fēng)雨的聲學(xué)監(jiān)測(cè)設(shè)備

Agouti智能防風(fēng)雨的聲學(xué)監(jiān)測(cè)設(shè)備

2022-10-20 | zip | 0.55 MB | 次下載 | 免費(fèi)

資料介紹

描述

?

動(dòng)機(jī)與背景

傳統(tǒng)的基于視覺的野生動(dòng)物監(jiān)測(cè)方法受到天氣條件、相機(jī)的視野、目標(biāo)生物的大小及其接近程度的限制。可以通過其他渠道更可靠地監(jiān)測(cè)野生動(dòng)物的替代技術(shù)有很大的空間:如聲學(xué)監(jiān)測(cè)。

聲學(xué)監(jiān)測(cè)為監(jiān)測(cè)野生動(dòng)物提供了一種可靠、低成本且可擴(kuò)展的替代方案,并具有檢測(cè)有害人類活動(dòng)的額外好處:雖然偷獵和伐木可能無法看到,但它們更容易聽到。

當(dāng)然,聲學(xué)監(jiān)測(cè)并不是一個(gè)新概念。但是,大多數(shù)產(chǎn)品只記錄;他們不分析。這會(huì)產(chǎn)生大量原始數(shù)據(jù),超出研究人員單獨(dú)分析的人力。目前,保護(hù)組織經(jīng)常求助于大型科技公司來處理他們的原始數(shù)據(jù)。這不僅使保護(hù)主義者處于被動(dòng)狀態(tài),將重點(diǎn)放在歷史數(shù)據(jù)上,而且還為小規(guī)模的地方保護(hù)工作構(gòu)成了重大障礙。此外,這也阻礙了聲學(xué)監(jiān)測(cè)系統(tǒng)充當(dāng)警報(bào)的潛力。

Agouti:我們的產(chǎn)品

鑒于這些考慮,Agouti 是一款智能、防風(fēng)雨的聲學(xué)監(jiān)測(cè)設(shè)備,可以輕松部署用于音頻數(shù)據(jù)的記錄和分析。

我們使用 edgeML 來自動(dòng)標(biāo)記關(guān)鍵事件類的麥克風(fēng)數(shù)據(jù),例如昆蟲聲音和鳥鳴、人類活動(dòng)(例如車輛)和日志記錄(例如電鋸噪音),并將這些標(biāo)簽與其各自的音頻一起存儲(chǔ)以供人工檢查。我們還記錄溫度、濕度和光傳感器的讀數(shù),以將音頻與現(xiàn)實(shí)世界聯(lián)系起來,準(zhǔn)確量化環(huán)境如何影響物種的行為。

Agouti 廣泛涉及“挑戰(zhàn) 2:野生動(dòng)物/生物多樣性保護(hù)”。具體來說,我們同時(shí)解決兩個(gè)問題:

  • 對(duì)瀕臨滅絕的野生動(dòng)物進(jìn)行非侵入式監(jiān)控:我們的聲學(xué)記錄系統(tǒng)會(huì)定期對(duì)其周圍的音景進(jìn)行 5 秒的錄音,然后對(duì)其進(jìn)行分析并與音頻一起存儲(chǔ)。
  • 人類與野生動(dòng)物沖突預(yù)防/緩解:通過檢查音頻中的可疑活動(dòng)聲音(如伐木或運(yùn)輸噪音),我們可以檢測(cè)對(duì)環(huán)境有害的非法活動(dòng)。

簡(jiǎn)而言之,刺豚鼠

pYYBAGNQkf2AHxdaAAQyoO-gOWo177.png
?

因此,如上所示,Agouti 使用 Wio 終端來收集數(shù)據(jù)和顯示預(yù)測(cè),而 Raspberry Pi 用于處理和存儲(chǔ)數(shù)據(jù)。我們決定使用 Raspberry Pi 有兩個(gè)原因

1. 我們嘗試的一些更簡(jiǎn)單的模型根本無法以合理的準(zhǔn)確度進(jìn)行音頻分析。所以我們不得不使用一個(gè)太大而無法在 Wio 上運(yùn)行或運(yùn)行的 AI 模型,但又足夠小以適應(yīng) RPi。

2. RPi 可以寫入容量遠(yuǎn)大于 Wio 16GB SD 卡槽的 USB 存儲(chǔ)設(shè)備。

現(xiàn)在,讓我們來看看我們是如何創(chuàng)建 Agouti 的。此處引用的所有代碼和其他支持文件都可以在我們的GitHub存儲(chǔ)庫(kù)中訪問,其中包含設(shè)置我們系統(tǒng)每個(gè)部分的詳細(xì)說明。

第 1 部分:人工智能訓(xùn)練

這是最難的一點(diǎn)。我們嘗試了許多各種規(guī)模的模型架構(gòu),最終我們堅(jiān)持的方法是遷移學(xué)習(xí)。與訓(xùn)練新模型相反,遷移學(xué)習(xí)顯著減少了所需的訓(xùn)練時(shí)間和資源。通過利用預(yù)訓(xùn)練模型的高級(jí)模型架構(gòu),它還可以提高準(zhǔn)確性。

對(duì)于我們的訓(xùn)練,我們使用了谷歌的預(yù)訓(xùn)練模型YAMNet YAMNet 分析輸入音頻數(shù)據(jù)的 Mel Spectrogram,這是一個(gè)根據(jù)人類聽覺對(duì)不同頻率的敏感度有偏差的頻譜圖。它是一個(gè)主要由卷積層組成的模型,在 Google 的 AudioSet 數(shù)據(jù)集上進(jìn)行訓(xùn)練,并輸出對(duì)應(yīng)于 521 個(gè)預(yù)定義類中的每一個(gè)的分?jǐn)?shù)數(shù)組。

然后我們選擇了另一個(gè)數(shù)據(jù)集ESC-50 ,它主要包含環(huán)境噪聲,因此更適合我們的目的。這里的音頻數(shù)據(jù)為 5s 16khz。YAMNet 從音頻生成嵌入,我們?cè)谶@些嵌入上訓(xùn)練最終分類器。因?yàn)?YAMNet 將音頻數(shù)據(jù)切成 0.96 秒的幀,所以我們 5 秒的記錄產(chǎn)生了一個(gè)嵌入數(shù)組。為了解決這個(gè)問題,我們采用了一個(gè) 128 單元的 LSTM 模型,該模型對(duì)這個(gè)數(shù)據(jù)數(shù)組進(jìn)行循環(huán)操作。

為了進(jìn)一步提高我們模型的魯棒性,我們添加了音頻增強(qiáng):時(shí)間軸的拉伸/壓縮、頻率調(diào)制、隨機(jī)噪聲的混合、諧波失真等。這不可避免地會(huì)降低訓(xùn)練時(shí)的準(zhǔn)確性,但會(huì)在訓(xùn)練中獲得更好的性能應(yīng)用。

為了使模型的最終預(yù)測(cè)更加直觀,我們還創(chuàng)建了模型混合內(nèi)容的混淆矩陣。如下所示:

pYYBAGNQkgCABnunAAC9MQrAaD8833.png
所以,它做得很好(我們計(jì)劃改進(jìn)大約 60% 的驗(yàn)證準(zhǔn)確度)
?

一旦最終的分類器層被訓(xùn)練出來,我們就對(duì)其進(jìn)行量化并將其轉(zhuǎn)化為可以在 Pi 上輕松運(yùn)行的 TFlite 模型。

您可以在此處使用我們?cè)?Google Colab 上的實(shí)際實(shí)現(xiàn)。

以下是人工智能分析 YouTube 音頻的一些片段:

?

第 2 部分:Wio + RPi 串行

我們非常感謝 Seeed Studios 為我們提供免費(fèi)的 SenseCAP K1100 傳感器原型套件。我們使用 Wio 終端從其內(nèi)置的光傳感器和 microhpone 以及附加的 Grove SHT40 溫度和濕度傳感器中獲取讀數(shù)。

您會(huì)記得,Wio 終端負(fù)責(zé)所有傳感器數(shù)據(jù)并通過其麥克風(fēng)記錄音頻,而 Raspberry Pi 運(yùn)行大型 AI 聲學(xué)模型(太大而無法安裝在 Wio 上)并使數(shù)據(jù)能夠存儲(chǔ)到 USB具有大存儲(chǔ)空間的驅(qū)動(dòng)器。兩者之間的通信是通過串口實(shí)現(xiàn)的:

  • Raspberry Pi 在啟動(dòng)時(shí)向 Wio 發(fā)送命令
  • Wio 抓取傳感器數(shù)據(jù)并記錄 16k 幀音頻數(shù)據(jù),然后將其發(fā)送回 Pi。然后 Pi 做了一些事情:
  • Pi 測(cè)量 Wio 獲取音頻數(shù)據(jù)所需的時(shí)間,自動(dòng)校準(zhǔn)每幀之間的延遲,以便 Wio 每秒準(zhǔn)確返回 16000 幀。
  • Pi 將原始音頻數(shù)據(jù)轉(zhuǎn)換為介于 -1 和 1 之間的 numpy 數(shù)組,然后將其傳遞給 YAMNet 以提取 YAMNet 預(yù)測(cè)和嵌入
  • 然后將 YAMNet 嵌入通過我們的自定義模型傳遞以提取更高級(jí)別的音頻信息
  • 來自 YAMNet 和我們的自定義模型的預(yù)測(cè)結(jié)合起來給出最終的音頻標(biāo)簽
  • 如果自上次存儲(chǔ)音頻以來已經(jīng)過去了足夠長(zhǎng)的時(shí)間,或者如果音頻被標(biāo)記為危險(xiǎn),則 Pi 將音頻數(shù)據(jù)及其預(yù)測(cè)標(biāo)簽(作為 JSON)一起寫入 USB
  • Pi 將預(yù)測(cè)的音頻標(biāo)簽和校準(zhǔn)的延遲時(shí)間發(fā)送回 Wio
  • Wio 顯示預(yù)測(cè)的音頻標(biāo)簽,再次記錄音頻數(shù)據(jù)(這次使用新的延遲值),然后循環(huán)繼續(xù)

同樣,我們的 GitHub 存儲(chǔ)庫(kù)中提供了設(shè)置RPi和 Wio 的完整說明。

第 3 部分:外殼

為了保護(hù)硬件免受外部環(huán)境的破壞,我們?cè)?Onshape 上設(shè)計(jì)了一個(gè)防水外殼,使用 3mm 透明亞克力板,使用激光切割機(jī)成型。

我們決定使用亞克力板,因?yàn)樗鼈兡陀们抑亓枯p,并且具有易于激光切割的額外好處。外殼也是完全透明的,以確保屏幕可見。此外,外殼設(shè)計(jì)中包含一個(gè)小窗口,用于將溫度和濕度傳感器(位于外部)連接到 Wio(位于內(nèi)部)。保護(hù)殼的所有底座部分均采用指接設(shè)計(jì),具有很強(qiáng)的穩(wěn)定性和強(qiáng)度,并最大限度地提高了用于連接和形成整個(gè)盒子的丙烯酸水泥的粘合性。

而且……我們做到了!

?
?
?
pYYBAGNQkgWAZVu6AAeGyHKgcds826.jpg
?
1 / 3 ? Agouti 包裝在亞克力外殼內(nèi)
?

最終產(chǎn)品

這是一段 Agouti 在行動(dòng)中的視頻,它用背景中的飛機(jī)檢測(cè)人類噪音:

?

下面是鏈接到音頻文件的 JSON 文件的示例:

{
    "category": "chainsaw", # Final audio tag
    "class": "sawing",      # Big class that tag falls into
    "humidity": 51.6,       # Humidity value
    "light": 170,           # Light sensor value
    "original": "chainsaw", # Prediction from our model
    "temperature": 20.09,   # Temperature value
    "yamnet": [             # YAMNet prediction at each frame
        "Engine",
        "Breathing",
        "Vehicle",
        "Vehicle",
        "Vehicle",
        "Vehicle",
        "Frying (food)",
        "Breathing",
        "Rattle",
        "Engine"
    ]
}

并且...所有音頻文件都已正確存儲(chǔ)到 USB 上:

poYBAGNQkgqAaphmAAnVK1x0eJE500.jpg
USB 上有什么
?

未來的改進(jìn)

未來,我們?cè)O(shè)想進(jìn)行以下更改以改進(jìn) Agouti:

  • 支持通過 LoRaWan 發(fā)送分析的音頻標(biāo)簽和傳感器數(shù)據(jù),因此可以立即刷新數(shù)據(jù)和警告(我們確實(shí)有準(zhǔn)備好通過 Lora 將傳感器數(shù)據(jù)發(fā)送到 Helium 的代碼,但連接存在問題,可能與 Lora 覆蓋有關(guān))
  • 太陽能電池板可實(shí)現(xiàn)更長(zhǎng)時(shí)間的連續(xù)運(yùn)行
  • 使移植的 ML 模型更準(zhǔn)確,并且能夠識(shí)別更多的音頻類
  • 使用更好的麥克風(fēng)并以更高的速率采樣

學(xué)分

感謝我來自 Team Enigma 的其他 3 位隊(duì)友,他們參與了這個(gè)項(xiàng)目的開發(fā):

Dylan Kainth主要用于處理硬件的 Wio 方面,建議使用 Pi 以及許多其他事情

Alex Yi主要用于幫助人工智能,研究不同的算法,并提出不同的音頻增強(qiáng)

Mark Zeng設(shè)計(jì)了機(jī)箱并對(duì) Edge Impulse 進(jìn)行了一些研究


下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數(shù)據(jù)手冊(cè)
  2. 1.06 MB  |  532次下載  |  免費(fèi)
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費(fèi)
  5. 3TC358743XBG評(píng)估板參考手冊(cè)
  6. 1.36 MB  |  330次下載  |  免費(fèi)
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費(fèi)
  9. 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費(fèi)
  11. 6迪文DGUS開發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費(fèi)
  13. 7元宇宙底層硬件系列報(bào)告
  14. 13.42 MB  |  182次下載  |  免費(fèi)
  15. 8FP5207XR-G1中文應(yīng)用手冊(cè)
  16. 1.09 MB  |  178次下載  |  免費(fèi)

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費(fèi)
  3. 2555集成電路應(yīng)用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費(fèi)
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費(fèi)
  7. 4開關(guān)電源設(shè)計(jì)實(shí)例指南
  8. 未知  |  21549次下載  |  免費(fèi)
  9. 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費(fèi)
  11. 6數(shù)字電路基礎(chǔ)pdf(下載)
  12. 未知  |  13750次下載  |  免費(fèi)
  13. 7電子制作實(shí)例集錦 下載
  14. 未知  |  8113次下載  |  免費(fèi)
  15. 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費(fèi)
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537798次下載  |  免費(fèi)
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費(fèi)
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費(fèi)
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費(fèi)
  11. 6電路仿真軟件multisim 10.0免費(fèi)下載
  12. 340992  |  191187次下載  |  免費(fèi)
  13. 7十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費(fèi)
  15. 8proe5.0野火版下載(中文版免費(fèi)下載)
  16. 未知  |  138040次下載  |  免費(fèi)