0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

邊緣的超低功耗關(guān)鍵短語檢測

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Hussein Osman ? 2022-12-01 15:20 ? 次閱讀

語音在與智能手機(jī)、平板電腦和個(gè)人輔助系統(tǒng)交互中的廣泛使用,使語音作為其他技術(shù)的首選HMI(人機(jī)界面)的使用迅速起步。例如,在當(dāng)今的智能家居中,用戶可以要求Alexa打開或關(guān)閉燈,鎖門和調(diào)節(jié)恒溫器。隨著這項(xiàng)技術(shù)變得越來越普遍,對(duì)使用高精度、緊湊和節(jié)能的基于神經(jīng)網(wǎng)絡(luò)的關(guān)鍵短語檢測解決方案來增加人與機(jī)器之間交互的技術(shù)解決方案的需求正在增加。與需要網(wǎng)絡(luò)連接的云連接神經(jīng)網(wǎng)絡(luò) (NN) 關(guān)鍵短語檢測實(shí)現(xiàn)不同,基于邊緣的解決方案在邊緣執(zhí)行所有計(jì)算,不會(huì)記錄或?qū)?shù)據(jù)傳輸?shù)皆啤?/p>

本文將介紹一種專為網(wǎng)絡(luò)邊緣設(shè)計(jì)的基于 NN 的關(guān)鍵短語檢測解決方案。這些二值化型號(hào)可在低功耗UltraPlus? FPGA上運(yùn)行。本文將討論當(dāng)使用包含嘈雜背景(如音樂或聊天噪音)的數(shù)據(jù)集訓(xùn)練 NN 時(shí),如何在嘈雜環(huán)境中使用關(guān)鍵短語檢測。在這種情況下,神經(jīng)網(wǎng)絡(luò)使用公共數(shù)據(jù)集進(jìn)行訓(xùn)練,以檢測單詞“七”。關(guān)鍵短語檢測可用于廣泛的應(yīng)用,而無需個(gè)人助理設(shè)備。可能的應(yīng)用包括智能燈開關(guān)、智能電視和 AVR,通過音量增大和減小等命令管理設(shè)備。

一、引言

長期以來,使用語音命令來控制人機(jī)界面(HMI)一直是系統(tǒng)設(shè)計(jì)人員的目標(biāo)??勺匪莸?0世紀(jì)中葉的流行科幻電視節(jié)目和電影,如“星際迷航”和“星球大戰(zhàn)”,給了我們一個(gè)語音世界可能是什么樣子的暗示。但是,為現(xiàn)實(shí)生活中的消費(fèi)應(yīng)用開發(fā)低成本、高能效的解決方案已被證明是難以捉摸的。

然而,在過去幾年中,亞馬遜的Alexa和蘋果的Siri等流行的AI應(yīng)用程序的出現(xiàn)以及它們將語音命令轉(zhuǎn)換為系統(tǒng)操作的能力加速了向基于語音的HMI的遷移。這些快速發(fā)展為越來越多的智能家居解決方案打開了大門,這些解決方案依賴于關(guān)鍵短語檢測。今天,用戶可以要求Alexa通過互聯(lián)網(wǎng)訂購產(chǎn)品,打開燈,鎖門,設(shè)置家庭恒溫器,甚至給草澆水。

通常,這些支持語音的HMI執(zhí)行識(shí)別云中的關(guān)鍵短語所需的計(jì)算。在許多情況下,設(shè)計(jì)師將他們的應(yīng)用程序插入預(yù)先存在的基礎(chǔ)設(shè)施中,例如亞馬遜的Alexa。然而,這一發(fā)展戰(zhàn)略面臨一些限制。首先是成本。在云中的服務(wù)器上運(yùn)行關(guān)鍵短語檢測算法的解決方案每次訪問云中的資源時(shí)都必須按分鐘付費(fèi)。此外,構(gòu)建基于云的邊緣解決方案的開發(fā)人員必須支付 NRE 以針對(duì)特定設(shè)備訓(xùn)練他們的解決方案,然后為他們發(fā)布的每個(gè)解決方案支付版稅。將設(shè)計(jì)插入預(yù)先存在的基礎(chǔ)設(shè)施的設(shè)計(jì)人員將看到成本上升,因?yàn)樗麄冝D(zhuǎn)向Wi-Fi模型需要更強(qiáng)大的處理器來獲取數(shù)據(jù),分析數(shù)據(jù),將其發(fā)送到邊緣設(shè)備,并通過Wi-Fi收聽命令。

此外,依賴互聯(lián)網(wǎng)連接會(huì)帶來額外的風(fēng)險(xiǎn)。如果連接斷開,使用互聯(lián)網(wǎng)連接將數(shù)據(jù)傳輸?shù)皆瓶赡軙?huì)導(dǎo)致服務(wù)中斷。通過互聯(lián)網(wǎng)傳輸數(shù)據(jù)也會(huì)帶來潛在的黑客風(fēng)險(xiǎn)。從用戶的角度來看,互聯(lián)網(wǎng)連接為侵犯隱私和安全問題打開了大門。依賴于直接位于設(shè)備上的計(jì)算資源的邊緣解決方案可避免這些潛在問題。

二、新方法

本文探討了一種不同的方法,為位于網(wǎng)絡(luò)邊緣的設(shè)備提供更低成本的關(guān)鍵短語檢測。利用在開發(fā)高精度、緊湊和低成本的二值化神經(jīng)網(wǎng)絡(luò) (NN) 模型方面的進(jìn)步,以及新一代超低功耗現(xiàn)場可編程門陣列 (FPGA) 的改進(jìn),設(shè)計(jì)人員現(xiàn)在可以構(gòu)建關(guān)鍵短語檢測解決方案,在邊緣執(zhí)行所有計(jì)算,從而消除與云連接 NN 關(guān)鍵短語檢測實(shí)現(xiàn)相關(guān)的連接、安全和隱私問題。

通過在本地執(zhí)行關(guān)鍵短語檢測,與基于云的解決方案相比,此設(shè)計(jì)策略可顯著節(jié)省成本。它也不依賴其他生態(tài)系統(tǒng)來運(yùn)作。如果在基于云的解決方案中互聯(lián)網(wǎng)連接失敗,系統(tǒng)將失敗?;谶吘壍谋镜亟鉀Q方案不會(huì)冒此風(fēng)險(xiǎn)。安全和隱私問題不是威脅。本地解決方案更易于用戶設(shè)置和運(yùn)行。最后,使用萊迪思的超低功耗iCE40 Ultra Plus FPGA,這種方法為設(shè)計(jì)人員節(jié)省了大量功耗,這是電池供電設(shè)備的一個(gè)重要考慮因素。例如,本演示文稿中描述的解決方案僅消耗7 mW。

將經(jīng)濟(jì)實(shí)惠的智能家居應(yīng)用推向邊緣的一個(gè)關(guān)鍵步驟是開發(fā)能夠在低密度、低功耗 FPGA 上運(yùn)行的二值化神經(jīng)網(wǎng)絡(luò)模型。在云中使用浮點(diǎn)計(jì)算的深度學(xué)習(xí)技術(shù)對(duì)于邊緣的消費(fèi)者應(yīng)用程序是不切實(shí)際的。相反,設(shè)計(jì)人員必須開發(fā)計(jì)算效率高的解決方案,既要滿足精度目標(biāo),又要符合消費(fèi)市場的成本、尺寸和功耗限制。因此,在邊緣操作的設(shè)計(jì)人員必須使用使用盡可能少位的數(shù)學(xué)運(yùn)算。

設(shè)計(jì)人員可以簡化計(jì)算的一種方法是從浮點(diǎn)切換到定點(diǎn)甚至基本整數(shù)。通過補(bǔ)償浮點(diǎn)到定點(diǎn)整數(shù)的量化,使用二值化 NN 的設(shè)計(jì)人員可以開發(fā)訓(xùn)練速度更快、精度更高的解決方案,并將定點(diǎn)、低精度整數(shù) NN 的性能提高到接近浮點(diǎn)版本的水平。要構(gòu)建簡單的邊緣設(shè)備,訓(xùn)練必須創(chuàng)建具有 1 位權(quán)重的 NN 模型。這些模型被稱為二值化神經(jīng)網(wǎng)絡(luò)(BNN)。

通過使用 1 位值而不是更大的數(shù)字,BNN 可以消除乘法和除法的使用。這允許使用 XOR 和彈出計(jì)數(shù)計(jì)算卷積,從而節(jié)省大量成本并節(jié)省高達(dá) 16 倍的功耗。借助當(dāng)今的 FPGA,設(shè)計(jì)人員擁有一個(gè)高度靈活的平臺(tái),可提供所需的所有存儲(chǔ)器、邏輯和 DSP 資源。

三、NN實(shí)施

下面的討論描述了一個(gè)關(guān)鍵短語檢測解決方案的示例,該解決方案專為邊緣應(yīng)用而設(shè)計(jì),并在具有BNN軟核的iCE40 UltraPlus FPGA中實(shí)現(xiàn)。在正常工作期間,關(guān)鍵短語檢測實(shí)現(xiàn)在功耗低于1mW的情況下偵聽聲音。一旦系統(tǒng)檢測到聲音,它就會(huì)激活 1 秒的緩沖并調(diào)用 BNN。BNN直接在原始輸入上運(yùn)行,而不是在傳統(tǒng)的頻譜圖和MFCC預(yù)處理上操作。代表 1 秒音頻的 16K 原始樣本通過重疊的一維卷積層,變成 30 張 32x32x3 圖像,每張代表 10 毫秒的音頻樣本。然后將輸出傳遞到主 BNN 進(jìn)行處理。

pYYBAGOIVbiABOugAAH9d3D5Tdk766.png

BNN 有四層深,每層執(zhí)行如下所示的功能:

files-aHViPTYzODY3JmNtZD1pdGVtZWRpdG9yaW1hZ2UmZmlsZW5hbWU9aXRlbWVkaXRvcmltYWdlXzVjODk1NzBiZDFhZDMucG5nJnZlcnNpb249MDAwMCZzaWc9NmRmNzYyZjhhMTMxYTliZWIwNDk2MmEwYzc5NTA5Zjc253D

二進(jìn)制卷積是輸入數(shù)據(jù)和 1 位權(quán)重的 1 位乘法。在這種情況下,乘法被 XOR 函數(shù)取代。批量規(guī)范化和縮放使激活規(guī)范化,并在 BNN 訓(xùn)練階段提供幫助。整流線性單元 (ReLu) 將低于特定閾值的數(shù)據(jù)設(shè)置為 0,高于相同閾值的數(shù)據(jù)設(shè)置為 1。池對(duì)圖像的每個(gè)相鄰像素執(zhí)行,并選擇概率最高的有意義像素。此函數(shù)減少了后續(xù)步驟中所需的計(jì)算量。全連接層通常是最后一層,它占據(jù)了前一層中的每個(gè)神經(jīng)元。它在下一層的神經(jīng)元上也有一定的重量。此函數(shù)通常計(jì)算成本高昂,因此它是作為神經(jīng)元明顯較少的最后一個(gè)操作執(zhí)行的。

BNN使用GPU進(jìn)行訓(xùn)練,并運(yùn)行標(biāo)準(zhǔn)的訓(xùn)練工具,如Café和TensorFlow。使用的訓(xùn)練數(shù)據(jù)集是一個(gè)公共訓(xùn)練集,其中包含 1K+ 人 65,000 個(gè) 30 個(gè)短詞的 1 秒長話語。此階段稱為訓(xùn)練階段。然后,訓(xùn)練工具的輸出通過萊迪思半導(dǎo)體的神經(jīng)網(wǎng)絡(luò)編譯器工具進(jìn)行格式化,以供FPGA設(shè)計(jì)使用。您可以將權(quán)重視為在邊緣硬件上進(jìn)行推理時(shí)使用的關(guān)鍵短語的模板。選擇的關(guān)鍵詞是“七”。

四、制度實(shí)施

為了演示系統(tǒng)的功能,工程師使用了HiMax HM01B0 UPduino擴(kuò)展板和iCE40 UltraPlus FPGA。這是一款低成本的Arduino外形電路板,旨在展示FPGA的功能。該板具有兩個(gè)直接連接到 FPGA 的 I2S 麥克風(fēng)、用于 FPGA 設(shè)計(jì)的外部閃存和權(quán)重激活存儲(chǔ)。它還具有 LED 以指示關(guān)鍵短語的檢測。用戶可以直接對(duì)著麥克風(fēng)講話。檢測到關(guān)鍵短語后,LED 將亮起。

五、性能

在此應(yīng)用中,F(xiàn)PGA設(shè)計(jì)頻率和處理長度可以用功耗來換取。在27MHz時(shí),16K原始樣本相當(dāng)于1秒的音頻處理,可以在25ms內(nèi)處理,同時(shí)消耗7.7mW。當(dāng)頻率降低到13.5MHz時(shí),功耗降至4.2mW,相同的1秒音頻樣本在50ms內(nèi)處理完畢。

關(guān)鍵短語檢測通常必須在嘈雜的環(huán)境中運(yùn)行,而無需添加額外的硬件來消除噪聲和回聲。該實(shí)現(xiàn)通過使用包含噪聲背景的數(shù)據(jù)集訓(xùn)練 NN 來實(shí)現(xiàn)此目標(biāo),而無需定位和波束成形。經(jīng)過訓(xùn)練的 NN 像人類一樣檢測關(guān)鍵字,但也有類似的限制。添加了具有各種隨機(jī)人群噪音水平(咖啡館、會(huì)議等)的數(shù)據(jù)集,并添加了關(guān)鍵詞。使用更高噪聲級(jí)別訓(xùn)練的 NN 對(duì)噪聲的魯棒性更強(qiáng),但需要更響亮的關(guān)鍵短語。

BNN 可以檢測多達(dá) 10 個(gè) 1 秒的關(guān)鍵短語,使其成為通過語音進(jìn)行 HMI 的理想選擇。為了提高檢測精度,采用時(shí)域濾波器僅在發(fā)生連續(xù)檢測時(shí)才報(bào)告關(guān)鍵短語檢測。該設(shè)計(jì)為單個(gè)關(guān)鍵短語提供高達(dá) 99% 的準(zhǔn)確率,為多達(dá) 5 個(gè)關(guān)鍵短語提供高達(dá) 90% 的準(zhǔn)確率。

六、結(jié)語

將 AI 帶到邊緣帶來了幾個(gè)重大挑戰(zhàn)。然而,它也提供了巨大的機(jī)會(huì)。正如該項(xiàng)目所證明的那樣,使用實(shí)施BNN而不是基于云的資源的FPGA將AI構(gòu)建到設(shè)備中可以大大降低硬件成本,同時(shí)加快響應(yīng)時(shí)間。同時(shí),將處理保持在本地可提高安全性并節(jié)省寶貴的帶寬和服務(wù)器使用成本。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    貿(mào)澤電子開售ADI超低功耗MCU

    2025年1月2日起,全球電子元器件和工業(yè)自動(dòng)化產(chǎn)品授權(quán)代理商貿(mào)澤電子(Mouser Electronics)正式推出Analog Devices, Inc.(ADI)的MAX32675C超低功耗
    的頭像 發(fā)表于 01-06 11:12 ?234次閱讀

    大普技術(shù)INS5T8111超低功耗RTC芯片介紹

    的 INS5T8111 超低功耗RTC芯片,以其卓越的性能和創(chuàng)新的設(shè)計(jì),正成為眾多應(yīng)用領(lǐng)域的理想解決方案。 ? 超低功耗,續(xù)航無憂 INS5T8111產(chǎn)品的最大亮點(diǎn)在于其卓越的超低功耗性能。在待機(jī)模式下,該芯片的工作電流僅為18
    的頭像 發(fā)表于 11-29 09:20 ?220次閱讀
    大普技術(shù)INS5T8111<b class='flag-5'>超低功耗</b>RTC芯片介紹

    MAX32675C超低功耗Arm? Cortex?-M4F MCU

    檢測(SEC-DED),確保為要求苛刻的應(yīng)用提供超可靠的代碼執(zhí)行。 *附件:MAX32675C超低功耗Arm? Cortex?-M4F MCU.pdf 模擬前端(AFE)集成有低功耗HART調(diào)制解調(diào)器,可通過
    的頭像 發(fā)表于 11-28 11:50 ?447次閱讀
    MAX32675C<b class='flag-5'>超低功耗</b>Arm? Cortex?-M4F MCU

    stm32低功耗設(shè)計(jì)技巧

    STM32低功耗設(shè)計(jì)是一個(gè)綜合性的工作,需要在硬件設(shè)計(jì)和軟件設(shè)計(jì)兩個(gè)層面進(jìn)行綜合考慮和優(yōu)化。以下是一些關(guān)鍵的STM32低功耗設(shè)計(jì)技巧: 一、硬件設(shè)計(jì)層面 選擇低功耗系列芯片 : STM
    的頭像 發(fā)表于 11-19 15:52 ?624次閱讀

    使用MSP430F2013進(jìn)行超低功耗運(yùn)動(dòng)檢測

    電子發(fā)燒友網(wǎng)站提供《使用MSP430F2013進(jìn)行超低功耗運(yùn)動(dòng)檢測.pdf》資料免費(fèi)下載
    發(fā)表于 10-22 09:29 ?0次下載
    使用MSP430F2013進(jìn)行<b class='flag-5'>超低功耗</b>運(yùn)動(dòng)<b class='flag-5'>檢測</b>

    超低功耗和動(dòng)態(tài)性能的線性電源

    電子發(fā)燒友網(wǎng)站提供《超低功耗和動(dòng)態(tài)性能的線性電源.pdf》資料免費(fèi)下載
    發(fā)表于 09-18 11:22 ?0次下載
    <b class='flag-5'>超低功耗</b>和動(dòng)態(tài)性能的線性電源

    0.1mA!24GHz超低功耗人體存在毫米波雷達(dá)模組

    超低功耗 ,極簡化24GHz一發(fā)一收天線,天線波束窄、分辨率高、頻帶寬、抗干擾力強(qiáng)。 2、可檢測到 微動(dòng)、運(yùn)動(dòng)狀態(tài)和靜止 狀態(tài)下的人體目標(biāo),識(shí)別精準(zhǔn)。 3、超低功耗,持續(xù)工作時(shí)平均電流 0.1mA (1Hz上報(bào)頻率)。 4、提供
    的頭像 發(fā)表于 09-05 10:31 ?410次閱讀
    0.1mA!24GHz<b class='flag-5'>超低功耗</b>人體存在毫米波雷達(dá)模組

    適用于超低功耗低功耗應(yīng)用的獨(dú)特高效隔離式DC/DC轉(zhuǎn)換器

    電子發(fā)燒友網(wǎng)站提供《適用于超低功耗低功耗應(yīng)用的獨(dú)特高效隔離式DC/DC轉(zhuǎn)換器.pdf》資料免費(fèi)下載
    發(fā)表于 08-31 09:41 ?0次下載
    適用于<b class='flag-5'>超低功耗</b>和<b class='flag-5'>低功耗</b>應(yīng)用的獨(dú)特高效隔離式DC/DC轉(zhuǎn)換器

    AFE4900超低功耗、集成式AFE數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《AFE4900超低功耗、集成式AFE數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 07-31 10:48 ?3次下載
    AFE4900<b class='flag-5'>超低功耗</b>、集成式AFE數(shù)據(jù)表

    請(qǐng)問esp32的藍(lán)牙能不能保持超低功耗的監(jiān)聽?

    做一個(gè)低功耗的設(shè)備,需要進(jìn)入深度睡眠,但是有需要空中喚醒,可以用外掛LORA去喚醒esp32。 那么esp32的低功耗藍(lán)牙,能不能像家用的藍(lán)牙溫度計(jì)那樣,手機(jī)app可以隨時(shí)連接,一節(jié)7號(hào)電也可以工作一年多,也相當(dāng)于隨機(jī)連接,還超低功耗
    發(fā)表于 06-18 07:11

    DA16600 超低功耗 Wi-Fi + 藍(lán)牙低功耗模塊開發(fā)套件數(shù)據(jù)手冊(cè)

    電子發(fā)燒友網(wǎng)站提供《DA16600 超低功耗 Wi-Fi + 藍(lán)牙低功耗模塊開發(fā)套件數(shù)據(jù)手冊(cè).rar》資料免費(fèi)下載
    發(fā)表于 05-31 17:51 ?4次下載
    DA16600 <b class='flag-5'>超低功耗</b> Wi-Fi + 藍(lán)牙<b class='flag-5'>低功耗</b>模塊開發(fā)套件數(shù)據(jù)手冊(cè)

    芯品#MAX78002 新型AI MCU,能夠使神經(jīng)網(wǎng)絡(luò)以超低功耗運(yùn)行

    人工智能(AI)需要超強(qiáng)的計(jì)算能力,而Maxim則大大降低了AI計(jì)算所需的功耗。MAX78002是一款新型的AI微控制器,使神經(jīng)網(wǎng)絡(luò)能夠在互聯(lián)網(wǎng)邊緣端以超低功耗運(yùn)行,將高能效的AI處理與經(jīng)過驗(yàn)證
    的頭像 發(fā)表于 05-07 17:47 ?7437次閱讀
    芯品#MAX78002 新型AI MCU,能夠使神經(jīng)網(wǎng)絡(luò)以<b class='flag-5'>超低功耗</b>運(yùn)行

    安信可Rd-03L檢測使用—— 超低功耗實(shí)現(xiàn)人體存在檢測,上位機(jī)配置快速上手

    Rd-03L是安信可雷達(dá)系列的超低功耗人體存在毫米波傳感器,包含極簡化24 GHz雷達(dá)傳感器硬件和低功耗人體存在感應(yīng)智能算法固件。 Rd-03L搭載AloT毫米波傳感器SoC ICL1112、高性能
    的頭像 發(fā)表于 03-29 11:02 ?652次閱讀
    安信可Rd-03L<b class='flag-5'>檢測</b>使用—— <b class='flag-5'>超低功耗</b>實(shí)現(xiàn)人體存在<b class='flag-5'>檢測</b>,上位機(jī)配置快速上手

    構(gòu)建超低功耗精密高邊電流檢測電路,你的選擇是?

    精密微安級(jí)高邊電流測量需要一個(gè)小阻值檢測電阻和一個(gè)低失調(diào)電壓的放大器。LTC2063零漂移放大器的最大輸入失調(diào)電壓僅為5μV,僅需消耗1.4μA的電流,是構(gòu)建完整的超低功耗精密高邊電流檢測電路的理想
    的頭像 發(fā)表于 03-19 08:22 ?1072次閱讀
    構(gòu)建<b class='flag-5'>超低功耗</b>精密高邊電流<b class='flag-5'>檢測</b>電路,你的選擇是?

    0.1毫安!超超超超超低功耗安信可雷達(dá)模組Rd-03L

    ,極簡化24GHz一發(fā)一收天線,天線波束窄、分辨率高、頻帶寬、抗干擾力強(qiáng)。 2、可檢測到微動(dòng)、運(yùn)動(dòng)狀態(tài)和靜止?fàn)顟B(tài)下的人體目標(biāo),識(shí)別精準(zhǔn)。 3、超低功耗,持續(xù)工作時(shí)平均電流0.1mA(1Hz上報(bào)頻率)。 4、提供可視化工具,支持配置探測距離區(qū)間、目標(biāo)消失延遲時(shí)
    的頭像 發(fā)表于 03-07 11:19 ?512次閱讀
    0.1毫安!超超超超<b class='flag-5'>超低功耗</b>安信可雷達(dá)模組Rd-03L