在設(shè)計(jì)智能音箱和其他語(yǔ)音功能的設(shè)備,例如可穿戴設(shè)備、可聽覺設(shè)備時(shí),開發(fā)者面臨的首要挑戰(zhàn)是如何讓麥克風(fēng)準(zhǔn)確有效地檢測(cè) “Alexa ”和 “Hey Google ”等喚醒詞,以便在云端處理。
當(dāng)DSP Group推出支持語(yǔ)音的語(yǔ)音系統(tǒng)級(jí)芯片(SoC)DBM10時(shí),EDN向該公司SmartVoice芯片的產(chǎn)品經(jīng)理Yosi Brosh提出了這個(gè)問(wèn)題。這款基于DSP和神經(jīng)網(wǎng)絡(luò)(NN)加速器的雙核SoC,針對(duì)電池設(shè)備中的語(yǔ)音和傳感器處理進(jìn)行了優(yōu)化,如可聽、可穿戴設(shè)備、真正的無(wú)線立體聲(TWS)耳機(jī)和智能家居遙控器等。
上圖:用于語(yǔ)音智能產(chǎn)品的DBM10芯片宣稱的采用平臺(tái)方式,具有全面的軟件框架支持。
Brosh表示,像亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)這樣的云平臺(tái)對(duì)在芯片上配置寄存器不感興趣。相反,這些云服務(wù)關(guān)注的是語(yǔ)音算法如何高效檢測(cè)喚醒詞。Brosh說(shuō)“他們希望算法能夠檢測(cè)到喚醒詞,而不需要工程師花費(fèi)大量時(shí)間研究和配置芯片上的寄存器?!?/p>
因此,DSP Group開發(fā)了一個(gè)API,使語(yǔ)音檢測(cè)算法很容易集成到云服務(wù)中。他補(bǔ)充道;“在某種程度上,云服務(wù)提供商的語(yǔ)音算法成為芯片的黑匣子。”
通常的做法是,設(shè)備制造商發(fā)布帶有麥克風(fēng)設(shè)置的軟件代碼,并告訴算法提供商如何在麥克風(fēng)驅(qū)動(dòng)中集成算法。以DSP Group的DBM10芯片為例,它使用語(yǔ)音固件采集音頻,使語(yǔ)音采集算法的集成變得高效簡(jiǎn)單。
DSP Group一直在與十幾家云公司密切合作,其中包括阿里巴巴、亞馬遜、百度、谷歌和三星,同時(shí)在其芯片上移植他們的語(yǔ)音算法。據(jù)Brosh介紹,該公司在某些情況下還提供一套完整的軟件。
該芯片能夠?yàn)橄到y(tǒng)設(shè)計(jì)人員提供簡(jiǎn)單的部署路徑,Brosh表示,公司對(duì)運(yùn)行在DBM10語(yǔ)音接口芯片上軟件的支持一直提供到生產(chǎn)層面,“系統(tǒng)工程師不需要編寫一行代碼”。
這就是為什么DSP Group稱其DBM10芯片為完整解決方案的原因。該SoC通過(guò)通用DSP和名為nNetLite的神經(jīng)網(wǎng)絡(luò)處理器對(duì)音頻算法以及傳感AI算法進(jìn)行了優(yōu)化。除此以外DSP Group還提供運(yùn)行在Wi-Fi芯片上用于與DBM10芯片進(jìn)行通信的額外驅(qū)動(dòng)程序。
SoC還具有跨平臺(tái)的工具鏈,支持所有常用的人工智能(AI)和機(jī)器學(xué)習(xí)(ML)框架,以簡(jiǎn)化算法部署。工程師們可以開發(fā)、訓(xùn)練和測(cè)試算法,然后將算法以標(biāo)準(zhǔn)格式保存,工具鏈會(huì)將其提取并創(chuàng)建一個(gè)圖像,下載到SoC中。
上圖:nNetLite編譯器可以快速優(yōu)化、修剪和部署任何框架的AI/ML模型到DBM10 SoC。
該SoC的外形尺寸很小,只有4平方毫米,可以進(jìn)入像智能手表這樣的極小設(shè)備。同樣,在SoC的神經(jīng)網(wǎng)絡(luò)nNetLite引擎上運(yùn)行的始終處于開啟狀態(tài)的wake word算法只消耗幾微瓦的電能。
編輯:lyn
-
語(yǔ)音
+關(guān)注
關(guān)注
3文章
385瀏覽量
38078 -
算法
+關(guān)注
關(guān)注
23文章
4623瀏覽量
93102 -
云服務(wù)
+關(guān)注
關(guān)注
0文章
828瀏覽量
38953
原文標(biāo)題:簡(jiǎn)化云服務(wù)的語(yǔ)音檢測(cè)算法部署
文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論