作者:Sleibso,編譯:蒙面?zhèn)b客
高性能的語(yǔ)音控制系統(tǒng)在智能家具和機(jī)器人的發(fā)展過(guò)程中顯得越來(lái)越重要。語(yǔ)音控制系統(tǒng)的信號(hào)采集端使用麥克風(fēng)陣列會(huì)得到更豐富的聲音信號(hào),為聲音定位提供了可能,處理語(yǔ)音的硬件的性能和相應(yīng)的軟件算法直接決定了語(yǔ)音控制系統(tǒng)的處理效率和精確度。亞馬遜和谷歌等大型互聯(lián)網(wǎng)公司都在努力的研究高性能的語(yǔ)音控制系統(tǒng),作為極客的你是不是也想入手一個(gè)硬件平臺(tái),開始自己的智能硬件的開發(fā)之旅呢?好的平臺(tái)是成功的一半!
亞馬遜的Alexa和Google Home的出現(xiàn)助推了語(yǔ)音控制系統(tǒng)的發(fā)展。今天小編帶領(lǐng)各位領(lǐng)略一個(gè)適合自己DIY的語(yǔ)音控制系統(tǒng)開發(fā)平臺(tái)。圖.1為Aaware的價(jià)值199美元的遠(yuǎn)場(chǎng)開發(fā)平臺(tái),它是一款基于云的語(yǔ)音控制系統(tǒng)。遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別受限于背景噪聲、其他人聲的干擾、回聲、混響等多重復(fù)雜的因素,會(huì)導(dǎo)致其識(shí)別率的降低,而Aaware平臺(tái)能夠?qū)崿F(xiàn)遠(yuǎn)場(chǎng)聲音在有噪聲的情況下的高精度的語(yǔ)音識(shí)別。小編曾經(jīng)也做過(guò)一些其他的語(yǔ)音控制系統(tǒng),但是效果都不是特別的理想。看了Aaware的演示視頻之后,發(fā)現(xiàn)這款平臺(tái)在預(yù)處理聲音,消除噪聲,遠(yuǎn)場(chǎng)的聲音的捕捉方面有著超強(qiáng)的能力。在驚嘆之余,我們一起來(lái)探索一下Aaware遠(yuǎn)場(chǎng)開發(fā)平臺(tái)背后所隱藏的技術(shù)秘密。這種遠(yuǎn)程遠(yuǎn)場(chǎng)聲音捕獲技術(shù)展現(xiàn)出的能力如下:
-
無(wú)需參考信號(hào)就可消除干擾噪聲。(解決方案專注于AEC聲學(xué)回聲消除);
-
支持不一致的1D和2D麥克風(fēng)陣列間距,實(shí)現(xiàn)聲源判斷和定位;
-
更多的麥克風(fēng)使其在嘈雜的環(huán)境中獲得更好的效果;
-
對(duì)聲音的捕獲,提供單芯片的解決方案,同時(shí)支持多詞喚醒以及用戶自定義應(yīng)用;
-
登錄有ubunut的Linux環(huán)境,使用Aaware的流音頻API工具進(jìn)行應(yīng)用的開發(fā)。
圖.1 Aaware的遠(yuǎn)場(chǎng)開發(fā)平臺(tái)
這么多的硬件優(yōu)勢(shì)是基于Xilinx的Zynq SoC或Zynq UltraScale + MPSoC來(lái)實(shí)現(xiàn)。Aaware的CTO稱贊道,Zynq器件是強(qiáng)于一個(gè)嵌入式處理器10倍的性能的器件,這多虧了芯片里面的可編程邏輯,通過(guò)可編程邏輯門陣列分擔(dān)了片上ARM核心所需要處理的數(shù)據(jù),通過(guò)圖.2得知,他們之間的數(shù)據(jù)是通過(guò)AMBA總線進(jìn)行交互的。Aaware能夠根據(jù)用戶對(duì)性能的需求,將其算法放到單核心的Zynq Z-7007S SoC中或者升級(jí)算法到雙核心的Zynq SoC中,如果想要追求更好的性能可以使用Zynq UltraScale+MPSoC器件來(lái)搭建遠(yuǎn)場(chǎng)語(yǔ)音控制系統(tǒng)。
圖.2 ZYNQ-7000S系列框圖
有了硬件平臺(tái),我們需要進(jìn)一步的了解一下相應(yīng)的軟件開發(fā)工具鏈,Aaware的算法開發(fā)是基于一個(gè)特有的工具鏈:
-
在MATLAB中進(jìn)行算法的開發(fā);
-
使用C++對(duì)算法進(jìn)行實(shí)現(xiàn);
-
使用Vivado HLS從C++規(guī)范進(jìn)行硬件加速器綜合;
-
使用Xilinx SDSOC 將硬件加速器連接到AXI總線和存儲(chǔ)器中。
有了工具鏈就可以使得Aware能夠?qū)⑵湎胍墓δ芗傻阶钚〉腪ynq Z-7007S SoC中, 如果有更高性能的需求還可以將算法應(yīng)用到最大的Zynq UltraScale + MPSoC平臺(tái)之上。
智能語(yǔ)音控制系統(tǒng)需要在硬件平臺(tái)和軟件算法兩方面共同入手。將Aaware 的基于Zynq的遠(yuǎn)場(chǎng)聲音捕捉平臺(tái)作為一個(gè)特例,反應(yīng)了當(dāng)下語(yǔ)音控制系統(tǒng)的一種實(shí)現(xiàn)方法,硬件平臺(tái)使用Xilinx的可編程SOC是一個(gè)很好的選擇,因?yàn)樗С诌\(yùn)行嵌入式實(shí)時(shí)操作系統(tǒng)的同時(shí)能夠快速的處理數(shù)據(jù),有著很好的性能功耗比;至于軟件的開發(fā),可謂是五花八門,結(jié)合當(dāng)下自然語(yǔ)言處理和深度學(xué)習(xí)的快速發(fā)展,想必會(huì)有更好的算法能夠?qū)崿F(xiàn)更快更精準(zhǔn)的語(yǔ)音控制系統(tǒng)。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28557瀏覽量
207692 -
智能家居
+關(guān)注
關(guān)注
1928文章
9588瀏覽量
185773 -
語(yǔ)言識(shí)別
+關(guān)注
關(guān)注
0文章
15瀏覽量
4839
原文標(biāo)題:揭示 Aaware Zynq 加速的遠(yuǎn)程聲音捕捉平臺(tái)背后的秘密
文章出處:【微信號(hào):FPGA-EETrend,微信公眾號(hào):FPGA開發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論