0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

電子設(shè)備中的語(yǔ)音和音頻控制進(jìn)展

jf_pJlTbmA9 ? 來(lái)源:jf_pJlTbmA9 ? 作者:jf_pJlTbmA9 ? 2023-07-08 11:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

言語(yǔ)是人們表達(dá)思想和愿望的一種有效方式。在工業(yè)時(shí)代到來(lái)之前,人類發(fā)現(xiàn)動(dòng)物可以被訓(xùn)練用來(lái)識(shí)別和響應(yīng)讓它們執(zhí)行某些任務(wù)的基本命令。

下一個(gè)合乎邏輯的發(fā)展應(yīng)該是開(kāi)發(fā)一種使用聲音信號(hào)與機(jī)器進(jìn)行交流,并指揮機(jī)器行動(dòng)的方法。近年來(lái),以語(yǔ)音和音頻作為電子設(shè)備的控制界面越來(lái)越受歡迎,并且這種技術(shù)也在不斷發(fā)展,以滿足用戶的期望和新應(yīng)用的要求。

在本文中,我們將解釋用語(yǔ)音和音頻信號(hào)控制電子設(shè)備和機(jī)器的好處,并回顧如何實(shí)現(xiàn)這種控制。我們還將展示這種控制界面現(xiàn)在可以如何能夠嵌入到離線設(shè)備,以及它們提供的音頻控制體驗(yàn)如何能夠大幅度改善。

使用語(yǔ)音控制電子設(shè)備

采用語(yǔ)音控制實(shí)現(xiàn)與機(jī)器交互有幾個(gè)明顯好處:

對(duì)人類來(lái)說(shuō),語(yǔ)音是一種直觀的交流形式,這種口頭傳達(dá)指令的方式更容易。

即使一個(gè)人的眼睛和手正在用于其它事情,語(yǔ)音交流仍然可能。實(shí)時(shí)的語(yǔ)音控制也很方便,例如在駕車(chē)等某些應(yīng)用場(chǎng)景下,試圖通過(guò)觸摸來(lái)控制車(chē)內(nèi)其它設(shè)備是違法的。

語(yǔ)音是控制機(jī)器的一種有效媒介,采用語(yǔ)音控制機(jī)器,可以在不需要復(fù)雜指令的情況下進(jìn)行監(jiān)聽(tīng)和響應(yīng)。

在設(shè)備中集成語(yǔ)音控制能夠最大限度地減少許多設(shè)備對(duì)觸屏的需求。這對(duì)于處于遠(yuǎn)程或便攜式電池供電設(shè)備來(lái)說(shuō)尤其理想,在這些設(shè)備中,減小尺寸和降低功耗是常見(jiàn)的設(shè)計(jì)挑戰(zhàn)。對(duì)于具有多個(gè)用戶的應(yīng)用來(lái)說(shuō),去掉觸屏控制也更加符合衛(wèi)生要求。

如圖1所示,對(duì)于某些殘疾人來(lái)說(shuō),觸屏控制可能是一種不現(xiàn)實(shí)的選擇,因而語(yǔ)音可以成為一種有效的支持工具。通過(guò)語(yǔ)音與機(jī)器進(jìn)行交互可用于執(zhí)行諸如開(kāi)門(mén)之類的任務(wù),或者通過(guò)遠(yuǎn)程通信來(lái)傳輸個(gè)人最近的健康狀況。

語(yǔ)音控制設(shè)備的音頻前端(AFE)包括麥克風(fēng)陣列和信號(hào)處理模塊。AFE能夠處理來(lái)自多通道麥克風(fēng)陣列的信號(hào),以消除任何背景噪聲或設(shè)備本身回放產(chǎn)生的干擾。然后,該信號(hào)被發(fā)送到“喚醒詞(wake-word)”檢測(cè)引擎,例如經(jīng)過(guò)在設(shè)備上預(yù)先編程,可識(shí)別出“Alexa”或“OK Google”等單詞。通過(guò)使用多種信號(hào)處理算法,能夠消除多種不需要的干擾信號(hào)。語(yǔ)音控制解決方案的組成部分包括:

麥克風(fēng)陣列:語(yǔ)音激活系統(tǒng)需要一個(gè)或多個(gè)麥克風(fēng)來(lái)捕獲音頻控制信號(hào)。在選擇麥克風(fēng)陣列時(shí),重要的考慮因素包括尺寸、成本、性能和穩(wěn)健性。優(yōu)化組合來(lái)自多麥克風(fēng)陣列的不同信號(hào)有助于提高音頻信號(hào)鏈的信噪比(SNR)。

到達(dá)方向(DoA)檢測(cè)器:用于確定用戶相對(duì)于被控設(shè)備的位置,以便麥克風(fēng)陣列可以將波束調(diào)整為語(yǔ)音的方向。

波束成形器:它接受來(lái)自DoA檢測(cè)器的聲音,同時(shí)去除來(lái)自其他方向的聲音。其性能取決于麥克風(fēng)陣列的幾何形狀、SNR以及波束寬度和背景噪聲水平等。

聲學(xué)回聲消除器(AEC):它會(huì)消除設(shè)備揚(yáng)聲器本身的播放信號(hào)(例如,設(shè)備揚(yáng)聲器正在播放音樂(lè)時(shí)收到語(yǔ)音指令),以便清晰地拾取用戶語(yǔ)音指令。

自適應(yīng)干擾消除器(AIC):它能夠消除來(lái)自其他聲音源的外部噪聲,這些噪聲很難用傳統(tǒng)的波束成形器消除,例如,其他設(shè)備產(chǎn)生的較大噪聲。

喚醒詞檢測(cè)器:將來(lái)自AFE的經(jīng)過(guò)處理語(yǔ)音信號(hào)與喚醒詞庫(kù)進(jìn)行比較,例如可使用喚醒詞檢測(cè)算法的“Hey Google”,這種算法通常是機(jī)器學(xué)習(xí)模型的一部分。更大的模型則更準(zhǔn)確,例如,1MB訓(xùn)練模型比64kB模型更準(zhǔn)確,但處理強(qiáng)度更大。需要大的喚醒詞模型來(lái)準(zhǔn)確地檢測(cè)喚醒詞,從而減少錯(cuò)誤警報(bào)的數(shù)量。

D類音頻放大器

該控制界面的語(yǔ)音處理部分經(jīng)過(guò)大量開(kāi)發(fā),現(xiàn)在即使是低成本的設(shè)備也能提供準(zhǔn)確的語(yǔ)音識(shí)別能力。然而,界面的音頻端受到的關(guān)注明顯較少,這意味著與高端音頻設(shè)備相比,許多早期智能揚(yáng)聲器和其他支持音頻的物聯(lián)網(wǎng)IoT)設(shè)備所產(chǎn)生的音質(zhì)較差。

與語(yǔ)音控制相關(guān)的任何新產(chǎn)品都可能被認(rèn)為分散了人們對(duì)這些缺點(diǎn)的關(guān)注。然而,隨著智能設(shè)備越來(lái)越廣泛采用,消費(fèi)者對(duì)其提供的音頻體驗(yàn)期望也越來(lái)越高。傳統(tǒng)AB類音頻放大器的低效率使其無(wú)法用于低功率物聯(lián)網(wǎng)設(shè)備,幸運(yùn)的是,幾家芯片制造商最近推出了一系列高級(jí)D類音頻放大器,體現(xiàn)了對(duì)以前可用音頻放大器的重大改進(jìn),其中許多產(chǎn)品都是專門(mén)為在智能技術(shù)和物聯(lián)網(wǎng)設(shè)備中實(shí)現(xiàn)高品質(zhì)音頻而開(kāi)發(fā)。

德州儀器Texas Instruments)的TAS277015W輸入音頻放大器能夠提高響度和音頻質(zhì)量,它具有更強(qiáng)的語(yǔ)音捕獲能力,意味著語(yǔ)音控制設(shè)備的操作更容易、更自然。Maxim Integrated(現(xiàn)在屬于Analog Devices旗下品牌)開(kāi)發(fā)了MAX98357 和MAX98358 D類放大器,效率達(dá)到92%,可提供3.2W的AB類音頻性能,這些放大器的簡(jiǎn)化框圖如圖2所示。Diodes Incorporated的PAM8106具有較低功耗,使其能夠在由1.5V鉛酸電池和3.5V鋰離子電池驅(qū)動(dòng)的設(shè)備中很好地運(yùn)行。

離線語(yǔ)音控制

亞馬遜的Alexa和谷歌助手(Google Assistant)等基于云的解決方案很容易用于具有穩(wěn)定互聯(lián)網(wǎng)連接的設(shè)備,但對(duì)于那些沒(méi)有穩(wěn)定互聯(lián)網(wǎng)或根本沒(méi)有連接的設(shè)備來(lái)說(shuō),離線語(yǔ)音控制則是一個(gè)更好的解決方案。例如,如果某個(gè)產(chǎn)品需要響應(yīng)簡(jiǎn)單的單詞指令,如go、stop、reset等(通常稱為關(guān)鍵字識(shí)別),那么在設(shè)備本身進(jìn)行本地處理則很有意義。使用低成本的嵌入式微控制器可以實(shí)現(xiàn)簡(jiǎn)單的關(guān)鍵字指令系統(tǒng),例如可使用恩智浦(NXP)基于EdgeReady MCU的離線本地語(yǔ)音控制解決方案。它采用i.MX RT交叉MCU,開(kāi)發(fā)人員能夠快速將語(yǔ)音控制集成到他們的產(chǎn)品中。恩智浦基于i.MX RT106S的解決方案包括SLN-LOCAL2-IOT開(kāi)發(fā)工具包,如圖3所示。

該開(kāi)發(fā)工具包配備了在FreeRTOS上運(yùn)行的全部集成軟件,并提供有軟件開(kāi)發(fā)工具包(SDK),以便快速驗(yàn)證概念。離線語(yǔ)音控制也有助于解決許多消費(fèi)者的隱私問(wèn)題,因?yàn)樗麄儞?dān)心自己的系統(tǒng)容易受到在線黑客的攻擊。

結(jié)論

語(yǔ)音和音頻正在快速成為許多智能設(shè)備的首選控制界面,這種技術(shù)尤其適合在低功耗和便攜式物聯(lián)網(wǎng)設(shè)備中使用,因?yàn)樗軌蛳龑?duì)昂貴且耗電的數(shù)字顯示器的要求。許多早期系統(tǒng)的音頻質(zhì)量較差,只能使用云連接解決方案來(lái)實(shí)現(xiàn)。

然而,隨著新一代高效D類音頻放大器的出現(xiàn),使制造商能夠確保其設(shè)備為消費(fèi)者提供高質(zhì)量的音頻體驗(yàn)。而且現(xiàn)在也可提供一些其它解決方案,能夠在互聯(lián)網(wǎng)連接不穩(wěn)定或根本沒(méi)有互聯(lián)網(wǎng)連接的情況下實(shí)現(xiàn)設(shè)備的語(yǔ)音控制。這些創(chuàng)新表明,隨著人們?cè)絹?lái)越習(xí)慣這種控制界面,語(yǔ)音控制技術(shù)有能力適應(yīng)新的需求,而且這種發(fā)展趨勢(shì)還會(huì)不斷繼續(xù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 音頻
    +關(guān)注

    關(guān)注

    29

    文章

    3039

    瀏覽量

    83388
  • 電子設(shè)備
    +關(guān)注

    關(guān)注

    2

    文章

    2882

    瀏覽量

    54729
  • 貿(mào)澤電子
    +關(guān)注

    關(guān)注

    16

    文章

    1175

    瀏覽量

    97720
收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    音頻、視頻及類似電子設(shè)備安全要求

    音頻、視頻及類似電子設(shè)備安全要求
    發(fā)表于 08-17 15:11

    通過(guò)互聯(lián)網(wǎng)語(yǔ)音音頻口)控制串口設(shè)備--AUX232L

    的發(fā)展趨勢(shì),同時(shí)也是現(xiàn)在互聯(lián)網(wǎng)音頻串口通信產(chǎn)品的功能。通過(guò)互聯(lián)網(wǎng)對(duì)電子設(shè)備進(jìn)行控制和通信是波仕電子近年來(lái)研究的重點(diǎn)?!?b class='flag-5'>控制”是單向的,比如人
    發(fā)表于 03-24 14:27

    地下鉆探行業(yè)高溫電子設(shè)備的應(yīng)用

    ,代價(jià)是發(fā)動(dòng)機(jī)附近的環(huán)境溫度會(huì)上升(–55°C至+200°C)。雖然該應(yīng)用電子設(shè)備可以進(jìn)行冷卻,但依然會(huì)產(chǎn)生不利影響,原因有二——1)冷卻會(huì)增加飛機(jī)的成本和重量;2)冷卻系統(tǒng)故障會(huì)導(dǎo)致控制關(guān)鍵系統(tǒng)
    發(fā)表于 10-11 11:26

    電子設(shè)備通用技術(shù)有哪些?

    說(shuō)到電子設(shè)備通用技術(shù),網(wǎng)上關(guān)于這方便的介紹少之又少,有的甚至聯(lián)系到高中的通用技術(shù)這一門(mén)課,其實(shí)不然。首先來(lái)說(shuō)一下通用技術(shù),通用技術(shù)是指在運(yùn)行過(guò)程起到基本作用的,區(qū)分于專用技術(shù)的技術(shù)手段。其次來(lái)說(shuō)
    發(fā)表于 01-19 07:30

    如何為便攜式電子設(shè)備去設(shè)計(jì)D類音頻放大器?

    如何為便攜式電子設(shè)備去設(shè)計(jì)D類音頻放大器?
    發(fā)表于 06-08 07:10

    電子設(shè)備熱設(shè)計(jì)資料分享

    第一章 電子設(shè)備熱設(shè)計(jì)要求 第二章 冷卻方法的選擇 第三章 電子設(shè)備的自然冷卻設(shè)計(jì) 第四章 電子設(shè)備用肋片式散熱器 第五章 電子設(shè)備強(qiáng)迫空氣冷卻設(shè)計(jì) 第六章 熱管散熱器的設(shè)計(jì) 第七章
    發(fā)表于 04-07 10:26

    使用android手機(jī)控制電子設(shè)備

    描述用安卓手機(jī)遠(yuǎn)程控制這是我的第一個(gè)項(xiàng)目,該工具的工作方式是使用android手機(jī)控制電子設(shè)備,在手機(jī)和該設(shè)備之間連接我使用hc-05藍(lán)牙模塊和atmega328 ic作為
    發(fā)表于 08-11 06:57

    Icepak在電子設(shè)備熱設(shè)計(jì)的應(yīng)用

    Icepak在電子設(shè)備熱設(shè)計(jì)的應(yīng)用:在闡述電子設(shè)備熱分析重要性的同時(shí),介紹了當(dāng)前流行的四種熱分析軟件,利用其中的Icepak軟件對(duì)某電子設(shè)備的機(jī)箱進(jìn)行了熱分析,并通過(guò)調(diào)整機(jī)
    發(fā)表于 10-18 10:03 ?63次下載

    GB_8898-2001_音頻、視頻及類似電子設(shè)備安全要求

    GB_8898-2001_音頻、視頻及類似電子設(shè)備安全要求
    發(fā)表于 11-16 16:33 ?29次下載

    英飛凌推出合作伙伴網(wǎng)絡(luò) 完善互聯(lián)設(shè)備語(yǔ)音用戶界面

    關(guān)鍵詞:MEMS麥克風(fēng) , 音頻鏈 , 語(yǔ)音用戶界面 , 語(yǔ)音識(shí)別 從智能音箱到智能電視、會(huì)議系統(tǒng)或智能家電,語(yǔ)音識(shí)別使電子設(shè)備的操作變得更
    發(fā)表于 03-02 09:48 ?300次閱讀

    華為申請(qǐng)語(yǔ)音支付方法和電子設(shè)備新專利

    1月12日,華為技術(shù)有限公司公開(kāi)一項(xiàng)名為“一種語(yǔ)音支付方法和電子設(shè)備”的專利,其申請(qǐng)日期為2019年12月。專利摘要顯示,這項(xiàng)專利提供了語(yǔ)音支付方法和電子設(shè)備,該
    的頭像 發(fā)表于 01-13 11:36 ?2457次閱讀

    電子設(shè)備的保形涂層

    電子設(shè)備的保形涂層
    的頭像 發(fā)表于 12-28 09:51 ?1633次閱讀

    NV040C語(yǔ)音芯片在智能電子設(shè)備上的應(yīng)用方案

    九芯電子專門(mén)為電子設(shè)備研發(fā)了OTP語(yǔ)音IC方案:音質(zhì)優(yōu)美、功能強(qiáng)大的NV040C語(yǔ)音芯片,可以滿足電子設(shè)備的基本
    的頭像 發(fā)表于 06-17 16:20 ?1485次閱讀
    NV040C<b class='flag-5'>語(yǔ)音</b>芯片在智能<b class='flag-5'>電子設(shè)備</b>上的應(yīng)用方案

    降噪技術(shù)在電子設(shè)備的應(yīng)用

    降噪技術(shù)是通過(guò)減少或消除不需要的聲音,提高聲音質(zhì)量的技術(shù)。在電子設(shè)備,降噪技術(shù)的應(yīng)用已經(jīng)變得日益廣泛,為用戶提供了更加清晰、寧?kù)o的使用體驗(yàn)。以下是對(duì)降噪技術(shù)在電子設(shè)備應(yīng)用的分析:
    的頭像 發(fā)表于 12-18 15:01 ?1419次閱讀

    廣州唯創(chuàng)電子:WT2605音頻藍(lán)牙芯片重塑家用醫(yī)療電子設(shè)備交互體驗(yàn)

    在人口老齡化加劇與健康管理意識(shí)覺(jué)醒的雙重驅(qū)動(dòng)下,家用醫(yī)療電子設(shè)備正從單一功能型產(chǎn)品向智能化、人性化方向快速迭代。血壓計(jì)、血糖儀、呼吸機(jī)、霧化器等設(shè)備不再局限于數(shù)據(jù)監(jiān)測(cè),而是逐步融入語(yǔ)音交互、遠(yuǎn)程管理
    的頭像 發(fā)表于 03-10 08:30 ?818次閱讀
    廣州唯創(chuàng)<b class='flag-5'>電子</b>:WT2605<b class='flag-5'>音頻</b>藍(lán)牙芯片重塑家用醫(yī)療<b class='flag-5'>電子設(shè)備</b>交互體驗(yàn)

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品