歷史書可能會(huì)將語音控制視為人機(jī)接口中最重要的進(jìn)步。我們不再打字,不再指點(diǎn),只需說出想要什么就可以了。這個(gè)領(lǐng)域的初期進(jìn)展十分緩慢,直到智能揚(yáng)聲器的出現(xiàn),讓我們開始意識(shí)到了解決方案?,F(xiàn)在,隨著在手機(jī)、耳機(jī)、可穿戴設(shè)備和智能家居中識(shí)別功能和應(yīng)用的改進(jìn),這場競爭已然開始。如今,最廣為人知的解決方案依賴于少數(shù)提供商控制的平臺(tái)和服務(wù),但這種情況正在發(fā)生改變。語音激活可嵌入到任何地方,不僅可以定制,還可提高抗噪性,降低功率,擴(kuò)大范圍,而且在語音識(shí)別方面與大型平臺(tái)一樣有效。
消費(fèi)類語音產(chǎn)品市場的歷史饒有趣味,而語音識(shí)別功能在其中起著重要作用。FutureSource 顯示,從 2008 年到 2012 年,語音體驗(yàn)主要集中在智能手機(jī)上,整體市場價(jià)值下降。從 2012 年到 2014 年,市場基本持平。然后,從 2015 年到 2018 年,主要受語音激活驅(qū)動(dòng),它再次以 15% 的復(fù)合年增長率增長。展望未來,Yole Développement 預(yù)計(jì)到 2023 年,復(fù)合年增長率至少為 30%,這主要得益于語音識(shí)別。這一增長將主要集中在智能手機(jī)上,其次是耳機(jī)和可穿戴設(shè)備、個(gè)人助理和智能家居功能(電視、電器等)。同一份報(bào)告得出的結(jié)論是,我們現(xiàn)在正進(jìn)入智能語音的第二階段,隨著消費(fèi)者對(duì)這種控制方法越來越滿意,語音控制將變得越來越普遍。
無論部署在哪里,他們的目標(biāo)都是增強(qiáng)實(shí)別能力。在智能手機(jī)或任何其他電池供電的設(shè)備中,一個(gè)明顯的優(yōu)勢是支持始終在線聆聽;在發(fā)出命令之前無需按下按鈕。這就需要超低功耗的觸發(fā)命令詞檢測,眾所周知,這意味著硬件與軟件的契合,以盡量降低待機(jī)功耗。當(dāng)然,用戶都希望為自己的品牌定制個(gè)性化觸發(fā)命令詞或短語的功能,并且可以支持多種語言,以便在其所在地區(qū)甚至國際市場上獲得強(qiáng)大的滲透力。您仍然將后續(xù)命令傳遞給某個(gè)主要的語音識(shí)別提供商來識(shí)別請求?;蛘?,也許不必。如果您的設(shè)備只需要對(duì)有限的詞匯表提供支持,并且您的語音識(shí)別引擎可以滿足該目標(biāo),則可能無需第三方的幫助。
另一個(gè)關(guān)鍵需求是在嘈雜的環(huán)境中進(jìn)行識(shí)別,也許還有身份驗(yàn)證。語音識(shí)別所面臨的挑戰(zhàn)與目標(biāo)識(shí)別不同。例如,在起居室或汽車中,可能會(huì)有多個(gè)聲源:人們說話、電視和獨(dú)立的音樂/無線電、室內(nèi)外的噪音、以及房間或汽車內(nèi)部表面反射的回聲。隔離命令源、消除回聲和降低背景噪聲需要一些復(fù)雜的技術(shù),這取決于多麥克風(fēng)、波束成形和回聲消除,以及噪聲抑制。
當(dāng)然,鑒于這些需求,CEVA 等公司已備好滿足這些需求的可用解決方案。最近推出的 CEVA Whispro? 語音識(shí)別產(chǎn)品解決方案就采用了在 CEVA DSP 平臺(tái)上運(yùn)行的,基于神經(jīng)網(wǎng)絡(luò)的軟件。Whispro 已經(jīng)支持“Alexa”和“Ok Google”作為觸發(fā)命令詞,并且可以在培訓(xùn)中進(jìn)行自定義,以支持任何客戶要求的觸發(fā)命令詞。它支持多種語言,可以處理多種語音觸發(fā)。該方案在多噪聲背景下進(jìn)行培訓(xùn),因此,識(shí)別具有嵌入的抗擾性,識(shí)別率大于 95%,每小時(shí)錯(cuò)誤接受率小于 1 次,且無需進(jìn)行云識(shí)別。
通過添加專門的語音拾取解決方案 CEVA ClearVox?,開發(fā)人員可實(shí)現(xiàn)多麥克風(fēng)支持和波束成形,以改進(jìn)遠(yuǎn)場語音拾取、消除回聲和進(jìn)一步降低噪音。Whispro 與 ClearVox 的組合可以在更遠(yuǎn)的距離內(nèi)(最遠(yuǎn) 7 米),尤其是在嘈雜的環(huán)境中,也能夠提供具有競爭力的觸發(fā)識(shí)別。
-
語音接口
+關(guān)注
關(guān)注
0文章
10瀏覽量
9906 -
語音控制
+關(guān)注
關(guān)注
5文章
483瀏覽量
28252
原文標(biāo)題:語音接口的大眾化【中文版】
文章出處:【微信號(hào):CEVA-IP,微信公眾號(hào):CEVA】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論