0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音控制視為人機(jī)接口進(jìn)步項(xiàng) 語音激活可嵌入到任何地方

CEVA ? 來源:lp ? 2019-02-27 17:26 ? 次閱讀

歷史書可能會(huì)將語音控制視為人機(jī)接口中最重要的進(jìn)步。我們不再打字,不再指點(diǎn),只需說出想要什么就可以了。這個(gè)領(lǐng)域的初期進(jìn)展十分緩慢,直到智能揚(yáng)聲器的出現(xiàn),讓我們開始意識(shí)到了解決方案?,F(xiàn)在,隨著在手機(jī)、耳機(jī)、可穿戴設(shè)備和智能家居中識(shí)別功能和應(yīng)用的改進(jìn),這場競爭已然開始。如今,最廣為人知的解決方案依賴于少數(shù)提供商控制的平臺(tái)和服務(wù),但這種情況正在發(fā)生改變。語音激活可嵌入到任何地方,不僅可以定制,還可提高抗噪性,降低功率,擴(kuò)大范圍,而且在語音識(shí)別方面與大型平臺(tái)一樣有效。

消費(fèi)類語音產(chǎn)品市場的歷史饒有趣味,而語音識(shí)別功能在其中起著重要作用。FutureSource 顯示,從 2008 年到 2012 年,語音體驗(yàn)主要集中在智能手機(jī)上,整體市場價(jià)值下降。從 2012 年到 2014 年,市場基本持平。然后,從 2015 年到 2018 年,主要受語音激活驅(qū)動(dòng),它再次以 15% 的復(fù)合年增長率增長。展望未來,Yole Développement 預(yù)計(jì)到 2023 年,復(fù)合年增長率至少為 30%,這主要得益于語音識(shí)別。這一增長將主要集中在智能手機(jī)上,其次是耳機(jī)和可穿戴設(shè)備、個(gè)人助理和智能家居功能(電視、電器等)。同一份報(bào)告得出的結(jié)論是,我們現(xiàn)在正進(jìn)入智能語音的第二階段,隨著消費(fèi)者對(duì)這種控制方法越來越滿意,語音控制將變得越來越普遍。

無論部署在哪里,他們的目標(biāo)都是增強(qiáng)實(shí)別能力。在智能手機(jī)或任何其他電池供電的設(shè)備中,一個(gè)明顯的優(yōu)勢是支持始終在線聆聽;在發(fā)出命令之前無需按下按鈕。這就需要超低功耗的觸發(fā)命令詞檢測,眾所周知,這意味著硬件與軟件的契合,以盡量降低待機(jī)功耗。當(dāng)然,用戶都希望為自己的品牌定制個(gè)性化觸發(fā)命令詞或短語的功能,并且可以支持多種語言,以便在其所在地區(qū)甚至國際市場上獲得強(qiáng)大的滲透力。您仍然將后續(xù)命令傳遞給某個(gè)主要的語音識(shí)別提供商來識(shí)別請求?;蛘?,也許不必。如果您的設(shè)備只需要對(duì)有限的詞匯表提供支持,并且您的語音識(shí)別引擎可以滿足該目標(biāo),則可能無需第三方的幫助。

另一個(gè)關(guān)鍵需求是在嘈雜的環(huán)境中進(jìn)行識(shí)別,也許還有身份驗(yàn)證。語音識(shí)別所面臨的挑戰(zhàn)與目標(biāo)識(shí)別不同。例如,在起居室或汽車中,可能會(huì)有多個(gè)聲源:人們說話、電視和獨(dú)立的音樂/無線電、室內(nèi)外的噪音、以及房間或汽車內(nèi)部表面反射的回聲。隔離命令源、消除回聲和降低背景噪聲需要一些復(fù)雜的技術(shù),這取決于多麥克風(fēng)、波束成形和回聲消除,以及噪聲抑制。

當(dāng)然,鑒于這些需求,CEVA公司已備好滿足這些需求的可用解決方案。最近推出的 CEVA Whispro? 語音識(shí)別產(chǎn)品解決方案就采用了在 CEVA DSP 平臺(tái)上運(yùn)行的,基于神經(jīng)網(wǎng)絡(luò)的軟件。Whispro 已經(jīng)支持“Alexa”和“Ok Google”作為觸發(fā)命令詞,并且可以在培訓(xùn)中進(jìn)行自定義,以支持任何客戶要求的觸發(fā)命令詞。它支持多種語言,可以處理多種語音觸發(fā)。該方案在多噪聲背景下進(jìn)行培訓(xùn),因此,識(shí)別具有嵌入的抗擾性,識(shí)別率大于 95%,每小時(shí)錯(cuò)誤接受率小于 1 次,且無需進(jìn)行云識(shí)別。

通過添加專門的語音拾取解決方案 CEVA ClearVox?,開發(fā)人員可實(shí)現(xiàn)多麥克風(fēng)支持和波束成形,以改進(jìn)遠(yuǎn)場語音拾取、消除回聲和進(jìn)一步降低噪音。Whispro 與 ClearVox 的組合可以在更遠(yuǎn)的距離內(nèi)(最遠(yuǎn) 7 米),尤其是在嘈雜的環(huán)境中,也能夠提供具有競爭力的觸發(fā)識(shí)別。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 語音接口
    +關(guān)注

    關(guān)注

    0

    文章

    10

    瀏覽量

    9906
  • 語音控制
    +關(guān)注

    關(guān)注

    5

    文章

    483

    瀏覽量

    28252

原文標(biāo)題:語音接口的大眾化【中文版】

文章出處:【微信號(hào):CEVA-IP,微信公眾號(hào):CEVA】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Flash語音芯片相比OTP語音芯片的優(yōu)勢

    ?。No.1重復(fù)擦寫Flash語音芯片的最大特點(diǎn)是支持多次編程和擦除,這意味著用戶可以根據(jù)需要隨時(shí)更新語音內(nèi)容,實(shí)現(xiàn)定制化和靈活的語音交互。相比之下,OTP
    的頭像 發(fā)表于 12-16 16:02 ?108次閱讀
    Flash<b class='flag-5'>語音</b>芯片相比OTP<b class='flag-5'>語音</b>芯片的優(yōu)勢

    語音識(shí)別與自然語言處理的關(guān)系

    在人工智能的快速發(fā)展中,語音識(shí)別和自然語言處理(NLP)成為了兩個(gè)重要的技術(shù)支柱。語音識(shí)別技術(shù)使得機(jī)器能夠理解人類的語音,而自然語言處理則讓機(jī)器能夠理解、解釋和生成人類語言。這兩項(xiàng)技術(shù)
    的頭像 發(fā)表于 11-26 09:21 ?405次閱讀

    基于語音識(shí)別技術(shù)的智能家居控制系統(tǒng)

    語音識(shí)別的智能控制系統(tǒng)是智能家居的重要組成部分,相比傳統(tǒng)的遙控或觸控方式,基于語音識(shí)別控制的智能家居系統(tǒng)通過人機(jī)
    的頭像 發(fā)表于 11-19 17:25 ?554次閱讀
    基于<b class='flag-5'>語音</b>識(shí)別技術(shù)的智能家居<b class='flag-5'>控制</b>系統(tǒng)

    Transformer模型在語音識(shí)別和語音生成中的應(yīng)用優(yōu)勢

    隨著人工智能技術(shù)的飛速發(fā)展,語音識(shí)別和語音生成作為人機(jī)交互的重要組成部分,正逐漸滲透到我們生活的各個(gè)方面。而Transformer模型,自其誕生以來,憑借其獨(dú)特的自注意力機(jī)制和并行計(jì)算能力,在
    的頭像 發(fā)表于 07-03 18:24 ?1135次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)在語音識(shí)別中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,語音識(shí)別技術(shù)作為人機(jī)交互的重要橋梁,受到了廣泛的關(guān)注和研究。語音識(shí)別技術(shù)旨在將人類語音信號(hào)轉(zhuǎn)換為文本信息,實(shí)現(xiàn)自然語言理解和
    的頭像 發(fā)表于 07-01 16:01 ?879次閱讀

    離線語音控制技術(shù)特點(diǎn)

    離線語音控制通過結(jié)合高性能的音頻前端處理算法和本地AI模型實(shí)現(xiàn)了高效的語音識(shí)別和控制能力,不依賴于互聯(lián)網(wǎng)連接,同時(shí)具備靈活的應(yīng)用擴(kuò)展性。這種解決方案為各種智能設(shè)備提供了穩(wěn)定、高效和多語
    的頭像 發(fā)表于 06-26 18:12 ?494次閱讀
    離線<b class='flag-5'>語音</b><b class='flag-5'>控制</b>技術(shù)特點(diǎn)

    語音控制模塊_雷龍發(fā)展

      1,串口   uart串口控制模式,即異步傳送收發(fā)器,通過其完成語音控制。 []()   圖中,GND表示單片機(jī)系統(tǒng)電源的參考地,TXD是串行發(fā)送引腳,RXD是串行接收引腳。發(fā)送uart將來
    發(fā)表于 06-14 17:18

    智能語音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話

    智能語音交互技術(shù)是指通過語音識(shí)別、語音合成和自然語言理解等技術(shù),實(shí)現(xiàn)人與機(jī)器之間自然語言的交流和互動(dòng)。隨著現(xiàn)代人工智能在各行業(yè)的普及,智能語音交互技術(shù)也越來越多的在日常工作、生活中應(yīng)用
    的頭像 發(fā)表于 05-23 15:14 ?383次閱讀

    基于ASR-PRO離線語音芯片,DIY一個(gè)轉(zhuǎn)動(dòng)的語音控制的月球音響燈

    功能介紹 1、支持語音控制月球燈的底座旋轉(zhuǎn)、3Wled燈片的亮滅。 2、外掛藍(lán)牙音頻模塊,手機(jī)連接藍(lán)牙即可播放音樂。 配置介紹 1、ASR-PRO離線語音模塊(核心板) 2、藍(lán)牙音頻接受模塊
    發(fā)表于 05-20 14:45

    MCU配對(duì)簡化了語音控制接口設(shè)計(jì)

    攜手合作,為STM32微控制器的嵌入語音識(shí)別創(chuàng)建了一個(gè)完整的軟件、硬件和許可包,并使添加語音接口變得簡單。 它還將使設(shè)計(jì)工程師能夠在沒有編
    的頭像 發(fā)表于 05-06 16:21 ?2112次閱讀

    澎湃微離線語音識(shí)別應(yīng)用實(shí)例

    隨著科技的飛速發(fā)展,人機(jī)交互的方式也在不斷演變。在鍵盤、觸摸屏之后,語音識(shí)別技術(shù)正逐漸成為人機(jī)交互的新寵。從技術(shù)路線上來講語音識(shí)別又分為在線語音
    發(fā)表于 03-15 14:11 ?430次閱讀
    澎湃微離線<b class='flag-5'>語音</b>識(shí)別應(yīng)用實(shí)例

    語音合成技術(shù)在智能駕駛中的創(chuàng)新與應(yīng)用

    一、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,人機(jī)交互變得越來越重要。語音合成技術(shù)作為人機(jī)交互的重要手段,在智能駕駛中發(fā)揮著越來越重要的作用。本文將探討語音合成技術(shù)在智能駕駛中的創(chuàng)新與應(yīng)用,并
    的頭像 發(fā)表于 02-01 18:09 ?666次閱讀

    AI加速智能家居分布式語音技術(shù)發(fā)展

    中的任何地方通過語音命令來控制智能設(shè)備,實(shí)現(xiàn)更具有體驗(yàn)性的居家生活。 ? 什么是分布式語音技術(shù)? ? 分布式語音技術(shù),也稱為DSR(Dist
    的頭像 發(fā)表于 02-01 00:16 ?5822次閱讀

    恩智浦發(fā)布新一代智能語音技術(shù)組合的語音識(shí)別引擎

    恩智浦發(fā)布新一代智能語音技術(shù)組合的語音識(shí)別引擎。本文將探討開發(fā)人員在嵌入語音控制設(shè)計(jì)中面臨的挑戰(zhàn)、恩智浦新的Speech to Inten
    的頭像 發(fā)表于 01-26 09:15 ?769次閱讀
    恩智浦發(fā)布新一代智能<b class='flag-5'>語音</b>技術(shù)組合的<b class='flag-5'>語音</b>識(shí)別引擎

    語音數(shù)據(jù)集在智能語音搜索中的應(yīng)用與挑戰(zhàn)

    一、引言 隨著互聯(lián)網(wǎng)的普及和移動(dòng)設(shè)備的興起,智能語音搜索已經(jīng)成為人們獲取信息的重要方式之一。智能語音搜索通過語音交互的方式,為用戶提供更加便捷、高效的信息查詢服務(wù)。
    的頭像 發(fā)表于 01-18 15:09 ?561次閱讀