0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

離線自然說(shuō),無(wú)需記固定喚醒詞也能語(yǔ)音控制設(shè)備!

Carol Li ? 來(lái)源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-04-29 09:12 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)離線語(yǔ)音識(shí)別是指不需要依賴網(wǎng)絡(luò),在本地設(shè)備實(shí)現(xiàn)語(yǔ)音識(shí)別的過(guò)程,通常以端側(cè)AI語(yǔ)音芯片作為載體來(lái)進(jìn)行數(shù)據(jù)的采集、計(jì)算和決策。

離線語(yǔ)音識(shí)別技術(shù)在諸多領(lǐng)域都具有廣泛的應(yīng)用前景,如用戶可以通過(guò)語(yǔ)音控制智能家居設(shè)備,實(shí)現(xiàn)燈光、空調(diào)、電視等的自動(dòng)化操作;在醫(yī)療設(shè)備領(lǐng)域,離線語(yǔ)音識(shí)別技術(shù)可以用于控制輪椅、病床等設(shè)備,為行動(dòng)不便的患者提供便利;在車載系統(tǒng)中,離線語(yǔ)音識(shí)別技術(shù)可以實(shí)時(shí)識(shí)別駕駛者的語(yǔ)音指令,確保駕駛安全。

但是語(yǔ)音芯片的存儲(chǔ)空間有限,通過(guò)傳統(tǒng)的語(yǔ)音算法技術(shù),最多也只能存儲(chǔ)數(shù)百條詞條,導(dǎo)致用戶只能使用固定的詞條來(lái)控制設(shè)備,大大降低了用戶與設(shè)備之間的語(yǔ)音交互體驗(yàn)。

離線自然說(shuō),解決當(dāng)前語(yǔ)音識(shí)別痛點(diǎn)

近日,在啟英泰倫最新語(yǔ)音方案發(fā)布及技術(shù)交流會(huì)上,該公司技術(shù)支持總監(jiān)孫振奎介紹了啟英泰倫推出的一種輕量級(jí)NLP技術(shù)——離線自然說(shuō)。

它的實(shí)現(xiàn)原理是,通過(guò)語(yǔ)義協(xié)議和語(yǔ)音識(shí)別構(gòu)圖結(jié)合,在進(jìn)行語(yǔ)音識(shí)別同時(shí)對(duì)指令包含的意圖和槽位進(jìn)行解析(NLU),實(shí)現(xiàn)設(shè)備功能語(yǔ)音指令的理解和泛化。并且支持同時(shí)生成控制指令和反饋播報(bào),完成識(shí)別、理解、播報(bào)的閉環(huán)。通過(guò)矩陣分解、權(quán)重共享等技術(shù),保持低資源提高建模能力,支持說(shuō)法突破萬(wàn)種。

據(jù)孫振奎介紹,離線自然說(shuō),可以很好地解決當(dāng)前語(yǔ)音識(shí)別的諸多痛點(diǎn),如需要聯(lián)網(wǎng)、不會(huì)說(shuō)、記不住詞、反應(yīng)慢、詞條太少、普通話不標(biāo)準(zhǔn)、經(jīng)常掉線等。離線自然說(shuō)的價(jià)值在于,用戶無(wú)需記憶固定詞條,只需知道功能和喚醒詞,即可語(yǔ)音控制設(shè)備,真正做到了自然、方便的人機(jī)交互。

59733f9a1f0549c1af9b402e7c29b478~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240429091209D914799B7E0B2D69E2BE&x-expires=2147483647&x-signature=7XZFUiUWMrX4sOJACwtFzmrDWlM%3D

具體來(lái)看,用戶如果通過(guò)傳統(tǒng)離線語(yǔ)音交互來(lái)打開空調(diào),他只能說(shuō):“打開空調(diào)”。而如果通過(guò)離線自然說(shuō)來(lái)打開空調(diào),他可以說(shuō):“打開空調(diào)”、“幫我開空調(diào)”、“空調(diào)打開吧”、“開一下空調(diào)”、“我要開空調(diào)”、“空調(diào)開啟”、“啟動(dòng)空調(diào)”、“吹空調(diào)”……

啟英泰倫認(rèn)為,相對(duì)于手機(jī)APP/小程序、紅外遙控器、觸摸按鍵等傳統(tǒng)控制方式而言,自然化的語(yǔ)音交互更便捷、更高效、更人性化。

目前,啟英泰倫離線自然說(shuō)方案,已經(jīng)在在風(fēng)扇、吸頂燈、空調(diào)、茶吧機(jī)、油煙機(jī)、空調(diào)伴侶、窗簾電機(jī)、晾曬機(jī)、風(fēng)扇燈等上完成應(yīng)用,在風(fēng)扇、取暖器上的應(yīng)用已經(jīng)非常成熟。另外,離線自然說(shuō)方案在洗衣機(jī)、馬桶、按摩椅、浴霸、微波爐等上的應(yīng)用也在開發(fā)中。

不斷迭代的語(yǔ)音芯片及全鏈條語(yǔ)音算法技術(shù)

啟英泰倫是一家集語(yǔ)音芯片、語(yǔ)音算法、應(yīng)用方案、開發(fā)平臺(tái)于一體的語(yǔ)音解決方案供應(yīng)商。其芯片產(chǎn)品已歷經(jīng)三次大迭代,四次小迭代,共計(jì)推出15款型號(hào)的智能語(yǔ)音芯片,涵蓋AI語(yǔ)音芯片,AI語(yǔ)音Wi-Fi芯片,AI語(yǔ)音BLE芯片,形成系列化的芯片產(chǎn)品布局。

公司芯片產(chǎn)品現(xiàn)已廣泛應(yīng)用于智慧家居家電、智慧養(yǎng)老、智慧穿戴、智慧醫(yī)療、智慧酒店、智慧安防、智慧教育、智慧汽車和機(jī)器人等領(lǐng)域,服務(wù)客戶超過(guò)5000家。

從發(fā)展歷程來(lái)看,2016年,啟英泰倫首度提出腦神經(jīng)網(wǎng)絡(luò)處理器(BNPU),發(fā)布全球首款A(yù)I語(yǔ)音芯片CI1006;2017年AI語(yǔ)音芯片進(jìn)入家電巨頭美的供應(yīng)體系,支持英文語(yǔ)音識(shí)別;2018年發(fā)布1.5代AI語(yǔ)音芯片,性能不變,成本降低30%;2019年發(fā)布高性價(jià)比2代AI語(yǔ)音芯片(搭載BNPU V2),上線語(yǔ)音AI開發(fā)平臺(tái);2020年發(fā)布2.5代AI語(yǔ)音芯片,成本更低,支持日文等小語(yǔ)種語(yǔ)音識(shí)別;

2021年離線NLP算法取得突破,深度人聲分離算法取得突破;2022年量產(chǎn)3代AI語(yǔ)音芯片、AI語(yǔ)音Wi-Fi Combo芯片(搭載BNPU V3),算法算力登上新臺(tái)階;2023年AIOT方案成熟,推出AI語(yǔ)音BLE芯片Cl231,預(yù)推出語(yǔ)音MCU芯片Cl132。

啟英泰倫第三代CI13系列是一款極具性價(jià)比的離線AI語(yǔ)音芯片,包含CI1301、CI1302、CI1303、CI1306、CI1311、CI1312六款型號(hào),據(jù)稱其年裝機(jī)達(dá)數(shù)千萬(wàn)臺(tái)。

CI13系列基于啟英泰倫自研BNPU 3.0,系統(tǒng)主頻最高可達(dá)240MHz,內(nèi)置高達(dá)640KByte SRAM,集成PMU電源管理單元和RC振蕩器,集成雙通道高性能低功耗Audio Codec和多路UART、IIC、IIS、PWM、GPIO、PDM等外圍控制接口。芯片僅需少量電阻電容等外圍器件就可以實(shí)現(xiàn)各類智能語(yǔ)音產(chǎn)品硬件方案,性價(jià)比極高。

e98fe0f9a3254f6e9e7fce530e7e9bad~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240429091209D914799B7E0B2D69E2BE&x-expires=2147483647&x-signature=ApbzjtogJXReJM4ZkHv4zWbIkBY%3D

CI13系列具有強(qiáng)大的自然語(yǔ)言交互能力,70dB噪聲下,可以做到85%識(shí)別率及90%喚醒率(降噪模式),命令詞數(shù)支持10001+詞條,支持離線自然說(shuō)。

在語(yǔ)音算法上,啟英泰倫擁有完全自主知識(shí)產(chǎn)權(quán)的語(yǔ)音交互技術(shù)鏈條,包括語(yǔ)音識(shí)別、語(yǔ)音增強(qiáng)、深度降噪、回聲消除、低功耗喚醒、本地語(yǔ)義理解、聲紋識(shí)別、本地命令詞自學(xué)習(xí)等語(yǔ)音算法。

此次交流會(huì)上,孫振奎還介紹了啟英泰倫的多個(gè)語(yǔ)音算法。如,聲紋識(shí)別,基于特定詞條的聲紋識(shí)別,可以通過(guò)注冊(cè)聲紋來(lái)區(qū)分講話人,從而提供定制化的服務(wù),如場(chǎng)景1:注冊(cè)成人聲紋,防止小孩不當(dāng)操作導(dǎo)致危險(xiǎn);場(chǎng)景2:不同的人說(shuō)“打開空調(diào)”,自動(dòng)設(shè)置為不同人喜歡的模式,溫度,檔位等。

男女性別識(shí)別,基于聲音特征,區(qū)分男女性別,進(jìn)行不同的定制化功能開發(fā),如識(shí)別到性別后,進(jìn)行不同聲音的播放;部分產(chǎn)品對(duì)性別有要求的,可以進(jìn)行性別識(shí)別并進(jìn)行個(gè)性化展示:例如智能馬桶的洗潔方式。

特定聲音檢測(cè),如鼾聲識(shí)別:可用于智能床墊,智能枕頭;嬰兒哭聲識(shí)別:嬰兒監(jiān)護(hù)產(chǎn)品,嬰兒搖搖床等。

寫在最后

用過(guò)語(yǔ)音控制產(chǎn)品的朋友們可能都知道,目前市面上大多數(shù)產(chǎn)品都需要精準(zhǔn)通過(guò)喚醒詞控制,然而如果一個(gè)設(shè)備一段時(shí)間沒(méi)使用,或者其中一些喚醒詞長(zhǎng)時(shí)間沒(méi)用過(guò),當(dāng)突然需要使用的時(shí)候,會(huì)忘記這個(gè)詞,而無(wú)法順利控制設(shè)備。而且對(duì)于一些功能較復(fù)雜的設(shè)備,需要記大量的喚醒詞,稍有偏差都可能難以控制。而離線自然說(shuō)算法技術(shù),則打破了傳統(tǒng)離線語(yǔ)音識(shí)別的這種局限性,只需要說(shuō)出大意,設(shè)備就能聽懂,互動(dòng)更為高效。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31262

    瀏覽量

    269617
  • 智能家居
    +關(guān)注

    關(guān)注

    1928

    文章

    9588

    瀏覽量

    185765
  • 語(yǔ)音控制
    +關(guān)注

    關(guān)注

    5

    文章

    484

    瀏覽量

    28271
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    489

    瀏覽量

    22064
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    啟英泰倫新推出多意圖自然說(shuō),重塑離線人機(jī)交互新標(biāo)準(zhǔn)!

    自然說(shuō)多意圖自然說(shuō)是啟英泰倫新推出的一種離線NLP處理技術(shù),該技術(shù)突破以往一次只能說(shuō)一個(gè)命令的限制,可同時(shí)配置多個(gè)命令
    的頭像 發(fā)表于 01-03 16:01 ?157次閱讀
    啟英泰倫新推出多意圖<b class='flag-5'>自然</b><b class='flag-5'>說(shuō)</b>,重塑<b class='flag-5'>離線</b>人機(jī)交互新標(biāo)準(zhǔn)!

    離線語(yǔ)音芯片讓家電變得智能

    無(wú)需聯(lián)網(wǎng)能進(jìn)行語(yǔ)音控制,這對(duì)于家居類的某些設(shè)備來(lái)說(shuō),更為合適。今天主要來(lái)講一講九芯電子可三款離線
    的頭像 發(fā)表于 11-27 01:00 ?195次閱讀
    <b class='flag-5'>離線</b><b class='flag-5'>語(yǔ)音</b>芯片讓家電變得智能

    離線語(yǔ)音芯片讓家電變得智能

    九芯電子推出三款離線語(yǔ)音芯片NRK330X、NRK3502、NRK3603,具備無(wú)需聯(lián)網(wǎng)、響應(yīng)快等優(yōu)勢(shì),適用于智能家居等領(lǐng)域,提供精準(zhǔn)語(yǔ)音識(shí)別體驗(yàn),助力物聯(lián)網(wǎng)
    的頭像 發(fā)表于 11-26 15:08 ?198次閱讀
    <b class='flag-5'>離線</b><b class='flag-5'>語(yǔ)音</b>芯片讓家電變得智能

    智能語(yǔ)音開關(guān):離線控制,守護(hù)隱私的新選擇

    智能家居依賴網(wǎng)絡(luò),智能音箱成入口。但隱私泄露成問(wèn)題,離線智能產(chǎn)品應(yīng)運(yùn)而生。九芯電子采用NRK3502離線語(yǔ)音芯片,實(shí)現(xiàn)精準(zhǔn)語(yǔ)音控制,守護(hù)用戶
    的頭像 發(fā)表于 11-22 13:37 ?260次閱讀
    智能<b class='flag-5'>語(yǔ)音</b>開關(guān):<b class='flag-5'>離線</b><b class='flag-5'>控制</b>,守護(hù)隱私的新選擇

    離線語(yǔ)音控制模塊,讓生活更懂你!

    離線語(yǔ)音模塊方案在智能家居、醫(yī)療設(shè)備等領(lǐng)域的開發(fā)正日益受到重視。這種方案無(wú)需網(wǎng)絡(luò)連接,即可實(shí)現(xiàn)語(yǔ)音指令的識(shí)別與執(zhí)行,為用戶提供了更加便捷、高
    的頭像 發(fā)表于 11-02 08:07 ?261次閱讀
    <b class='flag-5'>離線</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>控制</b>模塊,讓生活更懂你!

    離線語(yǔ)音控制芯片:提升家居生活便捷性,舒適度的智能原件

    離線語(yǔ)音控制芯片是一種集成了語(yǔ)音識(shí)別與處理功能的微型電子元件,它能夠在不依賴網(wǎng)絡(luò)連接的情況下,實(shí)現(xiàn)對(duì)特定語(yǔ)音指令的識(shí)別與執(zhí)行,?
    的頭像 發(fā)表于 10-31 15:42 ?196次閱讀
    <b class='flag-5'>離線</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>控制</b>芯片:提升家居生活便捷性,舒適度的智能原件

    用“說(shuō)”智能控制燈具開關(guān)語(yǔ)音識(shí)別芯片NRK3603

    用“說(shuō)”智能控制燈具開關(guān)是一種基于語(yǔ)音識(shí)別技術(shù)的智能家居設(shè)備,它通過(guò)內(nèi)置的語(yǔ)音識(shí)別芯片,利用離線
    的頭像 發(fā)表于 09-07 09:26 ?400次閱讀
    用“<b class='flag-5'>說(shuō)</b>”智能<b class='flag-5'>控制</b>燈具開關(guān)<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片NRK3603

    HLK-V20支持用戶修改喚醒和命令 海凌科語(yǔ)音定制后臺(tái)系統(tǒng)上線

    離線語(yǔ)音模塊物美價(jià)廉,單價(jià)低、開發(fā)簡(jiǎn)單且性能良好,但是其最大的遺憾在于其語(yǔ)音命令喚醒
    的頭像 發(fā)表于 07-28 08:38 ?706次閱讀
    HLK-V20支持用戶修改<b class='flag-5'>喚醒</b><b class='flag-5'>詞</b>和命令<b class='flag-5'>詞</b> 海凌科<b class='flag-5'>語(yǔ)音</b>定制后臺(tái)系統(tǒng)上線

    什么是離線語(yǔ)音識(shí)別芯片?與在線語(yǔ)音識(shí)別的區(qū)別

    離線語(yǔ)音識(shí)別芯片適用于智能家電等,特點(diǎn)為小詞匯量、低成本、安全性高、響應(yīng)快,無(wú)需聯(lián)網(wǎng)。在線語(yǔ)音識(shí)別功能更廣泛、識(shí)別準(zhǔn)確率高,但依賴穩(wěn)定網(wǎng)絡(luò)。
    的頭像 發(fā)表于 07-22 11:33 ?435次閱讀

    離線語(yǔ)音控制技術(shù)特點(diǎn)

    離線語(yǔ)音控制通過(guò)結(jié)合高性能的音頻前端處理算法和本地AI模型實(shí)現(xiàn)了高效的語(yǔ)音識(shí)別和控制能力,不依賴于互聯(lián)網(wǎng)連接,同時(shí)具備靈活的應(yīng)用擴(kuò)展性。這種
    的頭像 發(fā)表于 06-26 18:12 ?525次閱讀
    <b class='flag-5'>離線</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>控制</b>技術(shù)特點(diǎn)

    十萬(wàn)級(jí)口語(yǔ)識(shí)別,離線自然說(shuō)技術(shù)讓智能照明更懂你

    在智能照明中,語(yǔ)音控制因其便捷性而備受青睞。然而,傳統(tǒng)的離線語(yǔ)音控制方式存在諸多局限,如支持的詞條數(shù)量有限、用戶需要記憶
    的頭像 發(fā)表于 04-30 08:15 ?408次閱讀
    十萬(wàn)級(jí)口語(yǔ)識(shí)別,<b class='flag-5'>離線</b><b class='flag-5'>自然</b><b class='flag-5'>說(shuō)</b>技術(shù)讓智能照明更懂你

    **十萬(wàn)級(jí)口語(yǔ)識(shí)別,離線自然說(shuō)技術(shù),讓智能照明更懂你**

    固定詞條等。針對(duì)這些問(wèn)題,啟英泰倫現(xiàn)已推出成熟的可應(yīng)用于照明設(shè)備離線自然說(shuō)方案,該方案已在多家智能照明廠商最新產(chǎn)品上實(shí)現(xiàn)應(yīng)用落地。 照明
    發(fā)表于 04-29 17:09

    澎湃微離線語(yǔ)音識(shí)別應(yīng)用實(shí)例

    隨著科技的飛速發(fā)展,人機(jī)交互的方式在不斷演變。在鍵盤、觸摸屏之后,語(yǔ)音識(shí)別技術(shù)正逐漸成為人機(jī)交互的新寵。從技術(shù)路線上來(lái)講語(yǔ)音識(shí)別又分為在線語(yǔ)音
    發(fā)表于 03-15 14:11 ?460次閱讀
    澎湃微<b class='flag-5'>離線</b><b class='flag-5'>語(yǔ)音</b>識(shí)別應(yīng)用實(shí)例