電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)離線語(yǔ)音識(shí)別是指不需要依賴網(wǎng)絡(luò),在本地設(shè)備實(shí)現(xiàn)語(yǔ)音識(shí)別的過(guò)程,通常以端側(cè)AI語(yǔ)音芯片作為載體來(lái)進(jìn)行數(shù)據(jù)的采集、計(jì)算和決策。
離線語(yǔ)音識(shí)別技術(shù)在諸多領(lǐng)域都具有廣泛的應(yīng)用前景,如用戶可以通過(guò)語(yǔ)音控制智能家居設(shè)備,實(shí)現(xiàn)燈光、空調(diào)、電視等的自動(dòng)化操作;在醫(yī)療設(shè)備領(lǐng)域,離線語(yǔ)音識(shí)別技術(shù)可以用于控制輪椅、病床等設(shè)備,為行動(dòng)不便的患者提供便利;在車載系統(tǒng)中,離線語(yǔ)音識(shí)別技術(shù)可以實(shí)時(shí)識(shí)別駕駛者的語(yǔ)音指令,確保駕駛安全。
但是語(yǔ)音芯片的存儲(chǔ)空間有限,通過(guò)傳統(tǒng)的語(yǔ)音算法技術(shù),最多也只能存儲(chǔ)數(shù)百條詞條,導(dǎo)致用戶只能使用固定的詞條來(lái)控制設(shè)備,大大降低了用戶與設(shè)備之間的語(yǔ)音交互體驗(yàn)。
離線自然說(shuō),解決當(dāng)前語(yǔ)音識(shí)別痛點(diǎn)
近日,在啟英泰倫最新語(yǔ)音方案發(fā)布及技術(shù)交流會(huì)上,該公司技術(shù)支持總監(jiān)孫振奎介紹了啟英泰倫推出的一種輕量級(jí)NLP技術(shù)——離線自然說(shuō)。
它的實(shí)現(xiàn)原理是,通過(guò)語(yǔ)義協(xié)議和語(yǔ)音識(shí)別構(gòu)圖結(jié)合,在進(jìn)行語(yǔ)音識(shí)別同時(shí)對(duì)指令包含的意圖和槽位進(jìn)行解析(NLU),實(shí)現(xiàn)設(shè)備功能語(yǔ)音指令的理解和泛化。并且支持同時(shí)生成控制指令和反饋播報(bào),完成識(shí)別、理解、播報(bào)的閉環(huán)。通過(guò)矩陣分解、權(quán)重共享等技術(shù),保持低資源提高建模能力,支持說(shuō)法突破萬(wàn)種。
據(jù)孫振奎介紹,離線自然說(shuō),可以很好地解決當(dāng)前語(yǔ)音識(shí)別的諸多痛點(diǎn),如需要聯(lián)網(wǎng)、不會(huì)說(shuō)、記不住詞、反應(yīng)慢、詞條太少、普通話不標(biāo)準(zhǔn)、經(jīng)常掉線等。離線自然說(shuō)的價(jià)值在于,用戶無(wú)需記憶固定詞條,只需知道功能和喚醒詞,即可語(yǔ)音控制設(shè)備,真正做到了自然、方便的人機(jī)交互。
具體來(lái)看,用戶如果通過(guò)傳統(tǒng)離線語(yǔ)音交互來(lái)打開空調(diào),他只能說(shuō):“打開空調(diào)”。而如果通過(guò)離線自然說(shuō)來(lái)打開空調(diào),他可以說(shuō):“打開空調(diào)”、“幫我開空調(diào)”、“空調(diào)打開吧”、“開一下空調(diào)”、“我要開空調(diào)”、“空調(diào)開啟”、“啟動(dòng)空調(diào)”、“吹空調(diào)”……
啟英泰倫認(rèn)為,相對(duì)于手機(jī)APP/小程序、紅外遙控器、觸摸按鍵等傳統(tǒng)控制方式而言,自然化的語(yǔ)音交互更便捷、更高效、更人性化。
目前,啟英泰倫離線自然說(shuō)方案,已經(jīng)在在風(fēng)扇、吸頂燈、空調(diào)、茶吧機(jī)、油煙機(jī)、空調(diào)伴侶、窗簾電機(jī)、晾曬機(jī)、風(fēng)扇燈等上完成應(yīng)用,在風(fēng)扇、取暖器上的應(yīng)用已經(jīng)非常成熟。另外,離線自然說(shuō)方案在洗衣機(jī)、馬桶、按摩椅、浴霸、微波爐等上的應(yīng)用也在開發(fā)中。
不斷迭代的語(yǔ)音芯片及全鏈條語(yǔ)音算法技術(shù)
啟英泰倫是一家集語(yǔ)音芯片、語(yǔ)音算法、應(yīng)用方案、開發(fā)平臺(tái)于一體的語(yǔ)音解決方案供應(yīng)商。其芯片產(chǎn)品已歷經(jīng)三次大迭代,四次小迭代,共計(jì)推出15款型號(hào)的智能語(yǔ)音芯片,涵蓋AI語(yǔ)音芯片,AI語(yǔ)音Wi-Fi芯片,AI語(yǔ)音BLE芯片,形成系列化的芯片產(chǎn)品布局。
公司芯片產(chǎn)品現(xiàn)已廣泛應(yīng)用于智慧家居家電、智慧養(yǎng)老、智慧穿戴、智慧醫(yī)療、智慧酒店、智慧安防、智慧教育、智慧汽車和機(jī)器人等領(lǐng)域,服務(wù)客戶超過(guò)5000家。
從發(fā)展歷程來(lái)看,2016年,啟英泰倫首度提出腦神經(jīng)網(wǎng)絡(luò)處理器(BNPU),發(fā)布全球首款A(yù)I語(yǔ)音芯片CI1006;2017年AI語(yǔ)音芯片進(jìn)入家電巨頭美的供應(yīng)體系,支持英文語(yǔ)音識(shí)別;2018年發(fā)布1.5代AI語(yǔ)音芯片,性能不變,成本降低30%;2019年發(fā)布高性價(jià)比2代AI語(yǔ)音芯片(搭載BNPU V2),上線語(yǔ)音AI開發(fā)平臺(tái);2020年發(fā)布2.5代AI語(yǔ)音芯片,成本更低,支持日文等小語(yǔ)種語(yǔ)音識(shí)別;
2021年離線NLP算法取得突破,深度人聲分離算法取得突破;2022年量產(chǎn)3代AI語(yǔ)音芯片、AI語(yǔ)音Wi-Fi Combo芯片(搭載BNPU V3),算法算力登上新臺(tái)階;2023年AIOT方案成熟,推出AI語(yǔ)音BLE芯片Cl231,預(yù)推出語(yǔ)音MCU芯片Cl132。
啟英泰倫第三代CI13系列是一款極具性價(jià)比的離線AI語(yǔ)音芯片,包含CI1301、CI1302、CI1303、CI1306、CI1311、CI1312六款型號(hào),據(jù)稱其年裝機(jī)達(dá)數(shù)千萬(wàn)臺(tái)。
CI13系列基于啟英泰倫自研BNPU 3.0,系統(tǒng)主頻最高可達(dá)240MHz,內(nèi)置高達(dá)640KByte SRAM,集成PMU電源管理單元和RC振蕩器,集成雙通道高性能低功耗Audio Codec和多路UART、IIC、IIS、PWM、GPIO、PDM等外圍控制接口。芯片僅需少量電阻電容等外圍器件就可以實(shí)現(xiàn)各類智能語(yǔ)音產(chǎn)品硬件方案,性價(jià)比極高。
CI13系列具有強(qiáng)大的自然語(yǔ)言交互能力,70dB噪聲下,可以做到85%識(shí)別率及90%喚醒率(降噪模式),命令詞數(shù)支持10001+詞條,支持離線自然說(shuō)。
在語(yǔ)音算法上,啟英泰倫擁有完全自主知識(shí)產(chǎn)權(quán)的語(yǔ)音交互技術(shù)鏈條,包括語(yǔ)音識(shí)別、語(yǔ)音增強(qiáng)、深度降噪、回聲消除、低功耗喚醒、本地語(yǔ)義理解、聲紋識(shí)別、本地命令詞自學(xué)習(xí)等語(yǔ)音算法。
此次交流會(huì)上,孫振奎還介紹了啟英泰倫的多個(gè)語(yǔ)音算法。如,聲紋識(shí)別,基于特定詞條的聲紋識(shí)別,可以通過(guò)注冊(cè)聲紋來(lái)區(qū)分講話人,從而提供定制化的服務(wù),如場(chǎng)景1:注冊(cè)成人聲紋,防止小孩不當(dāng)操作導(dǎo)致危險(xiǎn);場(chǎng)景2:不同的人說(shuō)“打開空調(diào)”,自動(dòng)設(shè)置為不同人喜歡的模式,溫度,檔位等。
男女性別識(shí)別,基于聲音特征,區(qū)分男女性別,進(jìn)行不同的定制化功能開發(fā),如識(shí)別到性別后,進(jìn)行不同聲音的播放;部分產(chǎn)品對(duì)性別有要求的,可以進(jìn)行性別識(shí)別并進(jìn)行個(gè)性化展示:例如智能馬桶的洗潔方式。
特定聲音檢測(cè),如鼾聲識(shí)別:可用于智能床墊,智能枕頭;嬰兒哭聲識(shí)別:嬰兒監(jiān)護(hù)產(chǎn)品,嬰兒搖搖床等。
寫在最后
用過(guò)語(yǔ)音控制產(chǎn)品的朋友們可能都知道,目前市面上大多數(shù)產(chǎn)品都需要精準(zhǔn)通過(guò)喚醒詞控制,然而如果一個(gè)設(shè)備一段時(shí)間沒(méi)使用,或者其中一些喚醒詞長(zhǎng)時(shí)間沒(méi)用過(guò),當(dāng)突然需要使用的時(shí)候,會(huì)忘記這個(gè)詞,而無(wú)法順利控制設(shè)備。而且對(duì)于一些功能較復(fù)雜的設(shè)備,需要記大量的喚醒詞,稍有偏差都可能難以控制。而離線自然說(shuō)算法技術(shù),則打破了傳統(tǒng)離線語(yǔ)音識(shí)別的這種局限性,只需要說(shuō)出大意,設(shè)備就能聽懂,互動(dòng)更為高效。
-
AI
+關(guān)注
關(guān)注
87文章
31262瀏覽量
269617 -
智能家居
+關(guān)注
關(guān)注
1928文章
9588瀏覽量
185765 -
語(yǔ)音控制
+關(guān)注
關(guān)注
5文章
484瀏覽量
28271 -
nlp
+關(guān)注
關(guān)注
1文章
489瀏覽量
22064
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論