在阿里巴巴以天貓精靈的智能音箱為核心載體,大舉進(jìn)軍智能家居市場(chǎng)的形勢(shì)下,也許帶給業(yè)界的有兩點(diǎn)思考:智能家居正在被巨頭帶熱,智能語音在智能家居的重要性突顯。
智能語音分為離線語音、在線語音以及離線+在線三種。電子發(fā)燒友網(wǎng)記者從最近的行業(yè)走訪來看,離線語音的智能家居方案正在興起,并在智能家居的單品和全屋智能中大力出貨。
提升智能單品、智能家居的智能化和體驗(yàn)
智能語音晾衣架是一個(gè)比較火爆的單品,智能語音晾衣架品牌主要有好太太、晾霸、曬霸、邦先生等等。電子發(fā)燒友網(wǎng)記者從渠道了解到,晾衣架企業(yè)正在將部分傳統(tǒng)晾衣架產(chǎn)品逐漸轉(zhuǎn)向智能語音,以提升產(chǎn)品的價(jià)值和智能使用體驗(yàn)。
中國(guó)建筑裝飾裝修材料協(xié)會(huì)晾衣架專委會(huì)數(shù)據(jù)顯示,2017 年我國(guó)電動(dòng)(智能)晾衣架出貨量約為 350 萬臺(tái),連續(xù)兩年增速接近 100%,增長(zhǎng)迅速,預(yù)計(jì)未來隨著用戶認(rèn)知度提升,智能晾衣架滲透率也有望快速提升。
在采訪中,電子發(fā)燒友記者看到智品惠推出的一款離線語音淋浴屏,在流水聲等嘈雜環(huán)境下仍能夠控制自如,還可用方言進(jìn)行編輯。智品惠科技總經(jīng)理李希途表示,離線語音已經(jīng)成為家居市場(chǎng)的一個(gè)新選擇,以其更快速的響應(yīng)、更親民的價(jià)格,新穎的產(chǎn)品形態(tài)滿足市場(chǎng)的需求。
實(shí)際上,全屋智能的控制類產(chǎn)品都是離線語音的主戰(zhàn)場(chǎng)。阿凡達(dá)智控總經(jīng)理馮惠軍博士在接受電子發(fā)燒友網(wǎng)采訪時(shí)表示,離線主打控制,在線主打交互,是目前智能家居落地比較親民的一種模式,從市場(chǎng)端他們也感受到這股熱潮。
阿凡達(dá)的離線語音方案可控制家居的照明、空調(diào)、電視、窗簾等物品的開關(guān),其控制時(shí)間最短僅需0.2秒,相較在線語音的體驗(yàn),交互效率大大提升。這個(gè)離線語音模塊能夠以智能音箱的形式獨(dú)立存在,成為家居的中控,也可以安裝在例如臺(tái)燈、吸頂燈等家居用品上,十分方便。
阿凡達(dá)提供了一套離線語音全屋智控生態(tài)系統(tǒng),涵蓋以小寶精靈為中心,通過匹配紅外家電遙控器實(shí)現(xiàn)傳統(tǒng)家電的聲控,通過配套RF智能單火開關(guān)面板、RF隨意貼無線開關(guān)、RF智能插座、RF通斷器、RF開合窗簾等功能拓展設(shè)備,實(shí)現(xiàn)了照明、家電、遮陽管理、電源管理等由離線語音打造的全屋智能生態(tài)。
不同于在線語音交互對(duì)云端的依賴,離線語音技術(shù)可以讓設(shè)備本身具有交互能力。優(yōu)勢(shì)是無需網(wǎng)絡(luò),無需APP,無需布線,插電即用,本地識(shí)別,輕松喚醒,反應(yīng)靈敏,后續(xù)維護(hù)服務(wù)少等。馮博士認(rèn)為,離線語音的特性滿足了用戶對(duì)家居控制的基本需求,成本低易于推廣,這個(gè)市場(chǎng)處于爆發(fā)的前期。
從渠道反饋來看,以單品看,目前離線語音控制空調(diào)的智能插座出貨量比較大。智能家居、酒店、民宿等市場(chǎng)對(duì)離線語音的需求正在放量。
離線語音方案有哪些?
前不久,Google推出了Google Local Home SDK,通過邊緣計(jì)算在本地進(jìn)行語音識(shí)別,不用在云端處理。電子發(fā)燒友網(wǎng)記者了解到,目前可實(shí)現(xiàn)離線語音方案的芯片包括啟英泰倫、國(guó)芯、思必馳、互問、新唐、君正等等。
啟英泰倫:人工智能語音芯片CI1006和最新CI110X系列
2016 年 9 月推出了全球首款人工智能語音識(shí)別芯片 CI1006,并于 2017 年 1 月實(shí)現(xiàn)量產(chǎn)。這是全球首款 DNN 處理器內(nèi)核人工智能語音芯片,具備高 NN 算力、高識(shí)別率、遠(yuǎn)距識(shí)別、快速響應(yīng)、超低功耗等特性。
2019年9月發(fā)布第二代語音 AI 芯片 CI110X 系列集成了更豐富的功能、擁有更強(qiáng)大的性能、同時(shí)具備更低的成本和功耗。
CI110X 系列基于 NPU+MCU 架構(gòu)設(shè)計(jì),內(nèi)置升級(jí)了的腦神經(jīng)網(wǎng)絡(luò)處理器 BNPU v2,并新增了語音加速傳感器。CPU 主頻也較上一代的 100 MHz 提升到了 160MHz。
同時(shí),CI110X 系列還內(nèi)置高性能低功耗 Audio Codec 模塊和硬件音頻處理模塊,可以外接麥克風(fēng)實(shí)現(xiàn)單芯片遠(yuǎn)場(chǎng)降噪和回聲消除等功能。同時(shí)該芯片還集成多路 UART、I2C、SPI、PWM、GPIO 等外圍控制接口,可以開發(fā)低成本的單芯片智能語音離線識(shí)別方案。
而通過內(nèi)置的高速 UART 或 SDIO 接口對(duì)接 Wi-Fi、藍(lán)牙等無線模塊,實(shí)現(xiàn)離在線語音方案。基于 CI110X 系列芯片開發(fā)的產(chǎn)品,語音交互的基本功能可通過離線語音實(shí)現(xiàn),而語音內(nèi)容和服務(wù)則可以通過聯(lián)網(wǎng)實(shí)現(xiàn)。
杭州國(guó)芯:GX8008和GX8009芯片
GX8008芯片是專為智能語音前端信號(hào)處理而設(shè)計(jì)的嵌入式SoC芯片,支持麥克風(fēng)陣列,集成專用于語音信號(hào)處理的DSP處理器,內(nèi)置處理前端信號(hào)的語音算法,可以讓傳統(tǒng)的設(shè)備保留其原先硬件的基礎(chǔ)上,通過一個(gè)簡(jiǎn)單的USB口實(shí)現(xiàn)語音能力的升級(jí)。獨(dú)特的待機(jī)模式,可以讓主機(jī)完全休眠,只用GX8008芯片來做降噪和激活,并恢復(fù)系統(tǒng)。
GX8009芯片是專為AI語音應(yīng)用設(shè)計(jì)的嵌入式SoC芯片,擁有獨(dú)特的多核異構(gòu)架構(gòu),集成自主產(chǎn)權(quán)的NPU神經(jīng)網(wǎng)絡(luò)處理器,用于語音信號(hào)處理的DSP處理器等模塊,使得產(chǎn)品能處理深度神經(jīng)網(wǎng)絡(luò)計(jì)算,離線運(yùn)行麥克風(fēng)陣列信號(hào)。GX8009芯片針對(duì)語音應(yīng)用產(chǎn)品進(jìn)行深度優(yōu)化,可運(yùn)用于多種形態(tài)的AI語音產(chǎn)品。
思必馳:深聰TAIHANG芯片(TH1520)
TH1520主要面向智能家居、智能終端、車載、手機(jī)、可穿戴設(shè)備等各類終端設(shè)備。解決方案包含算法+芯片,具有完整語音交互功能,能實(shí)現(xiàn)語音處理、語音識(shí)別、語音播報(bào)等功能,支持離線語音交互。
君正:Halley2 IoT模組
采用君正 X1000E 處理器,最高1GHz主頻,支持硬件浮點(diǎn),支持SIMD指令加速。可運(yùn)行各類語音識(shí)別、圖像識(shí)別、降噪、消回音、APE/FLAC解碼等算法。待機(jī)功耗2mW,平均運(yùn)行功耗200mW,最高運(yùn)行功耗700mW。支持WiFi、藍(lán)牙、以太網(wǎng)、LCD顯示、錄音、放音、攝像頭、SD卡、USB 2.0 OTG、I2C、UART等。超小模塊,鍍金半孔PCB板,可直接量產(chǎn),大大降低產(chǎn)品開發(fā)難度,縮短產(chǎn)品上市時(shí)間。硬件設(shè)計(jì)和軟件Linux SDK開源,便于客戶進(jìn)行二次開發(fā)。
互問:LS416、W02x
LS416 是一顆高度集成化的語音處理芯片,內(nèi)置互問離線語音識(shí)別引擎,支持多命令詞本地語音控制應(yīng)用。 內(nèi)置spi flash 和高性能codec,使用低成本輕量化神經(jīng)網(wǎng)絡(luò)語音處理單元,以及低功耗MCU,支持多種邏輯應(yīng)用開發(fā)。
互問W02x芯片 是一款高度集成的本地語音系統(tǒng)級(jí)芯片(SoC),自研基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的本地喚醒和前端降噪算法,無需額外license。支持多級(jí)喚醒和多個(gè)本地固定詞命令詞,支持多通道/多麥克回聲消除功能,可作為AEC前端處理+本地喚醒,支持I2S作為super codec使用。內(nèi)置深度定制的神經(jīng)網(wǎng)絡(luò)處理單元、邏輯控制單元,無需MCU處理簡(jiǎn)單邏輯。
新唐ISD9xxx系列:
此方案提供簡(jiǎn)單指令辨識(shí)與喇叭獨(dú)立語音識(shí)別,并可由用戶訓(xùn)練聽從指令,一旦辨識(shí)出指令,裝置就能在預(yù)先儲(chǔ)存在芯片上的閃存中的音頻提供音效。目前支持 9 種語言及多種方言。
在音訊功能部份,ISD9xxx系列包括一顆具備80dB SNR效能的Sigma-Delta ADC,搭配具有最高至56dB增益的可程式增益放大器(PGA),以直接連接麥克風(fēng)。音訊輸出是由能對(duì)8?喇叭輸出1W功率的差動(dòng)Class D放大器 (DPWM)所提供的。
ISD9160VI能提供對(duì)于少數(shù)字節(jié)的簡(jiǎn)單指令,例如開燈、關(guān)燈、退出、播放等語音辨識(shí),一旦辨識(shí)出指令(關(guān)鍵字),裝置就能在預(yù)先儲(chǔ)存在芯片上的快閃記憶體中的音訊提供音效。
根據(jù)Strategy Analytics最新發(fā)布的研究報(bào)告顯示,2019年,消費(fèi)者在智能家居相關(guān)硬件、服務(wù)和安裝費(fèi)用上的支出將達(dá)到1030億美元,預(yù)計(jì)到2023年將增長(zhǎng)至1570億美元。到2023年,21%將擁有遠(yuǎn)程監(jiān)控和控制,設(shè)備支出將占智能家居設(shè)備總支出的52%。未來,離線語音以及離線加在線語音等多種語音形式,將更加廣泛地應(yīng)用于智能家居、智能辦公等多種場(chǎng)景。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論