一年一度的Cadence CDNLive中國用戶大會2018于8月10日在上海浦東嘉里大酒店開幕,作為Cadence的戰(zhàn)略級合作伙伴,聲智科技帶著全新的DSP低功耗語音交互方案出席了此次大會。
CDNLive大會是由Cadence公司舉辦的一年一度的全球巡回用戶大會。從今年4月由美國硅谷伊始,覆蓋德國、日本、***、印度、以色列等七大地區(qū)和國家。大會以“聯(lián)結(jié)、分享、啟發(fā)”為主題,行業(yè)巨頭、技術(shù)用戶、業(yè)界頂尖開發(fā)者與業(yè)界專家都將聚集于此,共同分享高階工藝芯片、復(fù)雜SoC和系統(tǒng)設(shè)計的技術(shù)和理念,為行業(yè)的發(fā)展提供靈感和啟發(fā)。對于科技行業(yè)來說,這個集會可謂是一年一度最大的盛典。
2017年聲智科技與Cadence建立了戰(zhàn)略合作關(guān)系,開始為CadenceTensilicaDSP系列產(chǎn)品研發(fā)設(shè)計低功耗遠(yuǎn)場智能語音交互解決方案。本次Cadence CDNLive中國用戶大會上,聲智科技展示了基于Cadence Tensilica Fusion和HiFi DSP設(shè)計的融合遠(yuǎn)場語音交互和遠(yuǎn)場實(shí)時通話技術(shù)的SoundAI Voice Kit智能語音交互系統(tǒng)。
融合遠(yuǎn)場語音交互和遠(yuǎn)場實(shí)時通話技術(shù)的SoundAI Voice Kit(以下簡稱SVK)是一款為手機(jī)、智能機(jī)器人、智能電視、機(jī)頂盒、機(jī)頂盒等消費(fèi)電子產(chǎn)品和IOT產(chǎn)品提供低功耗的遠(yuǎn)場語音喚醒,語音識別,語音控制,語音搜索,遠(yuǎn)場聲紋識別,遠(yuǎn)場實(shí)時通話(VoIP)等功能的理想軟件解決方案。
(1)滿足低功耗需求
隨著亞馬遜Echo、谷歌Google Home,阿里天貓精靈、小米小愛同學(xué)等產(chǎn)品在市場上大獲成功,支持遠(yuǎn)場語音交互的智能設(shè)備越來越普及。遠(yuǎn)場智能語音交互勢必是未來人機(jī)交互的新趨勢。智能語音交互必然會推動消費(fèi)電子品、物聯(lián)網(wǎng)的革命,包括如汽車、家用設(shè)備,手機(jī)以及可穿戴設(shè)備。然而,耗能過高的困擾一直是制約物聯(lián)網(wǎng)發(fā)展。
本次大會推出的SVK智能語音交互系統(tǒng)提供的遠(yuǎn)場語音喚醒算法,具有低功耗的特點(diǎn),可以保證SoC和系統(tǒng)成本,也可以滿足家居和移動場景的不同需求。該算法計算量少,計算復(fù)雜度低,占CPU內(nèi)存小,但是語音交互的順暢度不打折。
該算法搭載了最新的Voice Activity Detection技術(shù),可拾取環(huán)境語音以檢測和響應(yīng)喚醒詞或觸發(fā)命令,通過關(guān)鍵字檢測支持低功耗實(shí)時監(jiān)聽,實(shí)現(xiàn)低功耗遠(yuǎn)場語音喚醒功能。而且針對可能出現(xiàn)的多線程同時工作場景,也可以隨時喚醒識別,不影響人機(jī)交流自然順暢的體驗(yàn),只為語音交互帶來方便,不增加重量。在手機(jī)上應(yīng)用,可實(shí)現(xiàn)鎖屏喚醒、多任務(wù)喚醒、遠(yuǎn)場聲紋喚醒等功能。
該遠(yuǎn)場語音喚醒算法可實(shí)現(xiàn)五米之內(nèi)95%以上的喚醒率,支持Duel-wake(雙名喚醒)、Free-cut(隨時打斷、隨時喚醒)、One-shot(一句連控)的功能。目前,小米、百度、阿里、騰訊、華為、聯(lián)想、獵豹移動等公司均采用聲智科技提供的遠(yuǎn)場語音喚醒技術(shù)。
Dual-wake(雙名喚醒),即喚醒詞不再是單一的一個,設(shè)備可以擁有兩個名字,使用任意一個名字都可以將其喚醒并進(jìn)行無差別的操作,這樣的設(shè)計與改進(jìn)為設(shè)備后期功能擴(kuò)展以及實(shí)現(xiàn)智能家電之間的聯(lián)動留下了空間。
Free-cut(隨時打斷、隨時喚醒)技術(shù)可以讓設(shè)備任意時刻終止當(dāng)前任務(wù),立即響應(yīng)新的用戶需求,這就實(shí)現(xiàn)了連續(xù)喚醒執(zhí)行新的命令,而無需等待上一任務(wù)完成后響應(yīng),隨叫隨應(yīng)。
One-shot(一句連控),采用“喚醒詞+語音語義識別”一體化方式,實(shí)現(xiàn)喚醒詞與語音操控之間無縫對接,用戶叫了設(shè)備的名字后無需等待設(shè)備應(yīng)答就可以直接說出命令,無需等待設(shè)備回應(yīng)“誒”、“我在”等之后才能說出命令,響應(yīng)速度更快,更加符合人類語音交互習(xí)慣。
(2)匹配復(fù)雜場景
隨著智能語音設(shè)備應(yīng)用場景的增加,由近場語音交互過渡到遠(yuǎn)場語音交互,場景中的噪聲種類越來越多,越來越復(fù)雜,對于語音交互的要求也越來越高。針對可能出現(xiàn)的極端噪聲場景,本次推出的SoundAI Voice Kit智能語音交互系統(tǒng)也進(jìn)行了定制優(yōu)化。
集成通話降噪、混響抑制、回聲抵消、噪聲抑制、波束形成、增益控制等噪聲抑制技術(shù),針對遠(yuǎn)場語音交互所處的復(fù)雜應(yīng)用場景,定制了OpenAEC算法,可以解決弱參考信號或者無參考信號等更為復(fù)雜場景的回聲抵消(自噪聲抑制)問題,可實(shí)現(xiàn)更加精準(zhǔn)的喚醒。
同時搭載了針對智能家居、辦公環(huán)境、車載等場景的抗強(qiáng)噪喚醒算法(AKS技術(shù)),保證在噪聲環(huán)境中,也實(shí)現(xiàn)精準(zhǔn)的遠(yuǎn)場語音喚醒。在車載環(huán)境中,針對主副駕駛的方向性降噪問題,通過麥克風(fēng)陣列波束成型技術(shù)在主方向語音不失真的前提下,有效去除空調(diào)、胎噪等平穩(wěn)噪聲,平穩(wěn)噪聲抑制量大于30dB。
并在保護(hù)主方向語音的同時,去除環(huán)境中的語音、車載娛樂設(shè)施等非穩(wěn)態(tài)噪聲的干擾。其中非穩(wěn)態(tài)噪聲抑制量大于20dB,在噪音環(huán)境下可以大幅提升遠(yuǎn)場語音喚醒和識別率。解決行車過程中,主駕駛與智能語音設(shè)備語音交互易受干擾的問題,確保準(zhǔn)確識別主駕駛方向的指令,抑制其他方向噪聲。
針對家庭場景下,易出現(xiàn)的大電視噪聲、音響噪聲等非穩(wěn)態(tài)噪聲,聲智推出了
家庭非穩(wěn)態(tài)噪聲抑制技術(shù)、垂直抗強(qiáng)噪識別技術(shù),專門匹配相應(yīng)場景,帶來更出色的遠(yuǎn)場交互體驗(yàn),無懼環(huán)境,想說就說,聲隨心動,保證遠(yuǎn)場語音交互的完美體驗(yàn)。
(3)快速開發(fā)集成
聲智科技推出的融合遠(yuǎn)場語音交互和遠(yuǎn)場實(shí)時通話技術(shù)的SoundAI Voice Kit是眾多audio/voice/speech軟硬件合作伙伴生態(tài)系統(tǒng)的重要支撐,通過提供包括喚醒、降噪、ASR、NLP在內(nèi)的領(lǐng)先的語音交互技術(shù),幫助用戶快速打造自己的硬件產(chǎn)品,更加易于集成,易于開發(fā),易于擴(kuò)展,更安全,更自由。
一直以來,DSP芯片具有大規(guī)模集成性、穩(wěn)定性好、精度高、可嵌入性、接口和集成方便等特點(diǎn),而且相較于通用芯片(AP芯片),價格更具優(yōu)勢。隨著智能電子消費(fèi)品、IOT產(chǎn)品越來越多的涌現(xiàn),目前市場還沒有專門的語音芯片應(yīng)用到智能語音設(shè)備中,還沒有經(jīng)過市場驗(yàn)證。
目前更多的還是采用通用芯片(AP芯片/平板芯片等)+Codec芯片/DSP芯片等組合的方式。DSP芯片通過對數(shù)字信號進(jìn)行處理,包括回聲消除、噪聲抑制、語音降噪/增強(qiáng)等,使語音便于后端的語音識別,再由通用芯片進(jìn)行處理傳輸?shù)皆贫颂峁┱Z音處理的計算力支持。
人工智能的大爆發(fā)給消費(fèi)電子產(chǎn)品和IOT設(shè)備的變革塑造了更多的可能性。此次出席Cadence大會,聲智科技帶來的全新的融合遠(yuǎn)場語音交互和遠(yuǎn)場實(shí)時通話技術(shù)的SoundAI Voice Kit智能語音交互系統(tǒng),將更好的賦能客戶的智能硬件產(chǎn)品快速的落地,擁有更精準(zhǔn)的、更符合人性習(xí)慣的遠(yuǎn)場語音交互能力與智能語音交互體驗(yàn)。
-
語音識別
+關(guān)注
關(guān)注
38文章
1742瀏覽量
112745 -
智能機(jī)器人
+關(guān)注
關(guān)注
17文章
872瀏覽量
82412 -
語音交互
+關(guān)注
關(guān)注
3文章
287瀏覽量
28041
發(fā)布評論請先 登錄
相關(guān)推薦
評論