0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

回顧聲智科技發(fā)布全新的DSP低功耗語音交互方案參與中國用戶大會

聲智科技 ? 來源:djl ? 作者:聲智科技 ? 2019-08-12 17:29 ? 次閱讀

一年一度的Cadence CDNLive中國用戶大會2018于8月10日在上海浦東嘉里大酒店開幕,作為Cadence的戰(zhàn)略級合作伙伴,聲智科技帶著全新的DSP低功耗語音交互方案出席了此次大會。

CDNLive大會是由Cadence公司舉辦的一年一度的全球巡回用戶大會。從今年4月由美國硅谷伊始,覆蓋德國、日本、***、印度、以色列等七大地區(qū)和國家。大會以“聯(lián)結(jié)、分享、啟發(fā)”為主題,行業(yè)巨頭、技術(shù)用戶、業(yè)界頂尖開發(fā)者與業(yè)界專家都將聚集于此,共同分享高階工藝芯片、復(fù)雜SoC和系統(tǒng)設(shè)計的技術(shù)和理念,為行業(yè)的發(fā)展提供靈感和啟發(fā)。對于科技行業(yè)來說,這個集會可謂是一年一度最大的盛典。

2017年聲智科技與Cadence建立了戰(zhàn)略合作關(guān)系,開始為CadenceTensilicaDSP系列產(chǎn)品研發(fā)設(shè)計低功耗遠(yuǎn)場智能語音交互解決方案。本次Cadence CDNLive中國用戶大會上,聲智科技展示了基于Cadence Tensilica Fusion和HiFi DSP設(shè)計的融合遠(yuǎn)場語音交互和遠(yuǎn)場實(shí)時通話技術(shù)的SoundAI Voice Kit智能語音交互系統(tǒng)。

融合遠(yuǎn)場語音交互和遠(yuǎn)場實(shí)時通話技術(shù)的SoundAI Voice Kit(以下簡稱SVK)是一款為手機(jī)、智能機(jī)器人、智能電視、機(jī)頂盒、機(jī)頂盒等消費(fèi)電子產(chǎn)品和IOT產(chǎn)品提供低功耗的遠(yuǎn)場語音喚醒,語音識別,語音控制,語音搜索,遠(yuǎn)場聲紋識別,遠(yuǎn)場實(shí)時通話(VoIP)等功能的理想軟件解決方案。

(1)滿足低功耗需求

隨著亞馬遜Echo、谷歌Google Home,阿里天貓精靈、小米小愛同學(xué)等產(chǎn)品在市場上大獲成功,支持遠(yuǎn)場語音交互的智能設(shè)備越來越普及。遠(yuǎn)場智能語音交互勢必是未來人機(jī)交互的新趨勢。智能語音交互必然會推動消費(fèi)電子品、物聯(lián)網(wǎng)的革命,包括如汽車、家用設(shè)備,手機(jī)以及可穿戴設(shè)備。然而,耗能過高的困擾一直是制約物聯(lián)網(wǎng)發(fā)展。

本次大會推出的SVK智能語音交互系統(tǒng)提供的遠(yuǎn)場語音喚醒算法,具有低功耗的特點(diǎn),可以保證SoC和系統(tǒng)成本,也可以滿足家居和移動場景的不同需求。該算法計算量少,計算復(fù)雜度低,占CPU內(nèi)存小,但是語音交互的順暢度不打折。

該算法搭載了最新的Voice Activity Detection技術(shù),可拾取環(huán)境語音以檢測和響應(yīng)喚醒詞或觸發(fā)命令,通過關(guān)鍵字檢測支持低功耗實(shí)時監(jiān)聽,實(shí)現(xiàn)低功耗遠(yuǎn)場語音喚醒功能。而且針對可能出現(xiàn)的多線程同時工作場景,也可以隨時喚醒識別,不影響人機(jī)交流自然順暢的體驗(yàn),只為語音交互帶來方便,不增加重量。在手機(jī)上應(yīng)用,可實(shí)現(xiàn)鎖屏喚醒、多任務(wù)喚醒、遠(yuǎn)場聲紋喚醒等功能。

該遠(yuǎn)場語音喚醒算法可實(shí)現(xiàn)五米之內(nèi)95%以上的喚醒率,支持Duel-wake(雙名喚醒)、Free-cut(隨時打斷、隨時喚醒)、One-shot(一句連控)的功能。目前,小米、百度、阿里、騰訊、華為、聯(lián)想、獵豹移動等公司均采用聲智科技提供的遠(yuǎn)場語音喚醒技術(shù)。

Dual-wake(雙名喚醒),即喚醒詞不再是單一的一個,設(shè)備可以擁有兩個名字,使用任意一個名字都可以將其喚醒并進(jìn)行無差別的操作,這樣的設(shè)計與改進(jìn)為設(shè)備后期功能擴(kuò)展以及實(shí)現(xiàn)智能家電之間的聯(lián)動留下了空間。

Free-cut(隨時打斷、隨時喚醒)技術(shù)可以讓設(shè)備任意時刻終止當(dāng)前任務(wù),立即響應(yīng)新的用戶需求,這就實(shí)現(xiàn)了連續(xù)喚醒執(zhí)行新的命令,而無需等待上一任務(wù)完成后響應(yīng),隨叫隨應(yīng)。

One-shot(一句連控),采用“喚醒詞+語音語義識別”一體化方式,實(shí)現(xiàn)喚醒詞與語音操控之間無縫對接,用戶叫了設(shè)備的名字后無需等待設(shè)備應(yīng)答就可以直接說出命令,無需等待設(shè)備回應(yīng)“誒”、“我在”等之后才能說出命令,響應(yīng)速度更快,更加符合人類語音交互習(xí)慣。

(2)匹配復(fù)雜場景

隨著智能語音設(shè)備應(yīng)用場景的增加,由近場語音交互過渡到遠(yuǎn)場語音交互,場景中的噪聲種類越來越多,越來越復(fù)雜,對于語音交互的要求也越來越高。針對可能出現(xiàn)的極端噪聲場景,本次推出的SoundAI Voice Kit智能語音交互系統(tǒng)也進(jìn)行了定制優(yōu)化。

集成通話降噪、混響抑制、回聲抵消、噪聲抑制、波束形成、增益控制等噪聲抑制技術(shù),針對遠(yuǎn)場語音交互所處的復(fù)雜應(yīng)用場景,定制了OpenAEC算法,可以解決弱參考信號或者無參考信號等更為復(fù)雜場景的回聲抵消(自噪聲抑制)問題,可實(shí)現(xiàn)更加精準(zhǔn)的喚醒。

同時搭載了針對智能家居、辦公環(huán)境、車載等場景的抗強(qiáng)噪喚醒算法(AKS技術(shù)),保證在噪聲環(huán)境中,也實(shí)現(xiàn)精準(zhǔn)的遠(yuǎn)場語音喚醒。在車載環(huán)境中,針對主副駕駛的方向性降噪問題,通過麥克風(fēng)陣列波束成型技術(shù)在主方向語音不失真的前提下,有效去除空調(diào)、胎噪等平穩(wěn)噪聲,平穩(wěn)噪聲抑制量大于30dB。

并在保護(hù)主方向語音的同時,去除環(huán)境中的語音、車載娛樂設(shè)施等非穩(wěn)態(tài)噪聲的干擾。其中非穩(wěn)態(tài)噪聲抑制量大于20dB,在噪音環(huán)境下可以大幅提升遠(yuǎn)場語音喚醒和識別率。解決行車過程中,主駕駛與智能語音設(shè)備語音交互易受干擾的問題,確保準(zhǔn)確識別主駕駛方向的指令,抑制其他方向噪聲。

針對家庭場景下,易出現(xiàn)的大電視噪聲、音響噪聲等非穩(wěn)態(tài)噪聲,聲智推出了

家庭非穩(wěn)態(tài)噪聲抑制技術(shù)、垂直抗強(qiáng)噪識別技術(shù),專門匹配相應(yīng)場景,帶來更出色的遠(yuǎn)場交互體驗(yàn),無懼環(huán)境,想說就說,聲隨心動,保證遠(yuǎn)場語音交互的完美體驗(yàn)。

(3)快速開發(fā)集成

聲智科技推出的融合遠(yuǎn)場語音交互和遠(yuǎn)場實(shí)時通話技術(shù)的SoundAI Voice Kit是眾多audio/voice/speech軟硬件合作伙伴生態(tài)系統(tǒng)的重要支撐,通過提供包括喚醒、降噪、ASR、NLP在內(nèi)的領(lǐng)先的語音交互技術(shù),幫助用戶快速打造自己的硬件產(chǎn)品,更加易于集成,易于開發(fā),易于擴(kuò)展,更安全,更自由。

一直以來,DSP芯片具有大規(guī)模集成性、穩(wěn)定性好、精度高、可嵌入性、接口和集成方便等特點(diǎn),而且相較于通用芯片(AP芯片),價格更具優(yōu)勢。隨著智能電子消費(fèi)品、IOT產(chǎn)品越來越多的涌現(xiàn),目前市場還沒有專門的語音芯片應(yīng)用到智能語音設(shè)備中,還沒有經(jīng)過市場驗(yàn)證。

目前更多的還是采用通用芯片(AP芯片/平板芯片等)+Codec芯片/DSP芯片等組合的方式。DSP芯片通過對數(shù)字信號進(jìn)行處理,包括回聲消除、噪聲抑制、語音降噪/增強(qiáng)等,使語音便于后端的語音識別,再由通用芯片進(jìn)行處理傳輸?shù)皆贫颂峁┱Z音處理的計算力支持。

人工智能的大爆發(fā)給消費(fèi)電子產(chǎn)品和IOT設(shè)備的變革塑造了更多的可能性。此次出席Cadence大會,聲智科技帶來的全新的融合遠(yuǎn)場語音交互和遠(yuǎn)場實(shí)時通話技術(shù)的SoundAI Voice Kit智能語音交互系統(tǒng),將更好的賦能客戶的智能硬件產(chǎn)品快速的落地,擁有更精準(zhǔn)的、更符合人性習(xí)慣的遠(yuǎn)場語音交互能力與智能語音交互體驗(yàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音識別
    +關(guān)注

    關(guān)注

    38

    文章

    1742

    瀏覽量

    112745
  • 智能機(jī)器人
    +關(guān)注

    關(guān)注

    17

    文章

    872

    瀏覽量

    82412
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    287

    瀏覽量

    28041
收藏 人收藏

    評論

    相關(guān)推薦

    【「嵌入式系統(tǒng)設(shè)計與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語音識別的智能杯墊

    語音命令Q 識別,適用于智能家居控制、玩具、人機(jī)交互等多個領(lǐng)域。該模塊以其高識別率、低功耗和易于集成的特點(diǎn)受到廣大開發(fā)者的青睞。 主要技術(shù)及功能有: 磁力攪拌、重量采集、語音識別、
    發(fā)表于 01-02 18:15

    大聯(lián)大推出基于MediaTek Genio 130與ChatGPT的AI語音助理方案

    ,為市場帶來了全新的智能交互體驗(yàn)。 該AI語音助理方案充分利用了MediaTek Genio 130芯片的強(qiáng)大性能與ChatGPT的先進(jìn)人工智能技術(shù)。MediaTek Genio 13
    的頭像 發(fā)表于 12-11 11:07 ?443次閱讀

    電子鎖語音芯片方案,低功耗語音播報ic,NV256H

    方案——NV256H語音芯片,為電子鎖行業(yè)注入了全新語音交互體驗(yàn)。相比市面上的語音芯片,NV2
    的頭像 發(fā)表于 12-06 01:01 ?139次閱讀
    電子鎖<b class='flag-5'>語音</b>芯片<b class='flag-5'>方案</b>,<b class='flag-5'>低功耗</b><b class='flag-5'>語音</b>播報ic,NV256H

    電子鎖語音芯片方案,低功耗語音播報ic,NV256H

    廣州九芯電子推出NV256H語音芯片,為電子鎖提供低功耗、高耐用、高質(zhì)量音頻、靈活控制、平臺自定義及廣泛應(yīng)用兼容性,注入全新語音交互體驗(yàn),滿足智能便捷安全需求。
    的頭像 發(fā)表于 12-05 14:12 ?222次閱讀

    BLE低功耗藍(lán)牙模塊在答題器中的應(yīng)用方案

    1、背景介紹答題器廣泛應(yīng)用于課堂、會議、培訓(xùn)等場合,用于實(shí)時采集和反饋參與者的答題信息。隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,傳統(tǒng)的紅外或有線答題器逐漸向更高效、更低功耗的方向發(fā)展。藍(lán)牙技術(shù),尤其是低功耗藍(lán)牙
    的頭像 發(fā)表于 11-04 16:25 ?228次閱讀
    BLE<b class='flag-5'>低功耗</b>藍(lán)牙模塊在答題器中的應(yīng)用<b class='flag-5'>方案</b>

    高燃回顧|第三屆OpenHarmony技術(shù)大會精彩瞬間

    卓越開源人才 為全球操作系統(tǒng)的技術(shù)創(chuàng)新持續(xù)貢獻(xiàn)中國力量 立即點(diǎn)擊視頻回顧大會精彩瞬間 ↓↓↓ 技術(shù)引領(lǐng)筑生態(tài),萬物智聯(lián)創(chuàng)未來 讓我們期待下一次的相聚!
    發(fā)表于 10-16 18:47

    2024 KiCon Asia KiCad 用戶大會 預(yù)約報名

    KiCad 發(fā)展做出貢獻(xiàn)。 當(dāng)然,我們也歡迎您來到 KiCon,吐槽 KiCad 的 Bug 和不足之處!我們希望可以通過這次會議,建立起 KiCad 社區(qū)與中國用戶的橋梁,并提供一個平臺,讓中國用戶
    發(fā)表于 09-14 10:55

    ES9038Q2M 32位立體低功耗音頻DAC英文手冊

    電子發(fā)燒友網(wǎng)站提供《ES9038Q2M 32位立體低功耗音頻DAC英文手冊.pdf》資料免費(fèi)下載
    發(fā)表于 08-09 11:44 ?5次下載

    智能炒菜機(jī)OTP語音提示芯片賦予全新交互方式

    OTP語音提示芯片為智能炒菜機(jī)帶來全新交互方式,具備音質(zhì)出色、穩(wěn)定可靠、靈活可定制等特點(diǎn),實(shí)現(xiàn)開機(jī)、烹飪、操作及故障提示,提升用戶烹飪體驗(yàn)。NVD系列OTP語音芯片適合智能炒菜機(jī)應(yīng)用,
    的頭像 發(fā)表于 05-31 16:02 ?421次閱讀

    深耕交互式人工智能領(lǐng)域,通科技為用戶提供更加智能的解決方案

    的Voicecomm Brain技術(shù),正引領(lǐng)著企業(yè)級用戶走向全棧交互式人工智能解決方案的新紀(jì)元。 經(jīng)過近二十年的持續(xù)研發(fā),通科技已成為中國
    的頭像 發(fā)表于 05-16 09:42 ?378次閱讀

    OTP低功耗語音芯片的工作原理與產(chǎn)品特性

    OTP低功耗語音芯片的工作原理:在于其獨(dú)特的電路設(shè)計以及先進(jìn)的制程技術(shù)。該芯片采用了先進(jìn)的低功耗設(shè)計策略,包括低漏電晶體管、動態(tài)電壓調(diào)整以及智能休眠模式等,確保在保持高性能的同時實(shí)現(xiàn)低功耗
    的頭像 發(fā)表于 04-30 08:06 ?660次閱讀
    OTP<b class='flag-5'>低功耗</b><b class='flag-5'>語音</b>芯片的工作原理與產(chǎn)品特性

    基于唯創(chuàng)語音芯片的三大煙霧報警器語音方案

    在智能設(shè)備與物聯(lián)網(wǎng)(IoT)技術(shù)的飛速發(fā)展中,語音播報功能的重要性日益凸顯,已成為提升用戶體驗(yàn)、實(shí)現(xiàn)人機(jī)交互的關(guān)鍵一環(huán)。本文將深入探討三種創(chuàng)新性語音播報系統(tǒng)設(shè)計
    的頭像 發(fā)表于 04-12 15:08 ?444次閱讀
    基于唯創(chuàng)<b class='flag-5'>語音</b>芯片的三大煙霧報警器<b class='flag-5'>語音</b><b class='flag-5'>方案</b>

    芯原低功耗藍(lán)牙整體IP解決方案已通過LE Audio全部功能認(rèn)證

    2024年3月28日,中國上?!驹煞?(芯原,股票代碼:688521.SH) 今日宣布其低功耗藍(lán)牙整體IP解決方案已全面支持藍(lán)牙技術(shù)聯(lián)盟 (Bluetooth SIG) 發(fā)布的L
    的頭像 發(fā)表于 03-28 11:30 ?656次閱讀

    聚芯啟迪,智鏈飛躍|2024普迪飛中國用戶大會成功舉辦

    2024年3月15日,2024普迪飛(PDF Solutions)首屆中國用戶大會在上海浦東成功舉辦,本次大會以“聚芯啟迪,智鏈飛躍”為主題,旨在打通全行業(yè)溝通壁壘,碰撞出更多新思路。現(xiàn)場超200位
    發(fā)表于 03-21 16:40 ?462次閱讀
    聚芯啟迪,智鏈飛躍|2024普迪飛<b class='flag-5'>中國用戶</b><b class='flag-5'>大會</b>成功舉辦

    軟通動力參與華為中國合作伙伴大會2024精彩回顧

    精彩盤點(diǎn)·華為中國合作伙伴大會2024 3月14-15日,“華為中國合作伙伴大會2024”在深圳隆重舉行。作為華為的重要合作伙伴和本次大會
    的頭像 發(fā)表于 03-18 10:44 ?1174次閱讀
    軟通動力<b class='flag-5'>參與</b>華為<b class='flag-5'>中國</b>合作伙伴<b class='flag-5'>大會</b>2024精彩<b class='flag-5'>回顧</b>