0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

中文口語語言處理會議已經(jīng)發(fā)展成為相關(guān)領(lǐng)域最重要的國際研討會

思必馳 ? 來源:djl ? 作者:思必馳 ? 2019-08-06 11:44 ? 次閱讀

ISCSLP中文口語語言處理會議由國際著名學(xué)術(shù)協(xié)會ISCA的中文學(xué)術(shù)小組SIG-CSLP主辦,為全球針對中文語言處理技術(shù)所舉辦的大型國際研討會,1997年創(chuàng)辦首屆,每兩年舉行一次,并由新加坡、中國大陸、***及香港等四個國家和地區(qū)輪流舉辦,該會議已經(jīng)發(fā)展成為中文語言處理技術(shù)相關(guān)領(lǐng)域最重要的國際研討會。

第十屆中文口語語言處理國際會議ISCSLP2016 在天津召開,會議聚集了來自全球各地學(xué)界和產(chǎn)業(yè)界的人士,并向全球征集業(yè)界前沿學(xué)術(shù)論文稿件,結(jié)合當(dāng)前產(chǎn)業(yè)發(fā)展態(tài)勢,共同探討語言處理的未來發(fā)展趨勢。

圖1 思必馳首席科學(xué)家俞凱現(xiàn)場

10月18日下午,思必馳首席科學(xué)家/聯(lián)合創(chuàng)始人、上海交通大學(xué)俞凱教授,在大會新技術(shù)產(chǎn)業(yè)論壇上,進行了題為《基礎(chǔ)技術(shù)創(chuàng)新推動產(chǎn)業(yè)進步》的主題分享。俞凱教授表示,智能語音在經(jīng)歷著從感知智能到認(rèn)知智能的飛躍,解決如何使智能語音進行理解、決策及表述的問題非常重要。俞凱教授強調(diào)技術(shù)型公司原始創(chuàng)新的重要性,著重介紹了思必馳基于深度學(xué)習(xí)語音識別技術(shù),如,VDCNN算法在降噪處理上表現(xiàn)出不可取代的優(yōu)勢;幀同步解碼轉(zhuǎn)換為音素同步解碼搜索空間減少80%以上等技術(shù)成果。依托穩(wěn)健的研究實力,思必馳用實際行動踐行著作為技術(shù)型公司應(yīng)有的創(chuàng)新、原創(chuàng)精神。

思必馳專注為智能硬件提供自然語言交互方案,為智能車載、智能家居、智能機器人三個垂直領(lǐng)域定制基于交互場景的語音方案,應(yīng)用場景各有不同,思必馳依托強大的研發(fā)實力滿足用戶在不同場景下的個性化需求。雖然目前國內(nèi)智能語音領(lǐng)域,通用的開源工具應(yīng)用較多,難度較低,但通用的開源工具在效率和權(quán)限上有極大局限性,既無法滿足特定的前沿算法需求,也常常無法滿足用戶基于場景的個性化需求,不同專業(yè)領(lǐng)域的算法、數(shù)據(jù)、架構(gòu)等都要依托實際應(yīng)用進行搭建及優(yōu)化。因此,思必馳專注技術(shù)研發(fā),用技術(shù)實力說話,通過定制方案滿足用戶個性化需求。

如何確保技術(shù)的專業(yè)性與前沿性呢?思必馳成立之初即與上海交大成立聯(lián)合實驗室“Speech Lab”,由思必馳聯(lián)合創(chuàng)始人,上海交通大學(xué)教授俞凱全權(quán)負責(zé),專注智能語音技術(shù)的研發(fā)與應(yīng)用,思必馳擁有獨立知識產(chǎn)權(quán),并積極促進前端科研成果的商業(yè)化轉(zhuǎn)化與應(yīng)用。正如俞凱教授在演講中所提,近期,思必馳上海交大聯(lián)合實驗室的科研工作又取得了極大突破。

風(fēng)暴抗噪:VDCNN算法

抗噪處理:VDCNN算法模型結(jié)構(gòu)

噪聲環(huán)境下的語音識別一直以來是一個難題。目前基于深度學(xué)習(xí)的主流語音識別技術(shù)及引擎,已經(jīng)可以在很多信噪比相對比較好的環(huán)境下取得良好的準(zhǔn)確率,但是在面對真實環(huán)境下的多類別強噪聲情況環(huán)境(比如車載噪聲、家居遠場回聲等),性能變會急劇下降,遠遠不能滿足實際應(yīng)用的需求。

思必馳和上海交大聯(lián)合實驗室,對基于噪聲條件下的語音識別問題進行了深入的研究,歷時一年多以來,提出了VDCNN算法模型結(jié)構(gòu)。相比于傳統(tǒng)語音模型僅使用1至2層卷積層,思必馳通過堆疊較小的卷積層和池化層,將語音模型中的卷積層的深度提高到了10層以上。利用小卷積核更加精細的局部刻畫能力和頻率不變性描述,能夠更好地在語音模型的內(nèi)部實現(xiàn)了聲學(xué)自動降噪的能力。

思必馳上海交大聯(lián)合實驗室目前所提出的模型和架構(gòu),在噪聲環(huán)境語音識別的業(yè)界基準(zhǔn)庫Aurora4上,取得了7.09%的詞錯誤率。相比于世界其他機構(gòu)目前10%左右的最好結(jié)果,有一個大幅度的明顯優(yōu)勢,在抗噪語音識別上是一個新的里程碑。此外,除了多類別的加性噪聲,此模型也被驗證在遠場識別環(huán)境下也具有明顯的優(yōu)勢。近5年,在Aurora4噪聲數(shù)據(jù)庫上,公開可查的世界上著名研究機構(gòu)最好語音識別系統(tǒng)對比如下圖所示:

思必馳上海交大聯(lián)合實驗室VDCNN算法模型結(jié)構(gòu),不但在噪聲環(huán)境下具有非常好的準(zhǔn)確率,還具有訓(xùn)練收斂速度快,模型參數(shù)規(guī)模小等優(yōu)勢,這些特點都為VDCNN的真實使用提供了便利。

新型解碼框架

新型解碼框架:Phone Synchronous Decoding

大詞匯連續(xù)語音識別由于詞匯量龐大且沒有固定語法,會造成搜索空間非常龐大。目前,通過很多傳統(tǒng)做法可以加快語音識別速度,如,離線基于WFST的搜索空間預(yù)優(yōu)化,在線逐幀同步維特比解碼,結(jié)合可變幀率分析等方法。但是,離線優(yōu)化效果有限,逐幀搜索計算量大,而大量剪枝算法會引入搜索誤差。因此目前主流的大詞匯連續(xù)語音識別系統(tǒng)只能工作在云端。

近來,連接時序模型(CTC)取代傳統(tǒng)隱馬爾科夫模型(HMM),被應(yīng)用到語音識別中,其特點顯著,能夠針對識別序列進行整體建模,帶來更好的前后文建模能力,使語音識別的建模單元顯著減少,并使龐大搜索空間相應(yīng)減小。另一方面,模型本身建模了多幀對一個音素的映射關(guān)系,使得模型輸出的聲學(xué)信息集中。根據(jù)模型輸出特點,適宜采用更長的搜索步長,由逐幀同步解碼,轉(zhuǎn)變?yōu)橐羲赝浇獯a,從而減少了搜索計算量。

思必馳結(jié)合以上兩點改進,使語音識別系統(tǒng)的速度累積提高20-30倍,內(nèi)存下降50%以上,從而使得大詞匯連續(xù)語音識別可以應(yīng)用于離線手持設(shè)備;而基于該系統(tǒng)提出的置信度算法,得益于集中的聲學(xué)信息和相應(yīng)設(shè)計的優(yōu)化算法,取得近一倍的提升。顯著改善了語音識別系統(tǒng)的用戶體驗。

近年來,思必馳憑借穩(wěn)健的研發(fā)實力,在智能車載、智能家居、智能機器人等領(lǐng)域的語音市場展開了布局,與阿里、小米、聯(lián)想、海爾、美的、慶科、浙江大華等企業(yè)建立了戰(zhàn)略合作關(guān)系,為廣大用戶帶來流暢的語音交互體驗。思必馳將始終秉承創(chuàng)新精神,保持技術(shù)專注性與獨立性,打造更人性化的語音交互。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能機器人
    +關(guān)注

    關(guān)注

    17

    文章

    872

    瀏覽量

    82412
  • 智能語音
    +關(guān)注

    關(guān)注

    10

    文章

    789

    瀏覽量

    48822
  • 思必馳
    +關(guān)注

    關(guān)注

    4

    文章

    289

    瀏覽量

    14296
收藏 人收藏

    評論

    相關(guān)推薦

    2025電子設(shè)計與制造技術(shù)研討會

    本帖最后由 jf_32813774 于 2024-12-26 16:14 編輯 電子工程師不可錯過的技術(shù)研討會,終于火熱啟動了! 為了讓廣大電子行業(yè)從業(yè)者共聚一堂,探索前沿科技,共話創(chuàng)新未來
    發(fā)表于 12-18 10:23

    Imagination 系列研討會 |中國生成式 AI 的發(fā)展

    近期,Imagination將陸續(xù)推出全新系列研討會,涵蓋邊緣AI如何推動工業(yè)物聯(lián)網(wǎng)的發(fā)展,生成式AI,智能汽車未來發(fā)展趨勢等等多個熱門話題。本期研討會中,Imagination中國區(qū)
    的頭像 發(fā)表于 12-09 16:57 ?339次閱讀
    Imagination 系列<b class='flag-5'>研討會</b> |中國生成式 AI 的<b class='flag-5'>發(fā)展</b>

    【網(wǎng)絡(luò)研討會】掌握FLIR IIS工業(yè)相機的色彩處理:從感知到精準(zhǔn)

    ,51camera的合作伙伴FLIR特別舉辦了一場有關(guān)“掌握FLIRIIS相機的色彩處理:從感知到精準(zhǔn)”網(wǎng)絡(luò)研討會會議主題掌握FLIRIIS工業(yè)相機的色彩處理:從感知到精準(zhǔn)
    的頭像 發(fā)表于 11-25 15:09 ?146次閱讀
    【網(wǎng)絡(luò)<b class='flag-5'>研討會</b>】掌握FLIR IIS工業(yè)相機的色彩<b class='flag-5'>處理</b>:從感知到精準(zhǔn)

    維智科技亮相首屆時空智能國際學(xué)術(shù)研討會

    近期,第一屆時空智能國際學(xué)術(shù)研討會暨李德仁院士學(xué)術(shù)思想研討會在武漢召開。大會聚焦未知空間自主測繪、實時遙感與智能解譯、時空計算與智能服務(wù),匯聚國內(nèi)外相關(guān)
    的頭像 發(fā)表于 11-25 13:55 ?238次閱讀

    飛騰成功舉辦散熱技術(shù)應(yīng)用發(fā)展研討會

    近日,飛騰公司在深圳成功舉辦了 “散熱技術(shù)應(yīng)用發(fā)展研討會”,并與合作伙伴共同成立業(yè)內(nèi)首個“散熱技術(shù)應(yīng)用發(fā)展聯(lián)合中心”。此次研討會匯聚了眾多業(yè)界專家,共同探討散熱技術(shù)的最新應(yīng)用、
    的頭像 發(fā)表于 11-21 16:04 ?278次閱讀

    北斗星通受邀出席莫干山地信研討會

    莫干山地信研討會在浙江德清國際會議中心舉辦。本次研討會以“測繪地理信息賦能新質(zhì)生產(chǎn)力”為主題,旨在推動測繪地理信息科技進步和轉(zhuǎn)型升級,服務(wù)經(jīng)濟社會高質(zhì)量發(fā)展。來自
    的頭像 發(fā)表于 09-30 14:27 ?416次閱讀

    線上研討會 英飛凌處理器在儲能電源的應(yīng)用

    從德國的“工業(yè)4.0”到美國的“工業(yè)互聯(lián)網(wǎng)”,再到我國的“中國制造2025”,工業(yè)和智能制造已經(jīng)成為各國競相發(fā)展重要領(lǐng)域。而在這一過程中,微控制器(MCU)作為工業(yè)產(chǎn)品的“大腦”,發(fā)揮著至關(guān)
    的頭像 發(fā)表于 09-20 08:08 ?407次閱讀
    線上<b class='flag-5'>研討會</b> 英飛凌<b class='flag-5'>處理</b>器在儲能電源的應(yīng)用

    CET中電技術(shù)邀您參加2024第九屆中國新型煤化工國際研討會

    6月27-28日,由煤化客主辦的2024第九屆中國新型煤化工國際研討會將在新疆·烏魯木齊舉行。研討會以當(dāng)下煤化工產(chǎn)業(yè)發(fā)展中的熱點和難點問題展開,CET中電技術(shù)參展此次
    的頭像 發(fā)表于 06-22 08:35 ?382次閱讀
    CET中電技術(shù)邀您參加2024第九屆中國新型煤化工<b class='flag-5'>國際</b><b class='flag-5'>研討會</b>

    會議回顧 | Aigtek第四屆全國超聲加工技術(shù)研討會高光時刻!

    參加了會議,該會議現(xiàn)已成為超聲加工領(lǐng)域具有廣泛影響力的國際學(xué)術(shù)交流平臺。 本次會議以智能、融合、
    的頭像 發(fā)表于 04-24 11:43 ?401次閱讀
    <b class='flag-5'>會議</b>回顧 | Aigtek第四屆全國超聲加工技術(shù)<b class='flag-5'>研討會</b>高光時刻!

    會議回顧 | Aigtek第四屆全國超聲加工技術(shù)研討會高光時刻!

    會議,該會議現(xiàn)已成為超聲加工領(lǐng)域具有廣泛影響力的國際學(xué)術(shù)交流平臺。本次會議以智能、融合、綠色、
    的頭像 發(fā)表于 04-22 16:06 ?416次閱讀
    <b class='flag-5'>會議</b>回顧 | Aigtek第四屆全國超聲加工技術(shù)<b class='flag-5'>研討會</b>高光時刻!

    上海貝嶺亮相2024國際集成電路展覽研討會(IIC Shanghai)

    3月28日-29日,2024國際集成電路展覽研討會(IIC 2024),在上海張江科學(xué)會堂圓滿召開。
    的頭像 發(fā)表于 04-07 09:46 ?792次閱讀
    上海貝嶺亮相2024<b class='flag-5'>國際</b>集成電路展覽<b class='flag-5'>會</b>暨<b class='flag-5'>研討會</b>(IIC Shanghai)

    2024 ETAP 電氣系統(tǒng)數(shù)字孿生平臺技術(shù)研討會(深圳站)

    勝”的新思想新戰(zhàn)略。我們致力服務(wù)大灣區(qū)建設(shè)發(fā)展,在深圳結(jié)成了眾多合作伙伴,今次亦邀請他們共同分享成功經(jīng)驗。我們與施耐德電氣共同舉辦本次研討會,與各行業(yè)專家共同探討電力系統(tǒng)數(shù)字孿生技術(shù)在相關(guān)行業(yè)
    發(fā)表于 03-30 13:06

    凌鷗創(chuàng)芯亮相2024國際集成電路展覽研討會

    2024年3月28-29日,由全球電子技術(shù)領(lǐng)域知名媒體集團AspenCore主辦的2024國際集成電路展覽研討會在上海張江科學(xué)會堂順利舉辦
    的頭像 發(fā)表于 03-29 18:16 ?1247次閱讀
    凌鷗創(chuàng)芯亮相2024<b class='flag-5'>國際</b>集成電路展覽<b class='flag-5'>會</b>暨<b class='flag-5'>研討會</b>

    芯原將出席2024國際集成電路展覽研討會

    3月28至29日,由電子工程領(lǐng)域全球領(lǐng)先的技術(shù)媒體機構(gòu)AspenCore主辦的2024國際集成電路展覽研討會 ( IIC Shanghai ) 將在上海張江科學(xué)會堂舉辦。
    的頭像 發(fā)表于 03-27 09:28 ?531次閱讀

    是德科技智能算力‘芯’技術(shù)研討會回顧

    2023年12月20日,是德科技成功舉辦了智能算力‘芯’技術(shù)研討會。此次研討會由是德科技的行業(yè)市場經(jīng)理周巍策劃并主持,研討會聚焦算力網(wǎng)絡(luò),算力芯片,通用接口等技術(shù)的發(fā)展趨勢和測試挑戰(zhàn),
    的頭像 發(fā)表于 01-17 09:34 ?767次閱讀