智能語(yǔ)音是人工智能技術(shù)的重要組成部分,包括聲音前端信號(hào)處理、語(yǔ)音識(shí)別、語(yǔ)義理解、自然語(yǔ)言處理、語(yǔ)音合成等細(xì)分領(lǐng)域。在技術(shù)的具體落地中,消費(fèi)級(jí)智能硬件是最早顯示出市場(chǎng)潛力的賽道,從藍(lán)牙耳機(jī)到可穿戴設(shè)備再到智能家居,各種產(chǎn)品都離不開(kāi)相關(guān)的智能語(yǔ)音技術(shù),而語(yǔ)音交互的第一步就是聽(tīng)見(jiàn),聲音前端信號(hào)處理的效果一定程度上制約了語(yǔ)音識(shí)別的效果,當(dāng)前也有一些公司正在解決這一讓各類產(chǎn)品“聽(tīng)得更清晰”的問(wèn)題。
36氪日前接觸到的「大象聲科」,是一家專注于機(jī)器聽(tīng)覺(jué)的人工智能公司。該公司于2017年在深圳成立,致力于應(yīng)用深度學(xué)習(xí)變革傳統(tǒng)語(yǔ)音信號(hào)處理,讓機(jī)器擁有類似人耳一樣的聽(tīng)覺(jué)感知能力。據(jù)了解,「大象聲科」技術(shù)的理論基礎(chǔ)為CASA(計(jì)算機(jī)聽(tīng)覺(jué)場(chǎng)景分析)+DNN(深度神經(jīng)網(wǎng)絡(luò)技術(shù))。CASA 解決的問(wèn)題是基于人的聽(tīng)覺(jué)原理來(lái)實(shí)現(xiàn)聲源分離,該理論的奠基人汪德亮教授也是「大象聲科」的首席科學(xué)家和聯(lián)合創(chuàng)始人。公司通過(guò)將CASA和深度學(xué)習(xí)相結(jié)合,在業(yè)內(nèi)首家成功實(shí)現(xiàn)大規(guī)模商用級(jí)的噪音和人聲的分離,后續(xù)有望進(jìn)一步解決雞尾酒會(huì)問(wèn)題。(注:雞尾酒會(huì)問(wèn)題是語(yǔ)音識(shí)別領(lǐng)域的痛點(diǎn)和難點(diǎn),人們?cè)陔u尾酒會(huì)中交談,語(yǔ)音信號(hào)會(huì)重疊在一起,機(jī)器需要將它們分離成獨(dú)立的信號(hào))
公司創(chuàng)始人兼CEO苗健彰向記者對(duì)比了傳統(tǒng)信號(hào)處理和基于深度學(xué)習(xí)的信號(hào)處理方式的差別——傳統(tǒng)的數(shù)字信號(hào)處理方式主要依據(jù)固定噪音特性和方向,通過(guò)濾波器對(duì)信號(hào)進(jìn)行相應(yīng)的過(guò)濾和增強(qiáng)。但因?yàn)樯钪械脑胍舨灰欢ù嬖诠潭ㄌ匦裕⒖赡軄?lái)自于各種方向反射,所以傳統(tǒng)方式或許無(wú)法徹底解決復(fù)雜噪聲環(huán)境中的問(wèn)題。而CASA+DNN的方案是讓機(jī)器通過(guò)訓(xùn)練獲得與人類聽(tīng)覺(jué)感知相似的機(jī)制,從而去認(rèn)知周邊的聲場(chǎng)環(huán)境,在復(fù)雜場(chǎng)景中提取、識(shí)別人聲。
在技術(shù)產(chǎn)業(yè)化這一塊,「大象聲科」首先從“降噪”切入,一方面解決通訊過(guò)程中的噪音干擾問(wèn)題,讓人們?cè)趶?fù)雜的現(xiàn)實(shí)噪聲場(chǎng)景中擁有更加清晰、更加私密的通話體驗(yàn);另一方面解決語(yǔ)音識(shí)別中噪聲干擾問(wèn)題,讓機(jī)器在“聽(tīng)清”之后聽(tīng)得“更懂”。為此,公司推出了Vocplus智能語(yǔ)音增強(qiáng)和Vocplus Smart智能語(yǔ)音交互方案,目前已經(jīng)在手機(jī)、耳機(jī)、PC、對(duì)講機(jī)、VoIP、IoT等行業(yè)成功落地。
在研發(fā)過(guò)程中,苗健彰認(rèn)為,把技術(shù)從理論進(jìn)行工程落地轉(zhuǎn)化是最大的難點(diǎn),其中將神經(jīng)網(wǎng)絡(luò)小型化和模型的泛化是決定深度學(xué)習(xí)能否應(yīng)用于實(shí)際產(chǎn)品中的重要環(huán)節(jié)?!按笙舐暱圃谶@方面有一套獨(dú)特的技術(shù),能夠在不損失精度的情況下,使得算法參數(shù)盡量少,計(jì)算速度盡量快,這也是為什么目前我們的深度學(xué)習(xí)降噪算法快速落地到像耳機(jī)這類可穿戴產(chǎn)品。另外,市面上已經(jīng)有上千萬(wàn)臺(tái)設(shè)備搭載了公司的算法,幫助公司沉淀了大量數(shù)據(jù)。大象聲科將人耳的聽(tīng)覺(jué)機(jī)理與深度學(xué)習(xí)相結(jié)合,也大幅提升了算法的泛化性能,形成了較高的技術(shù)壁壘?!彼榻B。
相較而言,公司目前在手機(jī)、耳機(jī)等消費(fèi)電子行業(yè)有比較多的應(yīng)用案例,這和行業(yè)本身的需求和規(guī)模相關(guān)?!艾F(xiàn)在中國(guó)絕大部分的手機(jī)品牌,比如小米、OPPO、vivo都已經(jīng)有使用「大象聲科」的通話降噪技術(shù)(Vocplus Telecom)以及游戲抗嘯叫技術(shù)(DHS)的量產(chǎn)案例?!泵缃≌谜f(shuō)。在前不久發(fā)布的華為FreeLace Pro耳機(jī)上,也搭載了公司的Vocplus AI三麥通話降噪方案。
此外,自去年以來(lái)的TWS耳機(jī)增長(zhǎng)浪潮,也讓越來(lái)越多的耳機(jī)廠商逐漸采納以AI技術(shù)為主導(dǎo)的通話降噪方案?!复笙舐暱啤故锹氏仍谒{(lán)牙耳機(jī)上落地AI語(yǔ)音降噪的公司,首個(gè)成功量產(chǎn)案例是OPPO Enco Q1 。并且,2020年「大象聲科」與漫步者合作,成功落地了第一個(gè)AI算法結(jié)合骨傳導(dǎo)sensor的通話降噪方案,可以讓TWS耳機(jī)在通話時(shí)完全屏蔽周圍噪音(包含人聲噪音在內(nèi)),實(shí)現(xiàn)私密性更強(qiáng)的通話體驗(yàn)。
談及客戶方的具體考量維度,苗健彰介紹客戶主要會(huì)圍繞通話清晰度進(jìn)行評(píng)價(jià),在這方面,業(yè)內(nèi)有一套衡量通話降噪效果的客觀標(biāo)準(zhǔn)3QUEST,測(cè)試指標(biāo)包括:S-MOS(人聲保留程度),N-MOS(噪音消除程度),G-MOS(綜合通話降噪性能),而公司由于采用較獨(dú)特的AI技術(shù),在測(cè)評(píng)中得以展現(xiàn)優(yōu)勢(shì)。
在產(chǎn)業(yè)合作上,「大象聲科」目前已與Qualcomm,CEVA,Cirrus Logic,Infineon,Rockchip和BES等國(guó)內(nèi)外知名芯片廠商建立合作關(guān)系。其中值得一提的是,公司在2018年拿到了小米和高通的融資,并在之后和高通一起進(jìn)行聯(lián)合技術(shù)推廣,這也為公司在市場(chǎng)拓展和品牌建設(shè)方面提供了一定幫助。在收費(fèi)模式上,大象有按照l(shuí)icense授權(quán)和按項(xiàng)目收費(fèi)兩種方式,當(dāng)前l(fā)icense總裝機(jī)量在數(shù)千萬(wàn)級(jí)別,今年的營(yíng)收在數(shù)千萬(wàn)元量級(jí)。
在未來(lái)的行業(yè)延展中,「大象聲科」計(jì)劃進(jìn)一步完善整個(gè)語(yǔ)音技術(shù)鏈條,把應(yīng)用場(chǎng)景從近場(chǎng)拓展到遠(yuǎn)場(chǎng),為更多行業(yè)如助聽(tīng)器、智能家居、會(huì)議系統(tǒng)、智能車載等帶來(lái)更精準(zhǔn)更智能的語(yǔ)音解決方案。
團(tuán)隊(duì)方面,公司創(chuàng)始人兼CEO苗健彰UBC軟件工程學(xué)碩士畢業(yè),曾就職于IBM、RBC等500強(qiáng)企業(yè),并在加拿大成功創(chuàng)辦過(guò)一家軟件公司 。聯(lián)合創(chuàng)始人兼首席科學(xué)家汪德亮教授是計(jì)算機(jī)聽(tīng)覺(jué)場(chǎng)景分析奠基人之一,也是全球首位將深度學(xué)習(xí)應(yīng)用于語(yǔ)音增強(qiáng)的科學(xué)家。聯(lián)合創(chuàng)始人兼CTO張學(xué)良多年從事語(yǔ)音分離、增強(qiáng)算法研發(fā)工作,是內(nèi)蒙古大學(xué)計(jì)算機(jī)學(xué)院教授。
-
人工智能
+關(guān)注
關(guān)注
1792文章
47508瀏覽量
239225 -
智能語(yǔ)音
+關(guān)注
關(guān)注
10文章
789瀏覽量
48825 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5510瀏覽量
121338
原文標(biāo)題:用深度學(xué)習(xí)改變語(yǔ)音信號(hào)處理,大象聲科讓機(jī)器像人耳一樣“聆聽(tīng)”
文章出處:【微信號(hào):MEMSensor,微信公眾號(hào):MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論