訊飛五麥震撼來(lái)襲
科大訊飛是國(guó)際上最早開始研究遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別技術(shù)的機(jī)構(gòu)之一,也是國(guó)內(nèi)唯一具備成熟解決方案的廠商。自2015年3月和8月,訊飛相繼對(duì)外發(fā)布四麥、二麥麥克風(fēng)陣列解決方案。今天在深圳阿基米互聯(lián)網(wǎng)公社舉辦的“訊飛核心技術(shù)開發(fā)日——麥入云端,引領(lǐng)智能交互新主義”沙龍活動(dòng)中,更重磅發(fā)布了打破語(yǔ)音交互瓶頸的利器——4+1環(huán)形五麥克風(fēng)陣列,再次引領(lǐng)智能交互新主義!
在科大訊飛15年底年度發(fā)布會(huì)上,在場(chǎng)的3000余人見證了這樣的一場(chǎng)人機(jī)互動(dòng):演示人員在5米開外,用聲音操控叮咚音箱,完成了一系列高難度的訂票任務(wù),引來(lái)臺(tái)下陣陣驚嘆——現(xiàn)場(chǎng)那么嘈雜,叮咚音箱卻如此“聽話”,要讓叮咚音箱聽懂這么多聲音,而且具備遠(yuǎn)場(chǎng)識(shí)別的功能,它必須聽的到,而且要聽的更加清晰,人類可以帶上助聽器,機(jī)器需要什么呢?【麥克風(fēng)陣列】就充當(dāng)了助聽器這樣的角色??梢哉f(shuō),麥克風(fēng)陣列猶如遠(yuǎn)場(chǎng)識(shí)別的心臟。有了這顆“機(jī)器之心”, 在遠(yuǎn)場(chǎng)場(chǎng)景中,就可以一舉解決在了遠(yuǎn)場(chǎng)識(shí)別中遇到的背景噪聲、其他人聲干擾、回聲、混響等核心問題。
圖:“麥入云端,引領(lǐng)智能交互新主義”沙龍活動(dòng)現(xiàn)場(chǎng)
定義人機(jī)交互的標(biāo)準(zhǔn)
訊飛開放平臺(tái)副總經(jīng)理馬漢君進(jìn)行了開場(chǎng)演講,馬漢君以”科大訊飛——人工智能引導(dǎo)者“為主題系統(tǒng)地介紹了人工智能的起源和發(fā)展,以及訊飛在人工智能領(lǐng)域里的最新研究成果和在人工智能+IOT時(shí)代的愿景和目標(biāo),并在演講的最后詳細(xì)的闡述了于去年底發(fā)布的人機(jī)交互界面——AIUI。
圖:訊飛開放平臺(tái)副總經(jīng)理馬漢君
馬漢君說(shuō):“人工智能將助力IOT時(shí)代的蓬勃興起,而科大訊飛的愿景則是加速這一過程。當(dāng)前訊飛的自然開放交互平臺(tái)上的應(yīng)用已經(jīng)超過90000個(gè),連接終端超過8.8億臺(tái)。接下來(lái)訊飛將通過深度神經(jīng)網(wǎng)絡(luò)與大數(shù)據(jù)的結(jié)合,實(shí)現(xiàn)人工智能從“能聽會(huì)說(shuō)”到“能理解會(huì)思考”的突破。2014年8月,科大訊飛成為中國(guó)首個(gè)人工智能項(xiàng)目“類人答題機(jī)器人”的牽頭單位,正式啟動(dòng)超腦計(jì)劃。未來(lái),訊飛超腦將能參加高考甚至取得“一本”的成績(jī)。
在2015年,訊飛發(fā)布了AIUI,這是一個(gè)智能硬件量身定制了智能交互方案,重新定義了萬(wàn)物互聯(lián)時(shí)代人機(jī)語(yǔ)音交互標(biāo)準(zhǔn),具備了遠(yuǎn)場(chǎng)降噪、方言識(shí)別、語(yǔ)音糾錯(cuò)、多輪對(duì)話等功能。通過統(tǒng)一接口、開放的服務(wù)擴(kuò)展、靈活的能力搭配實(shí)現(xiàn)人機(jī)交互與產(chǎn)品體驗(yàn)的結(jié)合,科大訊飛希望和合作伙伴一起,用人工智能改變世界。
智能交互,與聲俱來(lái)
訊飛開放平臺(tái)智能硬件產(chǎn)品總監(jiān)張良春則從人機(jī)交互的三大痛點(diǎn)談起,介紹了訊飛在這些問題的看法以及解決之道?!耙Ф洹辈皇侵悄芙换ィ寵C(jī)器人可以遠(yuǎn)場(chǎng)對(duì)話,需要使用麥克風(fēng)陣列?,F(xiàn)在訊飛推出有最新的環(huán)形五麥克風(fēng)陣列,遠(yuǎn)場(chǎng)拾音距離可達(dá)5米。相比以往線性麥克風(fēng)單維180°覆蓋,環(huán)形五麥?zhǔn)?60°全平面拾音角度,而且去噪效果更好,抗環(huán)境噪音的能力更強(qiáng)。
總的來(lái)說(shuō)五麥麥克風(fēng)陣列功能特性包括:二維空間拾音、抗噪能力增強(qiáng)、遠(yuǎn)距拾取音頻、支持連續(xù)喚醒、支持回聲消除、支持語(yǔ)音打斷。麥克風(fēng)陣列模塊優(yōu)點(diǎn)是迅速集成,缺點(diǎn)成本較高,適合小批量。所以訊飛也可以提供麥克風(fēng)軟核方案,包括算法SDK、錄音板、加密芯片和構(gòu)型說(shuō)明。目前軟核方案有單麥軟核、雙麥軟核、四麥線性軟核、環(huán)形五麥軟核和環(huán)形七麥軟核。環(huán)形七麥支持5~7米拾音距離、360°聲源定位、±10°聲源定位精度,陣列錄入的音頻信噪比更高。
圖:訊飛開放平臺(tái)智能硬件產(chǎn)品總監(jiān)張良春
在演講的中,張良春還風(fēng)趣的套用了周星馳電影國(guó)產(chǎn)凌凌漆中的一個(gè)橋段:咱們的產(chǎn)品只要一開口說(shuō)話,無(wú)論在哪里,都像黑暗中的一只螢火蟲,那樣的鮮明,那樣的出眾……
干貨泥濘的麥克風(fēng)陣列技術(shù)剖析
除了邀請(qǐng)訊飛開放平臺(tái)的相關(guān)同事,此次發(fā)布會(huì)還特意從訊飛研究院邀請(qǐng)了信號(hào)處理領(lǐng)域的技術(shù)大牛王海坤博士。而王博士的發(fā)言無(wú)疑讓此次本便干貨滿滿發(fā)布會(huì)變得更加泥濘。王博士從信號(hào)與信號(hào)聲學(xué)處理談起,全面的剖析了訊飛的麥克風(fēng)陣列與回聲消除技術(shù)。
“噪聲、混響、干擾和回聲是聲學(xué)信號(hào)處理需要解決的問題,而這些問題的解決離不開麥克風(fēng)陣列。訊飛采用聲源定位技術(shù),利用麥克風(fēng)陣列用基于TDOA(到達(dá)時(shí)間差)計(jì)算聲源距離陣列的角度和距離,實(shí)現(xiàn)對(duì)目標(biāo)聲源的跟蹤。再通過波束形成技術(shù),即在期望方向上有效地形成一個(gè)波束,僅拾取波束的信號(hào),從而達(dá)到同時(shí)提取聲源和抑制噪聲的目的。對(duì)于混響,則使用麥克風(fēng)陣列+深度學(xué)習(xí),實(shí)現(xiàn)有效的混響處理“。
圖:訊飛研究院王海坤
“科大訊飛的回聲消除技術(shù)更是達(dá)到國(guó)際頂尖水平,利用自適應(yīng)濾波方法估計(jì)回聲路徑和利用參考信號(hào)求得麥克風(fēng)拾取的喇叭聲音,并將其減去。通過這一系列的技術(shù),訊飛麥克風(fēng)陣列實(shí)現(xiàn)了優(yōu)異的聲學(xué)信號(hào)處理,確保了良好的用戶體驗(yàn)”。
智能硬件客,共享語(yǔ)音云
發(fā)布會(huì)最后做壓軸演講的,是訊飛開放平臺(tái)智能硬件商務(wù)總監(jiān)湯熙,湯熙以“生活不止眼前的茍且,還有詩(shī)和遠(yuǎn)方的田野”生動(dòng)開場(chǎng),著重介紹了開發(fā)者獲取訊飛開放平臺(tái)相關(guān)能力的一套流程。
圖:訊飛開放平臺(tái)智能硬件商務(wù)總監(jiān)湯熙
湯熙最后表示:如果你確定與訊飛合作,訊飛將提供深入對(duì)接的全套服務(wù)。我們?cè)谏钲?、北京、合肥都有支持團(tuán)隊(duì),除了技術(shù)支持+商務(wù)本地化服務(wù)外,訊飛還提供包括資本服務(wù)、宣傳服務(wù)、渠道服務(wù)等多種服務(wù)。我們希望在做好服務(wù)的同時(shí),陪伴大家共同成長(zhǎng)。訊飛會(huì)不斷把核心技術(shù)做好,產(chǎn)品打磨好,把本地支持做好,只有這樣才能陪伴大家往前走。訊飛也許不夠完美,但是完美的訊飛需要大家一起締造。
麥克風(fēng)猶如遠(yuǎn)場(chǎng)識(shí)別的心臟和引擎,在其基礎(chǔ)上,遠(yuǎn)場(chǎng)識(shí)別技術(shù)的遠(yuǎn)距離、高識(shí)別率支撐,現(xiàn)在用戶在以家庭為單位的活動(dòng)范圍內(nèi),可以通過語(yǔ)音輕松操控家里的一切智能硬件設(shè)備,推而廣之,搭載遠(yuǎn)場(chǎng)識(shí)別的智能硬件產(chǎn)品將無(wú)限擴(kuò)大適用范圍和應(yīng)用場(chǎng)景。未來(lái),科大訊飛將依靠自身強(qiáng)大的人工智能科研實(shí)力與優(yōu)質(zhì)產(chǎn)品,更具創(chuàng)造性地去改變世界,讓人們的生活更加美好。
-
助聽器
+關(guān)注
關(guān)注
18文章
171瀏覽量
40374 -
人工智能
+關(guān)注
關(guān)注
1791文章
47352瀏覽量
238774
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論