5月27日消息,科大訊飛針對其訊飛智能錄音筆進(jìn)行錄音、轉(zhuǎn)寫和編輯三大性能升級,新增支持聲源定位、12種方言和10種語種轉(zhuǎn)寫、支持智能摘要等13項(xiàng)功能,進(jìn)一步為用戶帶來更便捷高效的錄音體驗(yàn)。
去年5月,科大訊飛一槍打在了傳統(tǒng)錄音筆市場創(chuàng)新賽道上,推出業(yè)內(nèi)首款帶屏錄音筆——訊飛智能錄音筆SR系列,直接催生了一個潛力不可小覷的新品類市場。
至今,SR系列已覆蓋媒體、商務(wù)、教育、律政等應(yīng)用領(lǐng)域,進(jìn)入全球115個國家、646座城市的市場,并拿下2019年雙11天貓&京東雙平臺錄音筆品類和單品銷售額第一的成績。
如今,隨著今年全國兩會如火如荼地召開,訊飛智能錄音筆亦成為人民網(wǎng)、文匯報(bào)、齊魯晚報(bào)、21世紀(jì)經(jīng)濟(jì)報(bào)道4家媒體記者團(tuán),報(bào)道兩會的指定錄音筆,協(xié)助記者等專業(yè)團(tuán)隊(duì)提高報(bào)道效率,更好地記錄民聲民意。
實(shí)現(xiàn)這一系列成果,訊飛智能錄音筆只花了一年。
在這背后,既是訊飛自2016年成立消費(fèi)者事業(yè)群以來,在To C市場不斷摸索和布局,也是訊飛智能語音技術(shù)21年來的技術(shù)積累,在轉(zhuǎn)寫賽道上不斷研發(fā)創(chuàng)新。
在這個千萬級規(guī)模的錄音筆市場下,訊飛哪來的信心和底氣選擇以帶屏錄音筆殺入這個幾乎飽和,卻玩家擁擠的市場?自敲開錄音筆新品類市場后,訊飛在過去一年又取得了哪些重要的成績?市場又發(fā)生了哪些變化?
為此,智東西再度獨(dú)家對話科大訊飛聯(lián)合創(chuàng)始人&執(zhí)行總裁胡郁、科大訊飛副總裁兼消費(fèi)者事業(yè)群副總裁李傳剛,在直擊訊飛三大重磅升級的同時,進(jìn)一步揭開這些答案的真實(shí)面紗。
一、三大升級亮點(diǎn):支持超20種語言語種,遠(yuǎn)程拾音準(zhǔn)確率提升30%
“作為AI錄音筆的龍頭廠商,我們應(yīng)該盡快讓用戶體驗(yàn)到AI技術(shù)與錄音筆融合的真正效果。”胡郁談到,在過去一年,訊飛不斷地對錄音筆AI性能進(jìn)行優(yōu)化和升級,選擇在今天進(jìn)行重要的三大升級,也是為了讓原有的錄音筆用戶率先體驗(yàn)更新穎的智能化功能。
此次,訊飛智能錄音筆主要圍繞智能錄音、語音轉(zhuǎn)寫和智能編輯三個方面,進(jìn)行13項(xiàng)重要升級,包括聲源定位、方言轉(zhuǎn)寫、語義分段、個人詞庫等功能。
1、智能錄音:360度聲源定位,準(zhǔn)確率提升30%
針對錄音的專業(yè)性,訊飛智能錄音筆新增了錄音聲源定位、非人聲過濾和高增益降噪三項(xiàng)功能。
一是聲源定位,錄音筆能夠通過判斷聲源方位,實(shí)現(xiàn)更好的拾音效果;二是非人聲過濾,其與AI算法相配合,可將錄音中空白或嘈雜等無用聲去掉,保留有用人聲;三是高增益降噪,在5至15米的錄音范圍內(nèi),轉(zhuǎn)寫準(zhǔn)確率提升30%,人聲也更加清晰。
2、語音轉(zhuǎn)寫:支持22種語言+語種,7大專業(yè)領(lǐng)域轉(zhuǎn)寫
這方面升級中的最大亮點(diǎn)在于新增了粵語、河南話、云南話和重慶話等12種方言轉(zhuǎn)寫,維吾爾語和藏語兩種少數(shù)民族語言轉(zhuǎn)寫,以及西班牙語、越南語、俄語、英語、日語和韓語等8種語種轉(zhuǎn)寫,進(jìn)一步擴(kuò)大錄音筆的語言應(yīng)用場景。
同時,針對不同領(lǐng)域的專業(yè)術(shù)語轉(zhuǎn)寫,訊飛還更新了7大專業(yè)領(lǐng)域的轉(zhuǎn)寫支持,覆蓋IT科技、財(cái)經(jīng)貿(mào)易、文化體育、醫(yī)療、政法、運(yùn)營商和教育領(lǐng)域。同時,還新增中英文混合轉(zhuǎn)寫功能功能。
3、智能編輯:個性化詞庫,文字編輯更清晰
面對不同錄音場景、多個說話人和口語表達(dá)習(xí)慣,訊飛在智能編輯方面新增了智能語義分段、自動區(qū)分講話人、口語規(guī)整、個人詞庫和智能摘要5項(xiàng)功能,讓錄音筆能更智能地進(jìn)行文字編輯。
例如,在區(qū)分講話人方面,錄音筆采用了訊飛的聲紋識別技術(shù),能根據(jù)錄音及轉(zhuǎn)寫結(jié)果,自動區(qū)分并標(biāo)注講話人。
“這次三大方面的功能升級,不僅能更加滿足消費(fèi)者的需求和體驗(yàn),也更利于我們對市場的開拓和認(rèn)知?!崩顐鲃傉f。
三大升級之于訊飛智能錄音筆,不僅是對產(chǎn)品性能和體驗(yàn)的進(jìn)一步豐富完善,提升訊飛在錄音筆新品類市場的優(yōu)勢和競爭力,同時它之于錄音筆之上的訊飛消費(fèi)者事業(yè)群,亦為其深入布局AI+辦公這一細(xì)分市場提供了新的技術(shù)儲備和解決方案。
“拳頭”升級,訊飛打響的帶屏智能錄音筆新戰(zhàn)局再度升溫。
二、21年深耕與積累,訊飛智能語音技術(shù)的硬核力量
羅馬并非一日建成。訊飛智能錄音筆能在短時間內(nèi)站穩(wěn)市場,并占據(jù)一定身位的領(lǐng)先優(yōu)勢,是其長達(dá)21年的智能語音技術(shù)迭代和積累。
“過去幾年,我們的智能語音技術(shù)曾經(jīng)歷了三次較大的革新與升級。”胡郁提到,這主要集中在語音識別、方言識別,以及多語種的錄音轉(zhuǎn)寫、翻譯上,而這些技術(shù)性能亦是訊飛大舉進(jìn)攻細(xì)分市場的差異化競爭點(diǎn)。
在語音識別領(lǐng)域,訊飛語音識別模塊采用了基于深度全序列卷積神經(jīng)網(wǎng)絡(luò)的語音識別框架,識別準(zhǔn)確率達(dá)98%,同時還通過多麥克風(fēng)陣列去混響和多麥克風(fēng)波束成形,進(jìn)一步提升信噪比。如今,其麥克風(fēng)陣列與錄音筆回傳的數(shù)據(jù)進(jìn)行疊加后,能夠在幾十米的范圍內(nèi)獲得更好的拾音效果。
在多語言識別領(lǐng)域,不管是中國方言的識別,還是全球多語種的錄音轉(zhuǎn)寫和翻譯,訊飛都下足了功夫。
簡單地說,針對方言識別,訊飛采用統(tǒng)一的建模技術(shù),通過少量的方言數(shù)據(jù),進(jìn)一步提升錄音筆在方言語境場景的錄音效果;另一方面,訊飛通過語音識別技術(shù)的不斷研發(fā)和優(yōu)化,將多語種的轉(zhuǎn)寫和翻譯性能效果都實(shí)現(xiàn)了提升。
尤其在多語言識別方面,胡郁透露,目前中國科學(xué)院專門支持中國科學(xué)技術(shù)大學(xué)開展了一項(xiàng)多語識別先導(dǎo)項(xiàng)目,目標(biāo)研發(fā)超過50個語種以上的核心技術(shù),涉及語音識別、語音合成以及自然語言處理等技術(shù)。
“這是目前國內(nèi)投資規(guī)模最大的多語種研發(fā)項(xiàng)目,現(xiàn)階段還沒有任何一家公司有這樣的資源和能力,對這種規(guī)模的多語種系統(tǒng)進(jìn)行研發(fā)?!焙粽劦?,這將進(jìn)一步促進(jìn)訊飛在多語言技術(shù)領(lǐng)域的研究。
如今,訊飛智能錄音筆的研發(fā)團(tuán)隊(duì)已突破百人規(guī)模,包括硬件、軟件、UI交互等均由訊飛的核心研發(fā)力量設(shè)計(jì)。
值得一提的是,隨著訊飛在智能語音領(lǐng)域長達(dá)21年的布局和深耕,已打下了堅(jiān)實(shí)的技術(shù)根基,技術(shù)儲備力量不斷豐富。
其中以語音識別技術(shù)為例,早在2016年,訊飛就已在國際多通道語音分離和識別大賽CHiME-4中,一鼓作氣拿下了三個項(xiàng)目第一。在2020年CHiME-6上,訊飛不僅在給定說話人邊界的多通道語音識別任務(wù)中奪冠,更刷新了自己在CHiME-5中的語音識別錯誤率記錄,從46.1%降至30.5%。
這二十余年的技術(shù)成果與積累,無疑為訊飛敲開錄音筆市場新品類的大門,帶來了十足的信心與底氣。
三、打響帶屏錄音筆市場第一槍,技術(shù)融合下的小爆發(fā)
一面是人工智能不斷賦能各行各業(yè)的技術(shù)浪潮,一面是當(dāng)下傳統(tǒng)錄音筆和錄音技術(shù)的轉(zhuǎn)寫痛點(diǎn),訊飛澆灌了21年的智能語音技術(shù),終于在帶屏錄音筆這塊新市場中破了土,發(fā)了芽。
訊飛入局錄音筆市場的第一槍,為何瞄準(zhǔn)了帶屏錄音筆?
“加入訊飛前我就在想,AI作為未來的一個技術(shù)發(fā)展方向,除了在手機(jī)、智能穿戴設(shè)備和智能音箱等智能硬件方面賦能,還能在哪里找到突破口?”李傳剛談到,作為北大MBA的導(dǎo)師,他經(jīng)常到北大與學(xué)生們進(jìn)行案例討論,當(dāng)時他發(fā)現(xiàn),學(xué)生幾乎人手備有一個傳統(tǒng)錄音筆,主要用在對知識的記錄與鞏固上。
但問題是,他們常常需要自己再花時間重復(fù)聽一遍錄音,才能將內(nèi)容記錄下來。這一大量的時間和人力成本,讓李傳剛抓到了新的突破口——傳統(tǒng)錄音筆與AI的技術(shù)融合。
在與胡郁進(jìn)行了一番溝通后,李傳剛發(fā)現(xiàn)訊飛也正在考慮這一方向,兩人一拍即合。經(jīng)歷將近半年的硬件研發(fā)與打磨,2019年5月,訊飛智能錄音筆SR系列終于面世。
一石激起千層浪,SR系列的推出直接點(diǎn)燃了傳統(tǒng)錄音筆市場的熱情。
一方面,訊飛智能錄音筆SR系列一上市,就在2019年京東“618”中獲得錄音筆品類成交金額第一的成績,目前已進(jìn)駐全國超2000家線下門店;另一方面,現(xiàn)階段SR系列也已拓展至國際市場,進(jìn)入全球115個國家,646個城市中銷售。
“訊飛智能錄音筆SR系列最大的創(chuàng)新性并不在于帶屏,而在于將它是一個獨(dú)立的智能錄音設(shè)備?!痹诤艨磥?,在不同的場合下,用戶對錄音筆的心理依賴程度不同。
一個單獨(dú)的錄音筆,并不會像手機(jī)錄音軟件一樣受到各種干擾,它能持續(xù)獨(dú)立地使用,同時又能通過統(tǒng)一的賬號在手機(jī)和PC上進(jìn)行后臺處理。基于后臺操作的需求,才進(jìn)而衍生出大屏的需求,讓用戶的操作更加便捷。“一個獨(dú)立的能夠進(jìn)行智能轉(zhuǎn)寫的設(shè)備,這才是它的顛覆性所在?!焙粽f。
隨著訊飛智能錄音筆SR系列的推出,訊飛消費(fèi)者事業(yè)部的智能硬件產(chǎn)品線得到了很大的豐富。除了SR系列智能錄音筆外,訊飛聽見系列也正逐步朝更大的市場邁進(jìn),同時與錄音轉(zhuǎn)寫相關(guān)的硬件設(shè)備也在預(yù)期中迅速增長。
在此影響下,訊飛的AI廣告和內(nèi)容服務(wù)業(yè)務(wù),以及與政府、國企之間的業(yè)務(wù)也在加速發(fā)展。據(jù)科大訊飛2019年財(cái)報(bào),在2019年度,訊飛的營收首次突破100億人民幣,達(dá)到100.79億元,同比增長27.30%。其中,消費(fèi)者業(yè)務(wù)營收36.25億人民幣,同比增長43.99%,占總營收比進(jìn)一步攀升至35.96%。
To B+To C的雙線戰(zhàn)略驅(qū)動下,訊飛正加速發(fā)展。
四、創(chuàng)新=藍(lán)海,訊飛消費(fèi)者業(yè)務(wù)的三駕馬車
從一支小小的錄音筆,到如今多了一塊屏幕與AI技術(shù)協(xié)同發(fā)展成一個新品類,在訊飛智能錄音筆SR系列推出后的短短一年內(nèi),錄音筆市場經(jīng)歷了翻天覆地的變化。
“對于整個錄音筆市場來說,我們打開的并不是一個存量市場,而是一個新的增量市場。”李傳剛說。
一面是整個行業(yè)在思考錄音筆市場的未來走向,不斷解決消費(fèi)者的多樣化轉(zhuǎn)寫需求;一面是傳統(tǒng)玩家與新玩家攜手,共同建立產(chǎn)業(yè)聯(lián)盟,以加速推進(jìn)包括轉(zhuǎn)寫技術(shù)、智能語音識別技術(shù)在傳統(tǒng)錄音筆中的融合發(fā)展。
隨著玩家的不斷轉(zhuǎn)型和創(chuàng)新發(fā)展,又將會給訊飛帶來哪些挑戰(zhàn)?
“整體上看,更多玩家的加入我覺的是一件好事?!焙粽劦?,由于現(xiàn)在從傳統(tǒng)錄音筆向智能錄音筆轉(zhuǎn)換的過程中,最大的障礙仍然是用戶教育——如何讓用戶意識到使用智能錄音筆更有價值。
盡管訊飛開拓了新的錄音筆品類市場,但縱觀整個產(chǎn)業(yè)的發(fā)展,它仍是一個螺旋式上升的過程,智能化發(fā)展也將是這一產(chǎn)業(yè)逐漸演變的方向。在這一過程中,既要靠消費(fèi)者消費(fèi)習(xí)慣的轉(zhuǎn)變,也需要靠傳統(tǒng)錄音筆廠商自身的轉(zhuǎn)型推動。
“不管有多少玩家加入,訊飛在這市場中仍是一個龍頭地位。”胡郁說,訊飛非常有信心在這個市場中持續(xù)保持自己的領(lǐng)先優(yōu)勢,這一信心也來自于訊飛所提供的多樣性服務(wù),例如面向政府部門的會議寶,以及涉及面向教育、商務(wù)和律政等應(yīng)用場景下的智能硬件產(chǎn)品。
據(jù)產(chǎn)業(yè)研究機(jī)構(gòu)新思界最新發(fā)布的《2019-2023年錄音筆行業(yè)深度市場調(diào)研及投資策略建議報(bào)告》,2018年,我國錄音筆行業(yè)的產(chǎn)量約為452.12萬臺,出貨量與2017年的431.97萬臺基本持平。
整體來看,我國錄音筆市場出貨量較為穩(wěn)定,市場規(guī)模仍較小。那么,在這之下的AI+錄音筆市場又將如何發(fā)展呢?
“創(chuàng)新永遠(yuǎn)是藍(lán)海?!崩顐鲃傉劦?,傳統(tǒng)錄音筆市場的需求在過去二、三十年并未產(chǎn)生太大變化,但隨著AI技術(shù)的賦能,錄音筆除了錄音之外,還將具有智能轉(zhuǎn)寫、智能翻譯和智能編輯等更多功能,市場規(guī)模也將進(jìn)一步擴(kuò)大,激發(fā)出更多原有錄音技術(shù)不足而未開發(fā)的市場。
市場仍在潛滋暗長,科大訊飛的下一步在哪里?
縱觀訊飛的消費(fèi)者事業(yè)群,胡郁談到,訊飛將持續(xù)以平臺(iFLYOS操作系統(tǒng))、硬件(智能硬件)、服務(wù)(廣告和運(yùn)營商互聯(lián)網(wǎng)服務(wù))為發(fā)展重心,進(jìn)一步拉動“AI+翻譯”、“AI+辦公”、“AI+教育”三駕馬車同時往前走。
往后看,是訊飛在智能語音領(lǐng)域長達(dá)21年的技術(shù)基因和積累;往前看,是訊飛在AI技術(shù)熱潮下敢于嘗試技術(shù)跨界與融合創(chuàng)新的信心和勇氣。
結(jié)語:以AI為刃,傳統(tǒng)錄音筆市場的創(chuàng)新與變革
回顧智能錄音筆市場過去一年的發(fā)展,科大訊飛按下的,不僅是自身消費(fèi)者業(yè)務(wù)加速布局智能市場的“快進(jìn)鍵”,也是錄音筆行業(yè)與AI技術(shù)跨界融合下催生新市場的“啟動鍵”。在這一節(jié)點(diǎn)下,訊飛智能錄音筆三大技術(shù)的升級,也將為公司以及市場競爭的發(fā)展添加新的差異化競爭優(yōu)勢。
談及智能錄音筆的未來,胡郁認(rèn)為將有兩條路,一是與手機(jī)APP等結(jié)合,朝著極簡的方向發(fā)展,二是向更高端、更專業(yè)的定制化獨(dú)立設(shè)備前進(jìn)。這條路究竟走向何方,我們尚不得而知。
但我們能看到的是,在當(dāng)下傳統(tǒng)錄音筆結(jié)合新興技術(shù)的轉(zhuǎn)型下,有越來越多的玩家投入這片藍(lán)海市場,他們單打獨(dú)斗也好,互相結(jié)盟也罷,同一個目標(biāo)無疑都是搶下這塊蛋糕。在這場愈發(fā)激烈的長跑賽道上,最終誰將真正拔得頭籌?我們拭目以待。
責(zé)任編輯:gt
-
AI
+關(guān)注
關(guān)注
87文章
31429瀏覽量
269829 -
科大訊飛
+關(guān)注
關(guān)注
19文章
818瀏覽量
61406 -
智能音箱
+關(guān)注
關(guān)注
31文章
1783瀏覽量
78704
發(fā)布評論請先 登錄
相關(guān)推薦
評論