01技術(shù)篇
DUI平臺(tái),走向定制規(guī)模化之路
2017年9月,思必馳,在多年智能語音技術(shù)基礎(chǔ)上,以Dialogue為核心,結(jié)合GUI和VUI,自主研發(fā)了全鏈路智能對話定制平臺(tái)——DUI,為開發(fā)者提供高可用定制的人機(jī)對話技術(shù)服務(wù),為智能終端開發(fā)者提供核心交互能力,協(xié)助傳統(tǒng)設(shè)備實(shí)現(xiàn)智能升級。
DUI致力構(gòu)建以場景服務(wù)為基礎(chǔ),以用戶為中心的自由人機(jī)交互體驗(yàn),支持自由調(diào)用圖文、列表、音樂、內(nèi)嵌網(wǎng)頁等多種控件,提供從喚醒、語音識(shí)別、語義理解到對話管理、內(nèi)容輸出、TTS播報(bào)的全鏈路技術(shù)的超高度定制。DUI還擁有優(yōu)秀的大數(shù)據(jù)平臺(tái)和產(chǎn)品運(yùn)營中心,幫助開發(fā)者快速優(yōu)化產(chǎn)品;秒級在線熱更新,用戶體驗(yàn)更流暢。DUI平臺(tái)將賦能智能終端、APP端、網(wǎng)頁端、微信端等多種終端,讓更多產(chǎn)品能夠快速接入語音功能。
八大技術(shù)升級,打造更人性化的對話交互
1. 推出聲紋識(shí)別方案
基于喚醒的聲紋認(rèn)證,提供更安全的身份保障和個(gè)性化體驗(yàn)。聲紋識(shí)別包括說話人辨識(shí)(Speaker Identification,簡稱SI,一對N的關(guān)系)和說話人確認(rèn)(Speaker Verification,簡稱 SV,一對一的關(guān)系)。思必馳聲紋識(shí)別方案,基于單麥的純軟算法,集內(nèi)準(zhǔn)確率在95%以上,能夠被應(yīng)用于聲紋開鎖、語音支付、個(gè)性化推薦、安防認(rèn)證等場景。
2. 推出雙麥陣列方案
雙波束動(dòng)態(tài)噪聲抑制和回聲消除,支持平面180度遠(yuǎn)場拾音,有效提升語音交互體驗(yàn)。思必馳雙麥陣列方案,可廣泛應(yīng)用于車載和家居場景下的中遠(yuǎn)場交互,在噪音環(huán)境中也有不錯(cuò)的喚醒和識(shí)別理解能力,是一個(gè)超高性價(jià)比的軟硬一體化解決方案。
3. 語音喚醒升級
設(shè)備喚醒的高靈敏,容易觸發(fā)更多的誤喚醒。用戶在聊天或者看電視的時(shí)候,就常常遇到旁邊的智能音箱突然被喚醒,被“插話”,讓用戶不勝其煩。此前,大部分產(chǎn)品能達(dá)到2次/24小時(shí)的誤喚醒率已經(jīng)算是不錯(cuò)的水平。而思必馳最新的技術(shù)優(yōu)化后,在維持超高喚醒率的同時(shí),誤喚醒相對降低60%,500h+實(shí)測,每48小時(shí)誤喚醒僅一次。
4. 推出TTS快速定制方案
思必馳小數(shù)據(jù)快速定制TTS,在傳統(tǒng)的HMM訓(xùn)練后得到源發(fā)音人的模型參數(shù),將原始模型的mixture component聚類成若干類,利用MLLR和目標(biāo)發(fā)音人的數(shù)據(jù)求取源發(fā)音人到目標(biāo)發(fā)音人的轉(zhuǎn)換模型。僅需提供5-10分鐘音頻素材,經(jīng)過機(jī)器的模型訓(xùn)練,即可合成聲音,讓任意文本都可秒變成用戶的聲音。
5. 語音識(shí)別魯棒性能力提高
噪聲環(huán)境下的語音識(shí)別一直以來是一個(gè)難題。在面對真實(shí)環(huán)境下的多類別強(qiáng)噪聲情況環(huán)境(比如車載噪聲、家居遠(yuǎn)場回聲等),識(shí)別性能有所受影響。思必馳VDCNN算法,在噪聲環(huán)境語音識(shí)別的業(yè)界基準(zhǔn)庫Aurora4上,取得了7.09%的詞錯(cuò)誤率,在降噪處理上表現(xiàn)出不可取代的優(yōu)勢,在強(qiáng)干擾和強(qiáng)混響的真實(shí)環(huán)境中,識(shí)別率相對以往提高20%。
6. 上線語言模型定制功能
通用的模型無法滿足開發(fā)者的多樣化需求。在應(yīng)用場景中,內(nèi)容資源、語言模型與語義需要三者配合好。對于像“MC子龍”類的特定詞匯,添加到詞庫或說法里,會(huì)作為語料用于訓(xùn)練識(shí)別語言模型和語義解析模型,通過思必馳 DUI平臺(tái)釋放的技術(shù)服務(wù),即可準(zhǔn)確識(shí)別。解碼資源實(shí)施同步,最快秒級完成熱更新,實(shí)現(xiàn)無感知的交互體驗(yàn)升級。
7. NLU能力升級
結(jié)合上下文的對話理解和對話管理技術(shù)提供了更加靈活的對話交互和更精細(xì)的場景劃分,支持可隨時(shí)打斷、智能糾錯(cuò)的多輪對話和漸進(jìn)式上下文理解。通過增強(qiáng)實(shí)體識(shí)別、實(shí)體關(guān)系抽取和大規(guī)模知識(shí)圖譜應(yīng)用,促進(jìn)機(jī)器學(xué)習(xí)和知識(shí)庫技術(shù)深度融合,使得意圖識(shí)別能力顯著提高10%。同時(shí)與第三方內(nèi)容服務(wù)深度耦合,打造更實(shí)用的人機(jī)交互體驗(yàn)。
8. 對話能力升級
以任務(wù)型對話為核心,兼具閑聊、問答與命令對話,引入知識(shí)圖譜,實(shí)體概念,維基百科等形式,打造基于GUI+VUI的多模交互,實(shí)現(xiàn)“語音+觸控”的完美結(jié)合。思必馳DUI所集成的核心智能對話技術(shù)具有超高度可定制性,實(shí)現(xiàn)了從本地端設(shè)備到云端服務(wù),從識(shí)別到合成,從語義領(lǐng)域到對話邏輯,從技術(shù)模塊到內(nèi)容資源的全方位定制支持。
AIOS智能車載技術(shù)方案
思必馳于2015年10月推出了AIOS for Car對話操作系統(tǒng),2017年初,該方案升級至AIOS3.3版本,新增十一大功能:one-shot一把說、離線導(dǎo)航功能、偏好導(dǎo)航功能、導(dǎo)航中的快捷交互、隨意打斷/搶說、合成音切換、音樂中的快捷交互、聽歌識(shí)曲、微信及微信地圖接人、自定義喚醒詞、路況及限行查詢。目前,該方案已廣泛應(yīng)用于當(dāng)前的車載后裝市場,為用戶的駕乘生活帶來更流暢的交互體驗(yàn)。后期,AIOS將與DUI無縫融合,性能不變,體驗(yàn)升級。
針對遠(yuǎn)場交互的麥克風(fēng)陣列方案
遠(yuǎn)場交互和魯棒性是近兩年的智能硬件剛需,尤其是在家居環(huán)境下的3~5米遠(yuǎn)場交互,和車載環(huán)境下的近場復(fù)雜噪音環(huán)境下。2017年,思必馳推出了多款麥克風(fēng)陣列方案:
環(huán)形6麥方案:支持5米遠(yuǎn)場交互和360°全角度拾音,±10°聲源定位,適用于智能音箱、家居中控等智能硬件產(chǎn)品。
線性4麥方案:支持5米遠(yuǎn)場交互和180°拾音,適用于智能電視、智能冰箱、智能空調(diào)等位置相對固定的智能硬件產(chǎn)品。
雙麥方案:適用于家居和車載環(huán)境里的中遠(yuǎn)場交互,擁有極好的降噪處理能力,適合輕需求的智能音箱、智能后視鏡等。
智能機(jī)器人/故事機(jī)技術(shù)方案
智能機(jī)器人/故事機(jī)市場無疑是今年的一大熱點(diǎn),在前端語音處理上,思必馳的麥克風(fēng)陣列方案解決了遠(yuǎn)場環(huán)境下的痛點(diǎn)。思必馳憑借著強(qiáng)大的語音交互能力、領(lǐng)先的TTS播報(bào)、海量的聚類資源、強(qiáng)有力的AI內(nèi)芯快速拓展了市場,同時(shí),思必馳已積累數(shù)十個(gè)領(lǐng)域的自建資源庫、并與眾多第三方知名內(nèi)容達(dá)成戰(zhàn)略合作。自建資源的豐富累積,讓機(jī)器人/ 故事機(jī)更聰明!
02市場合作篇
目前思必馳已與眾多業(yè)界知名公司達(dá)成合作,包括阿里、騰訊、小米、富士康、聯(lián)想、360、海爾、浙江大華等,在智能硬件泛物聯(lián)網(wǎng)領(lǐng)域打造了多款行業(yè)爆品。數(shù)億用戶通過思必馳自然語言交互,實(shí)現(xiàn)與智能終端的互動(dòng)交流。
2017年,思必馳在智能車載、智能家居、智能機(jī)器人/故事機(jī)領(lǐng)域的合作全面突破,收獲頗豐。
智能車載:暢享自由駕駛
思必馳攜手合作伙伴,打造了小米板牙70邁智能后視鏡、車蘿卜HUD、捷渡遠(yuǎn)界智能后視鏡一二三代、掌訊車機(jī)(方案商)等多品類產(chǎn)品。截止目前,思必馳在智能車載后裝市場占有率約達(dá)60%,穩(wěn)居行業(yè)第一,智能后視鏡領(lǐng)域達(dá)70%,智能HUD領(lǐng)域達(dá)80%。
智能家居:樂享智慧生活
在今年機(jī)器火爆的智能音箱市場,AISpeech Inside出貨量行業(yè)第一,天貓精靈X1、小米小愛同學(xué)、聯(lián)想智能音箱、小米互聯(lián)網(wǎng)音箱等產(chǎn)品均采用了思必馳語音技術(shù)方案,其中天貓精靈雙十一賣出100+萬臺(tái),小米小愛同學(xué)開售23秒售罄,備受市場追捧。
除智能音箱外,思必馳攜手合作伙伴打造了聯(lián)想智能電視、諸葛小明智能臺(tái)燈、小米藍(lán)牙語音遙控器、海爾馨廚冰箱等多款多類目家居產(chǎn)品,讓智能語音走進(jìn)千家萬戶。
智能機(jī)器人/故事機(jī):感受萌動(dòng)心聲
兒童機(jī)器人/故事機(jī)市場今年尤為火熱,在這一領(lǐng)域,目前思必馳品牌覆蓋率行業(yè)第一, 打造了夏普曉樂、水果兔故事機(jī)、火火兔平板、牛聽聽故事機(jī)、小蘿卜兒童機(jī)器人、貝貝禮兒童故事機(jī)等多款產(chǎn)品,激活兒童故事機(jī)市場。這些產(chǎn)品的銷量在行業(yè)內(nèi)遙遙領(lǐng)先。
03團(tuán)隊(duì)篇
思必馳總部在蘇州,并在深圳設(shè)立商務(wù)辦事處,在北京設(shè)立研發(fā)院和市場部,在上海與上海交通大學(xué)設(shè)立了基礎(chǔ)研究中心(聯(lián)合實(shí)驗(yàn)室)。目前,思必馳團(tuán)隊(duì)400余人,其中近一半為研發(fā)工程師,大都來自國內(nèi)外知名的高校和研究院所,如劍橋大學(xué)、香港科技大學(xué)、新加坡國立大學(xué)、以色列理工、清華、北大、上海交大、中科院及中科大等等,核心研發(fā)團(tuán)隊(duì)成員全部為本科及其以上學(xué)歷,其中碩士比例約占60%,博士占比約為20%。同時(shí),思必馳也匯聚了來自阿里、騰訊、百度、樂視、英特爾、華為、滴滴等行業(yè)巨頭的資深專家。
2017年思必馳迎來了多位大咖的加盟。初敏博士,2017年9月加入思必馳,任思必馳副總裁,北京研發(fā)院院長,負(fù)責(zé)技術(shù)的新場景探索和業(yè)務(wù)落地。趙恒藝,2017年1月加入思必馳,任思必馳副總裁、DUI平臺(tái)總經(jīng)理,負(fù)責(zé)DUI平臺(tái)項(xiàng)目整體運(yùn)營和發(fā)展。此外,來自聯(lián)想之星、PPTV、明道數(shù)據(jù)等多位行業(yè)大咖加入思必馳,攜手前行,共探發(fā)展。
04榮譽(yù)篇
2017年在榮耀的聚光燈下,我們受到了極大的關(guān)注!
2017年4月,CCTV-2《經(jīng)濟(jì)半小時(shí)》以30分鐘篇幅全方面報(bào)道了關(guān)于思必馳的產(chǎn)學(xué)研一體化發(fā)展之路(CCTV-2《經(jīng)濟(jì)半小時(shí)》:看思必馳的披荊斬棘之路)。
2017年9月,CCTV-1《機(jī)智過人》展現(xiàn)思必馳語音合成技術(shù)(CCTV-1《機(jī)智過人》小馳一展歌喉,這是你不知道的歌聲合成?。?。
2017年11月,CCTV-1《機(jī)智過人》展現(xiàn)思必馳聲紋識(shí)別技術(shù)(聲紋識(shí)別 |“小思”PK霍尊辨識(shí)小青衣,這是來自人工智能的暴擊?。?。
同時(shí),思必馳入選了Gartner“2017東亞五大明星AI創(chuàng)業(yè)公司”,并再度被高盛評為“全球人工智能關(guān)鍵參與者”。2017年,思必馳斬獲了大大小小近百項(xiàng)榮譽(yù)。
05打造AI生態(tài)
未來,思必馳將繼續(xù)加速在物聯(lián)網(wǎng)領(lǐng)域的深入和拓展,整體布局,打造AI生態(tài),賦能萬物。
完善AI產(chǎn)業(yè)鏈布局
在整體生態(tài)方面,針對AI領(lǐng)域,思必馳于2016年成立馳星創(chuàng)投,得到了元禾資本、富士康、清華控股等LP的支持,旗下?lián)碛袃芍Щ穑謩e為2億元天使基金和10億元成長基金,專注投資人工智能和智能交互產(chǎn)業(yè)早期項(xiàng)目。思必馳對AI領(lǐng)域的關(guān)注并不僅局限在人工智能物聯(lián)網(wǎng)上下游產(chǎn)業(yè)鏈,也關(guān)注傳統(tǒng)行業(yè),促進(jìn)傳統(tǒng)行業(yè)的快速轉(zhuǎn)型,例如擴(kuò)展到了教育、醫(yī)療等。思必馳產(chǎn)業(yè)基金已成功孵化并投資了車蘿卜、慧聲、先聲教育、AITEK、SIGMOID、愛醫(yī)聲、RT-Thread等9家企業(yè)。
推進(jìn)AI產(chǎn)業(yè)化進(jìn)程
思必馳著力推進(jìn)AI產(chǎn)業(yè)化的進(jìn)程。2017年9月推出的DUI開放平臺(tái),將對話技術(shù)賦能給更多智能終端,推進(jìn)語音技術(shù)的規(guī)?;瘧?yīng)用。同期,阿里原iDST語音負(fù)責(zé)人初敏博士加入思必馳成立北京研發(fā)院,以針對企業(yè)的主動(dòng)交互式智能服務(wù)為切入點(diǎn),推動(dòng)AI產(chǎn)業(yè)化的進(jìn)程!
專注源頭技術(shù)創(chuàng)新與發(fā)展
思必馳是AI技術(shù)型企業(yè),思必馳堅(jiān)信,技術(shù)型企業(yè)的真正比拼并不在萬眾矚目的聚光燈下,技術(shù)軟硬實(shí)力才是長久之策。未來,依托蘇州研發(fā)總部、北京研發(fā)院、蘇州人工智能研究院的基礎(chǔ)性研究和應(yīng)用性探索,思必馳將不斷拓展智能語音的應(yīng)用場景和領(lǐng)域,帶動(dòng)AI語音技術(shù)的推陳出新,賦能更多智能終端產(chǎn)品,推動(dòng)傳統(tǒng)行業(yè)轉(zhuǎn)型,讓語音近在咫尺,走進(jìn)未來智能生活。
2018 我們,攜手同行!
-
人工智能
+關(guān)注
關(guān)注
1793文章
47532瀏覽量
239295 -
語音交互
+關(guān)注
關(guān)注
3文章
287瀏覽量
28044 -
思必馳
+關(guān)注
關(guān)注
4文章
289瀏覽量
14298
發(fā)布評論請先 登錄
相關(guān)推薦
評論