10月30日消息,剛剛結(jié)束的李佳琦直播間里,剁手黨通過(guò)阿里語(yǔ)音機(jī)器人首次實(shí)現(xiàn)與主播的實(shí)時(shí)互動(dòng)。直播過(guò)程中,數(shù)十萬(wàn)用戶同時(shí)用語(yǔ)音回答李佳琦的提問(wèn),最終機(jī)器人在50毫秒內(nèi)就完成了語(yǔ)音識(shí)別和語(yǔ)音反饋全過(guò)程,反應(yīng)速度是傳統(tǒng)語(yǔ)音的20倍。
淘寶直播間觀眾用語(yǔ)音與李佳琦互動(dòng)
今年雙11期間,淘寶直播間推出 “語(yǔ)音猜價(jià)格”功能,觀眾在直播間也能實(shí)現(xiàn)語(yǔ)音交互,例如動(dòng)動(dòng)嘴就可以響應(yīng)主播發(fā)出的猜產(chǎn)品價(jià)格任務(wù)。語(yǔ)音機(jī)器人成為決定這一互動(dòng)過(guò)程能否順暢的關(guān)鍵。
據(jù)介紹,一場(chǎng)淘寶直播的觀眾數(shù)量可達(dá)百萬(wàn)甚至千萬(wàn),并且用戶分布在全國(guó)各地,口音差異較大,目前主流的語(yǔ)音技術(shù)方案很難做到短時(shí)間內(nèi)快速響應(yīng)如此體量的用戶語(yǔ)音,例如類似Siri識(shí)別用戶語(yǔ)音的響應(yīng)時(shí)長(zhǎng)就在1秒以上,無(wú)法滿足直播場(chǎng)景強(qiáng)互動(dòng)的要求。
此次淘寶直播間采用了達(dá)摩院最新的移動(dòng)端離線端到端語(yǔ)音識(shí)別技術(shù)。基于全新的網(wǎng)絡(luò)結(jié)構(gòu)和語(yǔ)音識(shí)別框架,即便在低配手機(jī)上,也能在50毫秒內(nèi)完成語(yǔ)音交互過(guò)程,速度是傳統(tǒng)語(yǔ)音識(shí)別的20倍;此外,該技術(shù)還解決了快語(yǔ)速、重口音等問(wèn)題,高難度場(chǎng)景中的語(yǔ)音識(shí)別錯(cuò)誤率降低近三成。
達(dá)摩院語(yǔ)音實(shí)驗(yàn)室技術(shù)專家萬(wàn)玉龍表示,“在實(shí)時(shí)性要求極高的場(chǎng)景,傳統(tǒng)的云端語(yǔ)音方案無(wú)法滿足需求,這套語(yǔ)音技術(shù)的創(chuàng)新在于同時(shí)實(shí)現(xiàn)了識(shí)別速度和準(zhǔn)確度的提升,語(yǔ)音AI模型部署在每個(gè)用戶的淘寶直播APP上,即便直播間有千萬(wàn)級(jí)別的用戶,AI也不會(huì)漏聽(tīng)慢判。”
過(guò)去幾年,阿里語(yǔ)音AI在基礎(chǔ)研究和應(yīng)用上取得了一系列突破。2019年,阿里語(yǔ)音AI入選《麻省理工評(píng)論》“全球十大突破性技術(shù)”,是唯一上榜的中國(guó)科技公司;今年7月IDC發(fā)布的《中國(guó)AI云服務(wù)市場(chǎng)半年度研究報(bào)告》顯示,阿里語(yǔ)音AI以44%的市場(chǎng)份額,在云上語(yǔ)音AI市場(chǎng)中位居第一。
責(zé)任編輯:PSY
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28566瀏覽量
207716 -
語(yǔ)音識(shí)別
+關(guān)注
關(guān)注
38文章
1742瀏覽量
112750 -
Siri
+關(guān)注
關(guān)注
4文章
206瀏覽量
37081 -
阿里
+關(guān)注
關(guān)注
6文章
440瀏覽量
32857
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論