0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里語(yǔ)音機(jī)器人首次實(shí)現(xiàn)與主播的實(shí)時(shí)互動(dòng) 反應(yīng)速度是Siri的20倍

工程師鄧生 ? 來(lái)源:獵云網(wǎng) ? 作者:獵云網(wǎng) ? 2020-11-02 17:47 ? 次閱讀

10月30日消息,剛剛結(jié)束的李佳琦直播間里,剁手黨通過(guò)阿里語(yǔ)音機(jī)器人首次實(shí)現(xiàn)與主播的實(shí)時(shí)互動(dòng)。直播過(guò)程中,數(shù)十萬(wàn)用戶同時(shí)用語(yǔ)音回答李佳琦的提問(wèn),最終機(jī)器人在50毫秒內(nèi)就完成了語(yǔ)音識(shí)別和語(yǔ)音反饋全過(guò)程,反應(yīng)速度是傳統(tǒng)語(yǔ)音的20倍。

淘寶直播間觀眾用語(yǔ)音與李佳琦互動(dòng)

今年雙11期間,淘寶直播間推出 “語(yǔ)音猜價(jià)格”功能,觀眾在直播間也能實(shí)現(xiàn)語(yǔ)音交互,例如動(dòng)動(dòng)嘴就可以響應(yīng)主播發(fā)出的猜產(chǎn)品價(jià)格任務(wù)。語(yǔ)音機(jī)器人成為決定這一互動(dòng)過(guò)程能否順暢的關(guān)鍵。

據(jù)介紹,一場(chǎng)淘寶直播的觀眾數(shù)量可達(dá)百萬(wàn)甚至千萬(wàn),并且用戶分布在全國(guó)各地,口音差異較大,目前主流的語(yǔ)音技術(shù)方案很難做到短時(shí)間內(nèi)快速響應(yīng)如此體量的用戶語(yǔ)音,例如類似Siri識(shí)別用戶語(yǔ)音的響應(yīng)時(shí)長(zhǎng)就在1秒以上,無(wú)法滿足直播場(chǎng)景強(qiáng)互動(dòng)的要求。

此次淘寶直播間采用了達(dá)摩院最新的移動(dòng)端離線端到端語(yǔ)音識(shí)別技術(shù)。基于全新的網(wǎng)絡(luò)結(jié)構(gòu)和語(yǔ)音識(shí)別框架,即便在低配手機(jī)上,也能在50毫秒內(nèi)完成語(yǔ)音交互過(guò)程,速度是傳統(tǒng)語(yǔ)音識(shí)別的20倍;此外,該技術(shù)還解決了快語(yǔ)速、重口音等問(wèn)題,高難度場(chǎng)景中的語(yǔ)音識(shí)別錯(cuò)誤率降低近三成。

達(dá)摩院語(yǔ)音實(shí)驗(yàn)室技術(shù)專家萬(wàn)玉龍表示,“在實(shí)時(shí)性要求極高的場(chǎng)景,傳統(tǒng)的云端語(yǔ)音方案無(wú)法滿足需求,這套語(yǔ)音技術(shù)的創(chuàng)新在于同時(shí)實(shí)現(xiàn)了識(shí)別速度和準(zhǔn)確度的提升,語(yǔ)音AI模型部署在每個(gè)用戶的淘寶直播APP上,即便直播間有千萬(wàn)級(jí)別的用戶,AI也不會(huì)漏聽(tīng)慢判。”

過(guò)去幾年,阿里語(yǔ)音AI在基礎(chǔ)研究和應(yīng)用上取得了一系列突破。2019年,阿里語(yǔ)音AI入選《麻省理工評(píng)論》“全球十大突破性技術(shù)”,是唯一上榜的中國(guó)科技公司;今年7月IDC發(fā)布的《中國(guó)AI云服務(wù)市場(chǎng)半年度研究報(bào)告》顯示,阿里語(yǔ)音AI以44%的市場(chǎng)份額,在云上語(yǔ)音AI市場(chǎng)中位居第一。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28566

    瀏覽量

    207716
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1742

    瀏覽量

    112750
  • Siri
    +關(guān)注

    關(guān)注

    4

    文章

    206

    瀏覽量

    37081
  • 阿里
    +關(guān)注

    關(guān)注

    6

    文章

    440

    瀏覽量

    32857
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊

    ,一次生成深度信息。 自主機(jī)器人定位任務(wù)的本質(zhì)是對(duì)機(jī)器人自身狀態(tài)的估計(jì)問(wèn)題,包括位置,朝向,速度等問(wèn)題。 路徑規(guī)劃旨在找到從起點(diǎn)到目標(biāo)區(qū)域的路徑,確保路徑的可行性和最優(yōu)性。路徑規(guī)劃方法包括變分方法,圖搜
    發(fā)表于 01-04 19:22

    開(kāi)源項(xiàng)目!能夠精確地行走、跳舞和執(zhí)行復(fù)雜動(dòng)作的機(jī)器人—Tillu

    認(rèn)識(shí)Tillu——機(jī)器人 Tillu是一款融合先進(jìn)機(jī)器人技術(shù)與創(chuàng)造力的獨(dú)特機(jī)器人,旨在激發(fā)學(xué)習(xí)與創(chuàng)新!它由運(yùn)行Debian操作系統(tǒng)的UNIHIKER驅(qū)動(dòng),利用強(qiáng)大的控制系統(tǒng)實(shí)現(xiàn)逼真的動(dòng)
    發(fā)表于 01-02 17:24

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型

    中取得了令人矚目的效果。 閱讀感悟 從傳統(tǒng)的手動(dòng)編程到借助大模型實(shí)現(xiàn)智能化、自主化,從單一模態(tài)的交互到多模態(tài)信息的深度融合,再到擴(kuò)散模型的應(yīng)用,機(jī)器人控制技術(shù)正在以驚人的速度進(jìn)化。這不僅讓機(jī)器
    發(fā)表于 12-29 23:04

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    現(xiàn)狀和前沿研究,詳細(xì)介紹大模型的構(gòu)建方法、訓(xùn)練數(shù)據(jù)、模型架構(gòu)和優(yōu)化技術(shù)。 第4部分(第10章到第13章)深入探討提升機(jī)器人計(jì)算實(shí)時(shí)性、算法安全性、系統(tǒng)可靠性及具身智能數(shù)據(jù)挑戰(zhàn)的具身智能機(jī)器人系統(tǒng)研究
    發(fā)表于 12-28 21:12

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    解決許多技術(shù)的和非技術(shù)的挑戰(zhàn),如提高智能體的自主性、處理復(fù)雜環(huán)境互動(dòng)的能力及確保行為的倫理和安全性。 未來(lái)的研究需要將視覺(jué)、語(yǔ)音和其他傳感技術(shù)與機(jī)器人技術(shù)相結(jié)合,以探索更加先進(jìn)的知識(shí)表示和記憶模塊,利用強(qiáng)化學(xué)習(xí)進(jìn)一步優(yōu)化決策過(guò)程
    發(fā)表于 12-20 19:17

    《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

    ,互聯(lián)網(wǎng)行業(yè)占成熟經(jīng)濟(jì)體的GDP增長(zhǎng)的21%,世界經(jīng)濟(jì)正面向數(shù)字經(jīng)濟(jì)轉(zhuǎn)型的大趨勢(shì)。具身智能機(jī)器人集成人工智能、高端制造、新材料等技術(shù),其核心在于通過(guò)智能體與環(huán)境的動(dòng)態(tài)互動(dòng)實(shí)現(xiàn)智能行為。 在第2章“具身
    發(fā)表于 12-19 22:26

    湯姆貓發(fā)布AI語(yǔ)音情感陪伴機(jī)器人研發(fā)進(jìn)展

    ,能夠智能識(shí)別聲音來(lái)源的位置與方向,實(shí)現(xiàn)120°的自由轉(zhuǎn)頭,確保始終面向用戶進(jìn)行語(yǔ)音對(duì)話。這一設(shè)計(jì)不僅增強(qiáng)了機(jī)器人互動(dòng)性,還大大提升了用戶的溝通體驗(yàn)。 此外,湯姆貓AI
    的頭像 發(fā)表于 12-17 11:27 ?710次閱讀

    機(jī)器人語(yǔ)音功能

    經(jīng)典卡通角色的聲音成為了它們的“名片”。那么,機(jī)器人語(yǔ)音功能究竟是如何實(shí)現(xiàn)的?它與智能模組有什么關(guān)系?誰(shuí)是這類服務(wù)機(jī)器人語(yǔ)音“指揮官”?
    的頭像 發(fā)表于 12-02 10:50 ?437次閱讀

    語(yǔ)音識(shí)別機(jī)器人的工作原理

    語(yǔ)音識(shí)別機(jī)器人的工作原理主要基于一系列復(fù)雜的技術(shù)流程,包括信號(hào)采集、預(yù)處理、特征提取、聲學(xué)模型匹配、語(yǔ)言模型預(yù)測(cè)以及最終的解碼輸出。 一、信號(hào)采集 語(yǔ)音識(shí)別機(jī)器人首先通過(guò)麥克風(fēng)等音頻輸
    的頭像 發(fā)表于 10-25 09:25 ?509次閱讀

    構(gòu)建語(yǔ)音控制機(jī)器人 - 線性模型和機(jī)器學(xué)習(xí)

    2024-07-31 |Annabel Ng 在該項(xiàng)目的[上一篇博客文章]中,我介紹了運(yùn)行機(jī)器人電機(jī)、處理音頻信號(hào)和調(diào)節(jié)電壓所需的電路的基礎(chǔ)知識(shí)。然而,機(jī)器人還沒(méi)有完全完成!盡管機(jī)器人可以正確移動(dòng)
    的頭像 發(fā)表于 10-02 16:31 ?241次閱讀
    構(gòu)建<b class='flag-5'>語(yǔ)音</b>控制<b class='flag-5'>機(jī)器人</b> - 線性模型和<b class='flag-5'>機(jī)器</b>學(xué)習(xí)

    開(kāi)源項(xiàng)目!用ESP32做一個(gè)可愛(ài)的無(wú)用機(jī)器人

    簡(jiǎn)介 作者在完成碩士論文答辯后,利用空閑時(shí)間制作了一個(gè)他一直想做的機(jī)器人——可愛(ài)無(wú)用機(jī)器人。 無(wú)用機(jī)器人原理是一個(gè)連接到開(kāi)關(guān)的電機(jī),通過(guò)邏輯門控制。當(dāng)開(kāi)關(guān)被推到“開(kāi)”時(shí),機(jī)器人啟動(dòng)
    發(fā)表于 09-03 09:34

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說(shuō),薩科微Al大模型機(jī)器人有哪些的優(yōu)勢(shì)?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊(duì)開(kāi)發(fā),與同行相比具有許多優(yōu)勢(shì):語(yǔ)言
    發(fā)表于 07-05 08:52

    基于FPGA EtherCAT的六自由度機(jī)器人視覺(jué)伺服控制設(shè)計(jì)

    和增強(qiáng)系統(tǒng)處理圖像的實(shí)時(shí)性,本文提出了一種伊瑟特的六自由度機(jī)器人視覺(jué)伺服控制系統(tǒng),將攝像頭集成到基于 Zynq的伊瑟特站上,提高了視覺(jué)伺服的實(shí)時(shí)性.經(jīng)測(cè)試,該平臺(tái)能夠?qū)σ曈X(jué)檢測(cè)目標(biāo)的
    發(fā)表于 05-29 16:17

    stm32f303的比較器反應(yīng)速度多少???

    stm32f303的比較器反應(yīng)速度多少???有木有20mv的數(shù)據(jù)?手冊(cè)上說(shuō):100mv的壓差反應(yīng)延時(shí)為35ns。怎么我的應(yīng)用里用PA0輸出光上升沿就用了5ms之多呢?(為了驗(yàn)證一下,我直接斷點(diǎn),捕獲的波形)比較器配置為為高速模式,
    發(fā)表于 05-08 06:08

    其利天下技術(shù)·搭載無(wú)刷電機(jī)的掃地機(jī)器人的前景如何?

    地毯并增加吸力,或是繞過(guò)障礙物進(jìn)行清掃。同時(shí),通過(guò)手機(jī)APP遠(yuǎn)程控制、語(yǔ)音指令等方式,用戶可以方便地操作掃地機(jī)器人,實(shí)現(xiàn)個(gè)性化的清潔需求。 3.掃地機(jī)器人面臨的技術(shù)壁壘與客戶體驗(yàn)問(wèn)題
    發(fā)表于 05-05 15:03