0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度與科大訊飛的競(jìng)爭(zhēng)正在從語(yǔ)音交互延伸到視覺(jué)交互等多模態(tài)技術(shù)上

電子工程師 ? 來(lái)源:未知 ? 作者:李倩 ? 2018-03-22 09:28 ? 次閱讀

近兩年來(lái),隨著人們?cè)絹?lái)越頻繁使用智能產(chǎn)品,所產(chǎn)生的數(shù)據(jù)越來(lái)越龐大,這些數(shù)據(jù)又被大公司所利用,龐大的數(shù)據(jù)也將催生“機(jī)器人大腦”。

目前市面上已經(jīng)誕生出越來(lái)越多的機(jī)器人產(chǎn)品,如:早教機(jī)器人、陪護(hù)機(jī)器人、商場(chǎng)機(jī)器人、銀行機(jī)器人、法務(wù)機(jī)器人等等,但是在實(shí)際的場(chǎng)景應(yīng)用中,機(jī)器人并不能帶來(lái)真正的智能。

最主要的功能就是體現(xiàn)在機(jī)器人大腦,用專業(yè)術(shù)語(yǔ)講就是“語(yǔ)義”,我們?cè)谡Z(yǔ)義的采集上還處在非常初級(jí)的階段,如果處理不了語(yǔ)義理解,那機(jī)器人在實(shí)際場(chǎng)景中的應(yīng)用就是一個(gè)“呆子”。

讓機(jī)器人開(kāi)口說(shuō)話,除了語(yǔ)義之外,語(yǔ)音也是關(guān)鍵的技術(shù),國(guó)內(nèi)科大訊飛在語(yǔ)音技術(shù)上的造詣,讓國(guó)內(nèi)很多做機(jī)器人的企業(yè)受惠,其語(yǔ)音處理技術(shù)基本上已經(jīng)能滿足人們?nèi)粘I钪械氖褂眯枨蟆?/p>

但是國(guó)內(nèi)機(jī)器人產(chǎn)業(yè)接下來(lái)的發(fā)展將會(huì)開(kāi)始加速,在這次1號(hào)機(jī)器人網(wǎng)研討會(huì)上,不管是百度,還是科大訊飛所傳遞的信息就是已做好全面出擊的準(zhǔn)備。

雖然國(guó)內(nèi)語(yǔ)音語(yǔ)義的發(fā)展正在加速,但是對(duì)機(jī)器人企業(yè)而言,速度還不夠快,目前不管是百度,還是科大訊飛所提供的語(yǔ)音語(yǔ)義還是不能滿足機(jī)器人在實(shí)際應(yīng)用中的要求。

城市漫步總經(jīng)理李正說(shuō):“在人們與機(jī)器人對(duì)話的過(guò)程中,一些簡(jiǎn)單的問(wèn)題,機(jī)器人是可以回答,但是稍微復(fù)雜一些的問(wèn)題,機(jī)器人就回答不了,BAT或科大訊飛所提供的語(yǔ)義,讓機(jī)器人處在小孩3歲左右的智力水平。對(duì)很多機(jī)器人企業(yè)而言,目前的瓶頸也是在這里,很難有所突破?!?/p>

科大訊飛銷售總監(jiān)廖凱說(shuō):“其實(shí)訊飛也很苦惱,語(yǔ)音助理已經(jīng)通過(guò)國(guó)家各種考試,很難說(shuō)它的智力不行,訊飛高考機(jī)器人基于目前的成長(zhǎng)速度,到2020年會(huì)考上一本,去年的數(shù)據(jù)顯示,語(yǔ)文考了90多分,數(shù)學(xué)考了110多分。”

只能說(shuō)人們?nèi)粘=涣髦?,所體現(xiàn)的語(yǔ)言很復(fù)雜,目前的大數(shù)據(jù)還不能夠支撐人們復(fù)雜的日常交流。

百度自然語(yǔ)言技術(shù)開(kāi)放負(fù)責(zé)人張晶晶說(shuō):“人工智能聰明程度其實(shí)很大程度上取決于數(shù)據(jù),百度為什么在人工智能領(lǐng)域國(guó)內(nèi)領(lǐng)先,因?yàn)楸澈笫驱嫶蟮臄?shù)據(jù),比如百度搜索,每天有60億次搜索,這些數(shù)據(jù)支撐百度深度語(yǔ)義理解,像這種過(guò)億用戶的APP,百度有14個(gè),這些數(shù)據(jù)支撐了百度大腦每時(shí)每刻都在進(jìn)化?!?/p>

“國(guó)內(nèi)各大平臺(tái),如:百度UNIT、訊飛AIUI、小i機(jī)器人、思必馳等,其實(shí)各家的側(cè)重點(diǎn)不同,因此,最終的測(cè)試結(jié)果也會(huì)不同,像百度的對(duì)話效果只有達(dá)到95%以上才會(huì)放出來(lái)。”

但是在這次1號(hào)機(jī)器人網(wǎng)研討會(huì)上,機(jī)器人企業(yè)對(duì)各大平臺(tái)所提供的語(yǔ)義依然不是特別滿意。

或許國(guó)內(nèi)各大機(jī)器人企業(yè)過(guò)于依賴BAT等企業(yè),希望依靠BAT大企業(yè)的投入完善語(yǔ)音語(yǔ)義技術(shù),但是百度已經(jīng)在語(yǔ)音語(yǔ)義上投入了3億元,雖然技術(shù)積累很快,但是目前的瓶頸是依然還不能支撐機(jī)器人日常復(fù)雜的對(duì)話交流。

狗尾草聯(lián)合創(chuàng)始人張博說(shuō):“3至5歲小孩,同一個(gè)問(wèn)題,在每個(gè)年齡段尋求的答案都不同,所以對(duì)語(yǔ)義的要求非常高,如果真要做好語(yǔ)義理解,就需要把語(yǔ)義理解做的足夠細(xì),再接入知識(shí)圖譜,如果是批量的知識(shí)圖譜,那就需要各大平臺(tái)開(kāi)放知識(shí)庫(kù),讓機(jī)器人企業(yè)去調(diào)用,滿足更高級(jí)開(kāi)發(fā)的產(chǎn)品需求。”

從這次1號(hào)機(jī)器人網(wǎng)研討會(huì)上反饋,現(xiàn)階段讓各大平臺(tái)完全開(kāi)放知識(shí)庫(kù)不現(xiàn)實(shí),像百度、科大訊飛、小i機(jī)器人等投入巨資打造知識(shí)庫(kù),機(jī)器人企業(yè)想調(diào)用深層次語(yǔ)義,就需要支付相應(yīng)的報(bào)酬。

當(dāng)然很多機(jī)器人企業(yè)對(duì)語(yǔ)音還是另有看法,比如AI與UI,明明很多場(chǎng)景直接通過(guò)UI就可以解決的事情,干嘛非要用語(yǔ)音,把簡(jiǎn)單的事情復(fù)雜化。

這個(gè)問(wèn)題的著重點(diǎn)在于,目前看來(lái)語(yǔ)音確實(shí)還不是最好用的產(chǎn)品,但是長(zhǎng)遠(yuǎn)看語(yǔ)音將會(huì)是最便捷的交互方式。

當(dāng)汽車和火車剛發(fā)明的時(shí)候,跑起來(lái)還沒(méi)有馬車快,但是終究汽車和火車是發(fā)展方向。

科大訊飛廖凱說(shuō):“人與機(jī)器發(fā)生交互的時(shí)候,輸入輸出信息有兩種,我們從機(jī)器身上獲取的信息,最簡(jiǎn)單的方式就是視覺(jué),一目了然;但我們輸出的信息最自然的方式是語(yǔ)音。這是語(yǔ)音的特性,未來(lái)一定會(huì)顛覆傳統(tǒng)以鍵盤或觸屏的輸出方式?!?/p>

接下來(lái),我們回到產(chǎn)品上來(lái),對(duì)機(jī)器人企業(yè)而言,現(xiàn)階段就算依靠BAT等企業(yè)的語(yǔ)音語(yǔ)義技術(shù),也不能讓產(chǎn)品具備高智慧,充其量只能達(dá)到小孩3歲左右的智力水平。

所以未來(lái)的方向在于細(xì)分場(chǎng)景,比如:訂機(jī)票、訂酒店等,采用百度和科大訊飛的語(yǔ)音語(yǔ)義可以非常成熟的完成,讓用戶從查詢機(jī)票到預(yù)訂票到購(gòu)買機(jī)票等全過(guò)程,期間進(jìn)行的多輪復(fù)雜人機(jī)對(duì)話可達(dá)7層以上。

因此,在一些細(xì)分商用場(chǎng)景,語(yǔ)音已經(jīng)可以做到替代客服的工作,對(duì)機(jī)器人企業(yè)而言,如何讓機(jī)器人+語(yǔ)音語(yǔ)義+使用場(chǎng)景落地才是接下來(lái)重點(diǎn)思考的方向。

百度張晶晶認(rèn)為,通過(guò)百度大數(shù)據(jù)分析,兒童故事機(jī)的市場(chǎng)規(guī)模很大,目前正是更新?lián)Q代的時(shí)間節(jié)點(diǎn),因此,百度對(duì)兒童領(lǐng)域的投入會(huì)有所加大。

科大訊飛廖凱說(shuō):“今年大型商用機(jī)器人會(huì)有所發(fā)展,目前訊飛曉曼機(jī)器人已經(jīng)入駐紅星美凱龍、居然之家,以及一些零售商場(chǎng)。曉曼機(jī)器人目前已經(jīng)可以做到導(dǎo)航領(lǐng)路、提供資訊、針對(duì)商場(chǎng)還提供了一套機(jī)器人營(yíng)銷方案,通過(guò)大數(shù)據(jù)幫助商家提高客戶的轉(zhuǎn)化率?!?/p>

目前國(guó)內(nèi)大型商用機(jī)器人研發(fā)投入大,但是相對(duì)售價(jià)高、利潤(rùn)高,很多機(jī)器人企業(yè)在大型商用機(jī)器人身上舍得投入,因此,對(duì)科大訊飛而言,也有更強(qiáng)的動(dòng)力去做技術(shù)的迭代。

如果從競(jìng)爭(zhēng)的角度去分析,目前百度和科大訊飛提供的語(yǔ)音語(yǔ)義方案是旗鼓相當(dāng)。

但是接下來(lái)的競(jìng)爭(zhēng)將會(huì)更加深入,涉及到多模態(tài)技術(shù)交互。

科大訊飛在AIUI的構(gòu)架下,加入手勢(shì)識(shí)別、圖像識(shí)別,使得人機(jī)交互技術(shù)更加復(fù)雜;百度也是一樣,在提供語(yǔ)音交互的基礎(chǔ)上加入圖像識(shí)別,提供一站式服務(wù)。

因此,百度與科大訊飛的競(jìng)爭(zhēng)正在從語(yǔ)音交互延伸到視覺(jué)交互等多模態(tài)技術(shù)上,對(duì)機(jī)器人企業(yè)而言,全新的時(shí)代即將來(lái)臨,在主流人工智能企業(yè)激烈的競(jìng)爭(zhēng)下,能夠享受到的技術(shù)紅利是,可以以低成本的方案去創(chuàng)造一臺(tái)全新的機(jī)器人。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28632

    瀏覽量

    207968
  • 科大訊飛
    +關(guān)注

    關(guān)注

    19

    文章

    818

    瀏覽量

    61416
  • 自然語(yǔ)言
    +關(guān)注

    關(guān)注

    1

    文章

    291

    瀏覽量

    13384

原文標(biāo)題:百度與科大訊飛競(jìng)爭(zhēng)將從語(yǔ)音擴(kuò)散到視覺(jué)

文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    科大推出大模型極速超擬人交互軟硬件方案

    隨著大模型技術(shù)的不斷發(fā)展,大模型的應(yīng)用越來(lái)越受到行業(yè)的重視。如何在智能硬件的語(yǔ)音交互快速應(yīng)用和普及大模型,一直是業(yè)內(nèi)熱議和探索的話題。
    的頭像 發(fā)表于 01-16 11:07 ?208次閱讀

    科大即將發(fā)布星火深度推理模型X1

    ,標(biāo)志著科大飛在AI技術(shù)領(lǐng)域的又一次重大突破。星火深度推理模型X1將為科大
    的頭像 發(fā)表于 01-08 10:30 ?302次閱讀

    科大AI虛擬人交互平臺(tái)榮獲行業(yè)最高評(píng)級(jí)

    近日,科大的AI虛擬人交互平臺(tái)順利完成中國(guó)信通院人工智能研究所組織的大模型數(shù)字人基礎(chǔ)能力分級(jí)測(cè)試,并獲得最高等級(jí)L5認(rèn)證,系國(guó)內(nèi)首批。
    的頭像 發(fā)表于 12-13 11:39 ?330次閱讀

    科大發(fā)布星火4.0 Turbo大模型及星火多語(yǔ)言大模型

    近日,科大正式推出了其最新研發(fā)成果——星火4.0 Turbo大模型。這一發(fā)布不僅標(biāo)志著科大
    的頭像 發(fā)表于 10-24 13:58 ?444次閱讀

    2024科大全球1024開(kāi)發(fā)者節(jié)官宣

    在這場(chǎng)屬于開(kāi)發(fā)者的年度人工智能盛會(huì)上,不僅有產(chǎn)學(xué)研大咖現(xiàn)場(chǎng)分享,升級(jí)行業(yè)大模型及更多應(yīng)用產(chǎn)品,首發(fā)模態(tài)視覺(jué)交互及超擬人虛擬人交互能力,
    的頭像 發(fā)表于 10-14 10:01 ?820次閱讀

    科大將首發(fā)模態(tài)視覺(jué)交互及超擬人虛擬人交互

    近日,科大傳來(lái)喜訊,第七屆世界聲博會(huì)暨2024科大全球1024開(kāi)發(fā)者節(jié)將于10月24日至
    的頭像 發(fā)表于 10-11 16:48 ?392次閱讀

    科大發(fā)布星火極速超擬人交互,重塑智能對(duì)話新體驗(yàn)

    8月19日,科大震撼宣布了一項(xiàng)關(guān)于其明星產(chǎn)品——星火語(yǔ)音大模型的重大革新,即將推出的“星火極速超擬人交互”功能,預(yù)示著人機(jī)
    的頭像 發(fā)表于 08-20 16:46 ?382次閱讀

    科大發(fā)布星火大模型V4.0

    在科技創(chuàng)新的浪潮中,科大再度引領(lǐng)潮流,于北京隆重發(fā)布了星火大模型V4.0及其在領(lǐng)域的人
    的頭像 發(fā)表于 07-01 10:33 ?919次閱讀

    科大榮獲2023年國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一獎(jiǎng)

    近日,2023年國(guó)家科學(xué)技術(shù)獎(jiǎng)?wù)浇視裕?b class='flag-5'>科大憑借其杰出的科研成果——《多語(yǔ)種智能語(yǔ)音關(guān)鍵
    的頭像 發(fā)表于 06-26 10:36 ?676次閱讀

    聆思CSK6視覺(jué)語(yǔ)音大模型AI開(kāi)發(fā)板入門資源合集(硬件資料、大模型語(yǔ)音/模態(tài)交互/英語(yǔ)評(píng)測(cè)SDK合集)

    豐富外設(shè)配件 配套模態(tài)應(yīng)用示例,支持快速上手體驗(yàn)大模型語(yǔ)音交互、智能視覺(jué) AI 應(yīng)用 板載
    發(fā)表于 06-18 17:33

    李未可科技正式推出WAKE-AI模態(tài)AI大模型

    文本生成、語(yǔ)言理解、圖像識(shí)別及視頻生成模態(tài)交互能力。 ? 該大模型圍繞 GPS 軌跡+視覺(jué)+語(yǔ)音
    發(fā)表于 04-18 17:01 ?642次閱讀
    李未可科技正式推出WAKE-AI<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大模型

    科大華中總部已封頂 年內(nèi)交付使用

    科大華中總部已封頂 年內(nèi)交付使用 科大華中總部位于武漢經(jīng)開(kāi)區(qū)車谷資本島,投資額50億;計(jì)
    的頭像 發(fā)表于 04-16 14:49 ?1606次閱讀

    【有獎(jiǎng)】 百度智能云目推出首款模態(tài) AI 模組,應(yīng)用場(chǎng)景有獎(jiǎng)?wù)骷?/a>

    他來(lái)了,他來(lái)了 大模型時(shí)代悄然到來(lái) 百度首款大模型落地的硬件產(chǎn)品 模態(tài)AI模組LUCA系列正式亮相 目LUCA深度集成
    的頭像 發(fā)表于 02-26 15:19 ?568次閱讀

    科大發(fā)布“星火V3.5”:基于全國(guó)產(chǎn)算力訓(xùn)練的全民開(kāi)放大模型

    科大,作為中國(guó)領(lǐng)先的智能語(yǔ)音和人工智能公司,近日宣布推出首個(gè)基于全國(guó)產(chǎn)算力訓(xùn)練的全民開(kāi)放大模型“
    的頭像 發(fā)表于 02-04 11:28 ?1563次閱讀

    科大發(fā)布星火語(yǔ)音大模型

    科大行業(yè)資訊
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年01月31日 09:17:28