近兩年來(lái),隨著人們?cè)絹?lái)越頻繁使用智能產(chǎn)品,所產(chǎn)生的數(shù)據(jù)越來(lái)越龐大,這些數(shù)據(jù)又被大公司所利用,龐大的數(shù)據(jù)也將催生“機(jī)器人大腦”。
目前市面上已經(jīng)誕生出越來(lái)越多的機(jī)器人產(chǎn)品,如:早教機(jī)器人、陪護(hù)機(jī)器人、商場(chǎng)機(jī)器人、銀行機(jī)器人、法務(wù)機(jī)器人等等,但是在實(shí)際的場(chǎng)景應(yīng)用中,機(jī)器人并不能帶來(lái)真正的智能。
最主要的功能就是體現(xiàn)在機(jī)器人大腦,用專業(yè)術(shù)語(yǔ)講就是“語(yǔ)義”,我們?cè)谡Z(yǔ)義的采集上還處在非常初級(jí)的階段,如果處理不了語(yǔ)義理解,那機(jī)器人在實(shí)際場(chǎng)景中的應(yīng)用就是一個(gè)“呆子”。
讓機(jī)器人開(kāi)口說(shuō)話,除了語(yǔ)義之外,語(yǔ)音也是關(guān)鍵的技術(shù),國(guó)內(nèi)科大訊飛在語(yǔ)音技術(shù)上的造詣,讓國(guó)內(nèi)很多做機(jī)器人的企業(yè)受惠,其語(yǔ)音處理技術(shù)基本上已經(jīng)能滿足人們?nèi)粘I钪械氖褂眯枨蟆?/p>
但是國(guó)內(nèi)機(jī)器人產(chǎn)業(yè)接下來(lái)的發(fā)展將會(huì)開(kāi)始加速,在這次1號(hào)機(jī)器人網(wǎng)研討會(huì)上,不管是百度,還是科大訊飛所傳遞的信息就是已做好全面出擊的準(zhǔn)備。
雖然國(guó)內(nèi)語(yǔ)音語(yǔ)義的發(fā)展正在加速,但是對(duì)機(jī)器人企業(yè)而言,速度還不夠快,目前不管是百度,還是科大訊飛所提供的語(yǔ)音語(yǔ)義還是不能滿足機(jī)器人在實(shí)際應(yīng)用中的要求。
城市漫步總經(jīng)理李正說(shuō):“在人們與機(jī)器人對(duì)話的過(guò)程中,一些簡(jiǎn)單的問(wèn)題,機(jī)器人是可以回答,但是稍微復(fù)雜一些的問(wèn)題,機(jī)器人就回答不了,BAT或科大訊飛所提供的語(yǔ)義,讓機(jī)器人處在小孩3歲左右的智力水平。對(duì)很多機(jī)器人企業(yè)而言,目前的瓶頸也是在這里,很難有所突破?!?/p>
科大訊飛銷售總監(jiān)廖凱說(shuō):“其實(shí)訊飛也很苦惱,語(yǔ)音助理已經(jīng)通過(guò)國(guó)家各種考試,很難說(shuō)它的智力不行,訊飛高考機(jī)器人基于目前的成長(zhǎng)速度,到2020年會(huì)考上一本,去年的數(shù)據(jù)顯示,語(yǔ)文考了90多分,數(shù)學(xué)考了110多分。”
只能說(shuō)人們?nèi)粘=涣髦?,所體現(xiàn)的語(yǔ)言很復(fù)雜,目前的大數(shù)據(jù)還不能夠支撐人們復(fù)雜的日常交流。
百度自然語(yǔ)言技術(shù)開(kāi)放負(fù)責(zé)人張晶晶說(shuō):“人工智能聰明程度其實(shí)很大程度上取決于數(shù)據(jù),百度為什么在人工智能領(lǐng)域國(guó)內(nèi)領(lǐng)先,因?yàn)楸澈笫驱嫶蟮臄?shù)據(jù),比如百度搜索,每天有60億次搜索,這些數(shù)據(jù)支撐百度深度語(yǔ)義理解,像這種過(guò)億用戶的APP,百度有14個(gè),這些數(shù)據(jù)支撐了百度大腦每時(shí)每刻都在進(jìn)化?!?/p>
“國(guó)內(nèi)各大平臺(tái),如:百度UNIT、訊飛AIUI、小i機(jī)器人、思必馳等,其實(shí)各家的側(cè)重點(diǎn)不同,因此,最終的測(cè)試結(jié)果也會(huì)不同,像百度的對(duì)話效果只有達(dá)到95%以上才會(huì)放出來(lái)。”
但是在這次1號(hào)機(jī)器人網(wǎng)研討會(huì)上,機(jī)器人企業(yè)對(duì)各大平臺(tái)所提供的語(yǔ)義依然不是特別滿意。
或許國(guó)內(nèi)各大機(jī)器人企業(yè)過(guò)于依賴BAT等企業(yè),希望依靠BAT大企業(yè)的投入完善語(yǔ)音語(yǔ)義技術(shù),但是百度已經(jīng)在語(yǔ)音語(yǔ)義上投入了3億元,雖然技術(shù)積累很快,但是目前的瓶頸是依然還不能支撐機(jī)器人日常復(fù)雜的對(duì)話交流。
狗尾草聯(lián)合創(chuàng)始人張博說(shuō):“3至5歲小孩,同一個(gè)問(wèn)題,在每個(gè)年齡段尋求的答案都不同,所以對(duì)語(yǔ)義的要求非常高,如果真要做好語(yǔ)義理解,就需要把語(yǔ)義理解做的足夠細(xì),再接入知識(shí)圖譜,如果是批量的知識(shí)圖譜,那就需要各大平臺(tái)開(kāi)放知識(shí)庫(kù),讓機(jī)器人企業(yè)去調(diào)用,滿足更高級(jí)開(kāi)發(fā)的產(chǎn)品需求。”
從這次1號(hào)機(jī)器人網(wǎng)研討會(huì)上反饋,現(xiàn)階段讓各大平臺(tái)完全開(kāi)放知識(shí)庫(kù)不現(xiàn)實(shí),像百度、科大訊飛、小i機(jī)器人等投入巨資打造知識(shí)庫(kù),機(jī)器人企業(yè)想調(diào)用深層次語(yǔ)義,就需要支付相應(yīng)的報(bào)酬。
當(dāng)然很多機(jī)器人企業(yè)對(duì)語(yǔ)音還是另有看法,比如AI與UI,明明很多場(chǎng)景直接通過(guò)UI就可以解決的事情,干嘛非要用語(yǔ)音,把簡(jiǎn)單的事情復(fù)雜化。
這個(gè)問(wèn)題的著重點(diǎn)在于,目前看來(lái)語(yǔ)音確實(shí)還不是最好用的產(chǎn)品,但是長(zhǎng)遠(yuǎn)看語(yǔ)音將會(huì)是最便捷的交互方式。
當(dāng)汽車和火車剛發(fā)明的時(shí)候,跑起來(lái)還沒(méi)有馬車快,但是終究汽車和火車是發(fā)展方向。
科大訊飛廖凱說(shuō):“人與機(jī)器發(fā)生交互的時(shí)候,輸入輸出信息有兩種,我們從機(jī)器身上獲取的信息,最簡(jiǎn)單的方式就是視覺(jué),一目了然;但我們輸出的信息最自然的方式是語(yǔ)音。這是語(yǔ)音的特性,未來(lái)一定會(huì)顛覆傳統(tǒng)以鍵盤或觸屏的輸出方式?!?/p>
接下來(lái),我們回到產(chǎn)品上來(lái),對(duì)機(jī)器人企業(yè)而言,現(xiàn)階段就算依靠BAT等企業(yè)的語(yǔ)音語(yǔ)義技術(shù),也不能讓產(chǎn)品具備高智慧,充其量只能達(dá)到小孩3歲左右的智力水平。
所以未來(lái)的方向在于細(xì)分場(chǎng)景,比如:訂機(jī)票、訂酒店等,采用百度和科大訊飛的語(yǔ)音語(yǔ)義可以非常成熟的完成,讓用戶從查詢機(jī)票到預(yù)訂票到購(gòu)買機(jī)票等全過(guò)程,期間進(jìn)行的多輪復(fù)雜人機(jī)對(duì)話可達(dá)7層以上。
因此,在一些細(xì)分商用場(chǎng)景,語(yǔ)音已經(jīng)可以做到替代客服的工作,對(duì)機(jī)器人企業(yè)而言,如何讓機(jī)器人+語(yǔ)音語(yǔ)義+使用場(chǎng)景落地才是接下來(lái)重點(diǎn)思考的方向。
百度張晶晶認(rèn)為,通過(guò)百度大數(shù)據(jù)分析,兒童故事機(jī)的市場(chǎng)規(guī)模很大,目前正是更新?lián)Q代的時(shí)間節(jié)點(diǎn),因此,百度對(duì)兒童領(lǐng)域的投入會(huì)有所加大。
科大訊飛廖凱說(shuō):“今年大型商用機(jī)器人會(huì)有所發(fā)展,目前訊飛曉曼機(jī)器人已經(jīng)入駐紅星美凱龍、居然之家,以及一些零售商場(chǎng)。曉曼機(jī)器人目前已經(jīng)可以做到導(dǎo)航領(lǐng)路、提供資訊、針對(duì)商場(chǎng)還提供了一套機(jī)器人營(yíng)銷方案,通過(guò)大數(shù)據(jù)幫助商家提高客戶的轉(zhuǎn)化率?!?/p>
目前國(guó)內(nèi)大型商用機(jī)器人研發(fā)投入大,但是相對(duì)售價(jià)高、利潤(rùn)高,很多機(jī)器人企業(yè)在大型商用機(jī)器人身上舍得投入,因此,對(duì)科大訊飛而言,也有更強(qiáng)的動(dòng)力去做技術(shù)的迭代。
如果從競(jìng)爭(zhēng)的角度去分析,目前百度和科大訊飛提供的語(yǔ)音語(yǔ)義方案是旗鼓相當(dāng)。
但是接下來(lái)的競(jìng)爭(zhēng)將會(huì)更加深入,涉及到多模態(tài)技術(shù)交互。
科大訊飛在AIUI的構(gòu)架下,加入手勢(shì)識(shí)別、圖像識(shí)別,使得人機(jī)交互技術(shù)更加復(fù)雜;百度也是一樣,在提供語(yǔ)音交互的基礎(chǔ)上加入圖像識(shí)別,提供一站式服務(wù)。
因此,百度與科大訊飛的競(jìng)爭(zhēng)正在從語(yǔ)音交互延伸到視覺(jué)交互等多模態(tài)技術(shù)上,對(duì)機(jī)器人企業(yè)而言,全新的時(shí)代即將來(lái)臨,在主流人工智能企業(yè)激烈的競(jìng)爭(zhēng)下,能夠享受到的技術(shù)紅利是,可以以低成本的方案去創(chuàng)造一臺(tái)全新的機(jī)器人。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28632瀏覽量
207968 -
科大訊飛
+關(guān)注
關(guān)注
19文章
818瀏覽量
61416 -
自然語(yǔ)言
+關(guān)注
關(guān)注
1文章
291瀏覽量
13384
原文標(biāo)題:百度與科大訊飛競(jìng)爭(zhēng)將從語(yǔ)音擴(kuò)散到視覺(jué)
文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論