近年來(lái)英語(yǔ)市場(chǎng)各大品牌紛紛發(fā)表自有語(yǔ)音助理與智能音箱,除了意味著人工智能(AI)技術(shù)開(kāi)始應(yīng)用于居家場(chǎng)域之外,也宣布了語(yǔ)音人機(jī)接口的時(shí)代已然來(lái)臨。 而中文語(yǔ)音識(shí)別技術(shù)開(kāi)發(fā)相較于英文更為困難,人們的生活習(xí)慣以及對(duì)于智能家庭的需求也有所差異,因此在地廠(chǎng)商在開(kāi)發(fā)技術(shù)與拓展中文市場(chǎng)時(shí),考慮亦與歐美有所差異。
自2014年亞馬遜(Amazon)發(fā)表了智能喇叭Echo之后,為智能家庭與語(yǔ)音助理的結(jié)合帶來(lái)全新想象。 Google、蘋(píng)果(Apple)等大廠(chǎng)也紛紛加入戰(zhàn)局,推出各種不同市場(chǎng)定位的智能喇叭(表1)。
根據(jù)市調(diào)機(jī)構(gòu)Global Market Insights研究報(bào)告指出,2016年全球智能喇叭市場(chǎng)規(guī)模為4億美元,預(yù)估到2024年將快速成長(zhǎng)到130億美元。 智能喇叭市場(chǎng)前景看好,成長(zhǎng)速度也將非常快速。 另外,臺(tái)北國(guó)際計(jì)算機(jī)展(COMPUTEX TAIPEI)共同主辦單位臺(tái)北市計(jì)算機(jī)公會(huì),也在日前發(fā)布新聞,表示自2017年9月開(kāi)放2018年展會(huì)在線(xiàn)登錄以來(lái),看到許多端點(diǎn)AI裝置、語(yǔ)音助理解決方案等創(chuàng)新應(yīng)用產(chǎn)品廠(chǎng)商參展。 臺(tái)北市計(jì)算機(jī)公會(huì)進(jìn)一步分析,此趨勢(shì)是由于人工智能語(yǔ)音助理(Voice Assistant)的成熟,智能喇叭可透過(guò)與語(yǔ)音助理功能介接,搭配搜尋、查詢(xún)與日常用品導(dǎo)購(gòu)功能,可提供更完整的人工智能生活服務(wù)。
以中文市場(chǎng)而言,中國(guó)各大網(wǎng)絡(luò)巨頭自2015年起,也紛紛發(fā)布自有的智能喇叭產(chǎn)品。 并且如同歐美市場(chǎng)一般各自有其市場(chǎng)優(yōu)勢(shì)。 例如,阿里巴巴與Amazon皆已掌握相當(dāng)大的電子商務(wù)市場(chǎng)市占,透過(guò)智能喇叭能夠讓消費(fèi)者透過(guò)不同渠道體驗(yàn)更完整的購(gòu)物服務(wù);小米則與Apple相似,在推出智能喇叭之前便已累積許多備受市場(chǎng)肯定的硬設(shè)備, 搭配智能喇叭能讓各硬件之間有更完整的串接,讓消費(fèi)者實(shí)現(xiàn)更加智能化的居家生活。
要推動(dòng)智能家庭的實(shí)現(xiàn),必須與現(xiàn)實(shí)生活模式完美銜接,才能創(chuàng)造消費(fèi)者需求。 根據(jù)NPR And Edison Research所提供的數(shù)據(jù)指出,在已經(jīng)購(gòu)買(mǎi)智能喇叭的用戶(hù)中,有87%用戶(hù)期待能夠透過(guò)語(yǔ)音輸入接口搜尋信息。 由此可見(jiàn),中文語(yǔ)音識(shí)別技術(shù)便是經(jīng)營(yíng)中文市場(chǎng)首要必須突破的技術(shù)門(mén)坎(圖1)。
圖1 智能喇叭用戶(hù)的購(gòu)買(mǎi)目的統(tǒng)計(jì)
多種語(yǔ)言交叉辨識(shí)符合***現(xiàn)實(shí)生活情境
工研院資通所技術(shù)推廣部副組長(zhǎng)張振魁指出,工研院自2016年第四季開(kāi)始整合已開(kāi)發(fā)多年的語(yǔ)音識(shí)別技術(shù),開(kāi)發(fā)出ITRI語(yǔ)音助理。 期待能夠秉持著對(duì)于在地的了解,開(kāi)發(fā)出最符合***生活習(xí)慣的語(yǔ)音助理。 相較于國(guó)際大品牌所推出的語(yǔ)音助理、智能喇叭產(chǎn)品,ITRI語(yǔ)音助理已經(jīng)能夠做到更精準(zhǔn)的中文語(yǔ)音識(shí)別。 目前正在積極開(kāi)發(fā)多語(yǔ)言辨識(shí)功能,未來(lái)若用戶(hù)在中文語(yǔ)句之中,夾雜英文或是臺(tái)語(yǔ)單字,ITRI語(yǔ)音助理也能夠精準(zhǔn)辨認(rèn)用戶(hù)指令(圖2)。
圖2 工研院資通所技術(shù)推廣部副組長(zhǎng)張振魁指出,ITRI語(yǔ)音助理已經(jīng)能夠做到比國(guó)際大廠(chǎng)更精準(zhǔn)的中文語(yǔ)音識(shí)別。
未來(lái)ITRI語(yǔ)音助理除了持續(xù)開(kāi)發(fā)英語(yǔ)、臺(tái)語(yǔ)等更多語(yǔ)言辨識(shí)功能,并持續(xù)開(kāi)發(fā)市場(chǎng)應(yīng)用之外,中文的語(yǔ)意理解更是會(huì)持續(xù)優(yōu)化的重點(diǎn)。 首先,由于不同國(guó)家或是地區(qū)方言,都會(huì)有不同的文法語(yǔ)意使用方式,未來(lái)工研院將會(huì)結(jié)合機(jī)器學(xué)習(xí)技術(shù),快速擴(kuò)大不同語(yǔ)言的語(yǔ)意數(shù)據(jù)庫(kù)。 再者,在智能喇叭的使用情境之中,常常會(huì)是所有家庭成員共同使用一臺(tái)設(shè)備。 因此,透過(guò)聲紋辨識(shí)技術(shù)做到語(yǔ)者辨識(shí)功能也是開(kāi)發(fā)重點(diǎn),才能夠使智能喇叭搜集到完整且正確的用戶(hù)行為數(shù)據(jù)。 最后,用戶(hù)的語(yǔ)調(diào)情緒在未來(lái)也是開(kāi)發(fā)重點(diǎn)之一;藉由用戶(hù)輸入信息時(shí)的語(yǔ)氣,判斷用戶(hù)發(fā)出該指令時(shí)的急迫性以及情緒變化,是透過(guò)其他的人機(jī)界面皆無(wú)法得知的。 因此,在未來(lái)語(yǔ)調(diào)情緒也會(huì)是語(yǔ)音識(shí)別能夠搜集到的珍貴數(shù)據(jù)之一。
張振魁分析,***雖然市場(chǎng)規(guī)模相對(duì)較小,但是依然有其市場(chǎng)待廠(chǎng)商開(kāi)發(fā)。 ***大部分的相關(guān)制造商以代工外銷(xiāo)為主要盈利來(lái)源,許多生產(chǎn)路由器等產(chǎn)品的網(wǎng)通業(yè)者,也已經(jīng)開(kāi)始代工智能喇叭并輸出外銷(xiāo)。 除了硬件生產(chǎn)技術(shù)之外,***也有相當(dāng)成熟的電子商務(wù)平臺(tái);電信業(yè)者所提供的音樂(lè)、電影、書(shū)籍等內(nèi)容服務(wù)亦相當(dāng)完整。 在歐美相當(dāng)成功的智能喇叭商業(yè)模式要素而言,***在同樣領(lǐng)域也都能提供相當(dāng)完整的服務(wù)。
中文市場(chǎng)智能喇叭營(yíng)利模式各異
盡管經(jīng)營(yíng)市場(chǎng)最久的Amazon Echo主要盈利模式依然是電子商務(wù)平臺(tái)導(dǎo)購(gòu),然而由NPR And Edison Research所統(tǒng)計(jì)的數(shù)據(jù)指出,有九成的智能喇叭用戶(hù)表示,聆聽(tīng)音樂(lè)是他們購(gòu)買(mǎi)智能喇叭的原因之一, Google也在2017年的Made by Google大會(huì)上,推出與Apple HomePod一樣標(biāo)榜高質(zhì)量音效的Google Home Max(圖3)。 在2017年,Amazon推出了更多不同功能的智能音箱,如結(jié)合鏡頭的Echo Show以及結(jié)合顯示器的Echo Look。 隨著各大廠(chǎng)商搜集的數(shù)據(jù)逐漸完整,新一代智能喇叭的市場(chǎng)定位更加精準(zhǔn)。 接下來(lái)在歐美市場(chǎng),智能喇叭會(huì)如何以語(yǔ)音助理為核心,擴(kuò)展技術(shù)功能與市場(chǎng)定位,值得繼續(xù)關(guān)注。
圖3 Google于2017年推出標(biāo)榜高質(zhì)量音效的Google Home Max以及較低單價(jià)的Google Home Mini。 圖片來(lái)源:Google
另外,在2017年百度、阿里巴巴、騰訊以及小米所推出的智能喇叭,于中國(guó)市場(chǎng)皆有大幅度的成長(zhǎng)。 恩智浦(NXP)大中華區(qū)微處理器與微控制器事業(yè)部資深營(yíng)銷(xiāo)經(jīng)理張小平預(yù)估,在2018年的中國(guó)市場(chǎng)發(fā)展將比2017年更加迅速,市場(chǎng)上大約能有2,000萬(wàn)臺(tái)智能喇叭(圖4)。
圖4 恩智浦(NXP)大中華區(qū)微處理器與微控制器事業(yè)部資深營(yíng)銷(xiāo)經(jīng)理張小平預(yù)估,在2018年的中國(guó)市場(chǎng)發(fā)展將比2017年更加迅速。
但是目前無(wú)論是在中國(guó)或是全球市場(chǎng),智能喇叭的普及度皆有待提升。 張小平認(rèn)為,目前的中文語(yǔ)意理解精準(zhǔn)度偏低是智能喇叭無(wú)法普及的主要原因。 例如,當(dāng)前的智能助理服務(wù)多需要先說(shuō)出喚醒詞,才能開(kāi)始以語(yǔ)音輸入信息,然而這并不是最直覺(jué)的使用方式。 張小平預(yù)測(cè),在未來(lái),喚醒詞將被聲紋辨識(shí)、智能辨識(shí)技術(shù)的優(yōu)化所淘汰;在語(yǔ)音助理能夠以辨識(shí)用戶(hù)聲紋與分析上下文的方式判斷語(yǔ)音指令時(shí),才能達(dá)到最靠近自然人類(lèi)行為的語(yǔ)音人機(jī)接口。 然而,由于中國(guó)品牌的智能喇叭皆是以相當(dāng)?shù)土膬r(jià)格上市,對(duì)于市場(chǎng)的教育與推廣皆有相當(dāng)大的幫助。 盡管此技術(shù)的人工智能等級(jí)要求相當(dāng)高,然而張小平預(yù)測(cè),此技術(shù)將在2020年前便會(huì)有重要突破,達(dá)成語(yǔ)音識(shí)別的終極產(chǎn)品型態(tài)。
張小平進(jìn)一步指出,不同世代的用戶(hù)有著不同特性,對(duì)于1990年后出生的數(shù)字原住民(Digital Native)而言,萬(wàn)物聯(lián)網(wǎng)的情境會(huì)被視為理所當(dāng)然。 隨著他們成為社會(huì)中堅(jiān),智能家庭的時(shí)代也會(huì)隨之到來(lái)。
在目前的智能喇叭中國(guó)市場(chǎng)中,競(jìng)爭(zhēng)已殺成紅海。 然而,目前相較于透過(guò)銷(xiāo)售硬件獲利,對(duì)于廠(chǎng)商而言更重要的是取得更多數(shù)據(jù)以修正語(yǔ)音處理的能力。 張小平認(rèn)為,透過(guò)中國(guó)網(wǎng)絡(luò)巨頭的帶動(dòng),再經(jīng)過(guò)1~2年的數(shù)據(jù)累積,智能喇叭和語(yǔ)音助理技術(shù)將大幅提升,用戶(hù)對(duì)于語(yǔ)音人機(jī)接口也更加熟悉,屆時(shí)將會(huì)看到更多的相關(guān)產(chǎn)品出現(xiàn)。 另一方面,張小平指出,在智能家庭方面小米的布局最為完整,已建立了完整的生態(tài)系,最快在2018年就能看到大幅度的市占成長(zhǎng)。
百度有望拿下中文語(yǔ)音助理市場(chǎng)
拓墣產(chǎn)業(yè)研究院分析師林貞妤認(rèn)為,在中國(guó)眾多云端服務(wù)企業(yè)之中,以百度的布局最為值得關(guān)注。 百度的智能語(yǔ)音助理DuerOS,在百度智能云、百度大腦二大云端服務(wù)支撐之下,采開(kāi)放平臺(tái)方式,為開(kāi)發(fā)者提供工具、數(shù)據(jù)和開(kāi)發(fā)環(huán)境,試圖在中國(guó)建立起如Amazon、Google完整的人工智能生態(tài)系(圖5)。
圖5 拓墣產(chǎn)業(yè)研究院分析師林貞妤認(rèn)為,在中國(guó)眾多云端服務(wù)企業(yè)之中,以百度的布局最為值得關(guān)注。
在中國(guó)三大云端服務(wù)廠(chǎng)商(百度、阿里巴巴、騰訊)之中,百度的態(tài)度相對(duì)最為積極。 百度在2017年的AI開(kāi)發(fā)者大會(huì)上,高喊「All in AI」口號(hào),宣布將全力發(fā)展人工智能繼續(xù)與相關(guān)市場(chǎng)開(kāi)發(fā)。 而DuerOS的推廣便是百度的人工智能事業(yè)中的重點(diǎn)項(xiàng)目之一。
林貞妤指出,目前許多業(yè)者希望投入智能家庭、智能喇叭市場(chǎng),然而盈利模式都有待再思考;百度的開(kāi)放平臺(tái)商業(yè)模式具備強(qiáng)大競(jìng)爭(zhēng)力,前景看好。 百度提供開(kāi)放平臺(tái)的將快速取得大量數(shù)據(jù)數(shù)據(jù),進(jìn)而優(yōu)化DuerOS功能。 最值得關(guān)注的是,目前只要透過(guò)軟件更新,便能在一分鐘之內(nèi)將搭載Amazon Alexa的智能家電轉(zhuǎn)換為DuerOS的中文接口。 因此,DuerOS不只是能在中國(guó)國(guó)內(nèi)市場(chǎng)推廣,海外華人也能以該模式使用DuerOS語(yǔ)音助理服務(wù)。
在語(yǔ)音人機(jī)界面的發(fā)展歷程中,于居家場(chǎng)域使用智能喇叭只是第一步,必須要先讓智能喇叭成功普及,消費(fèi)者才會(huì)習(xí)慣使用語(yǔ)言與機(jī)器溝通,接下來(lái)也才能發(fā)展出更多語(yǔ)音接口的應(yīng)用可能。
評(píng)論
查看更多