智能音箱從能聽到會(huì)看,多模態(tài)交互將成為趨勢(shì)。
8 個(gè)月時(shí)間,在天貓精靈 X1 智能音箱從發(fā)售到銷量 200 萬后,阿里巴巴人工智能實(shí)驗(yàn)室舉行了 2018 年的第一場(chǎng)發(fā)布會(huì)(3 月 22 日),而這一次發(fā)布的核心產(chǎn)品,有點(diǎn)出乎大家意料。
用一個(gè) 49 元的手機(jī)支架,和幾乎人人都有的智能手機(jī),天貓精靈進(jìn)行了一次變身,不但變得比以前更加聰明,還擁有了全新的“多模態(tài)感知系統(tǒng)”。作為 2017 年的行業(yè)黑馬,本次發(fā)布會(huì)上讓人激動(dòng)的這件新品不再是硬件,而是重量級(jí)的系統(tǒng)升級(jí)——AliGenie 2.0,我們不妨先來看看這段官方視頻演示:
AI 變奏曲:智能音箱從能聽到會(huì)看
毫無疑問,當(dāng)天發(fā)布會(huì)上的主角正是阿里巴巴人工智能實(shí)驗(yàn)室的 AliGenie 2.0,它加入了最新的 AI 視覺系統(tǒng),并嘗試去融入更多情感操作。阿里巴巴人工智能實(shí)驗(yàn)室負(fù)責(zé)人淺雪稱之為“天貓精靈火眼”。和去年 7 月推出的 AliGenie 1.0 最大的不同在于,2.0 版本從原本能聽能說,變成了如今的能看能聽能說。
能看是系統(tǒng)升級(jí)的重點(diǎn),“從觸覺到聽覺,再到視覺,最后是情感反饋,多模態(tài)交互是 AliGenie 2.0 的核心”,對(duì)于此次系統(tǒng)升級(jí),淺雪認(rèn)為它最大的不同是人機(jī)交互的變化,尤其是因此產(chǎn)生的與眾不同的用戶體驗(yàn)。
阿里巴巴人工智能實(shí)驗(yàn)室負(fù)責(zé)人 淺雪
搭載“火眼”的天貓精靈,在原本的天貓精靈 X1 上增加了一個(gè)手機(jī)支架,通過把手機(jī)連接到天貓精靈 App,手機(jī)屏幕出現(xiàn)了一只可以交互的“天貓”,通過手觸摸,它可以簡(jiǎn)單和人互動(dòng)。
這只“寵物貓”擁有 AI 識(shí)圖能力。依靠手機(jī)前置攝像頭,天貓精靈有了能“看懂”周圍事物的“眼睛”,它可以識(shí)別 2D 和 3D 信息。具體來說,有三個(gè)重要能力加入。
第一,當(dāng)你手拿兒童故事書,或者識(shí)字卡靠近,詢問天貓精靈“這是什么”時(shí),它可以“看到”并立即為你朗讀卡片和故事書的內(nèi)容。
其次,通過連接阿里健康的數(shù)據(jù)信息,天貓精靈有了“判斷”藥品的能力,可以迅速識(shí)別 40000 種中國(guó)家庭常用藥。當(dāng)你手拿藥品盒子在手機(jī)攝像頭前詢問時(shí),這只“貓”會(huì)手拿藥盒,告訴你它的名稱,功效甚至有效周期。
第三,同時(shí)也是最讓人驚訝的能力,天貓精靈具備了基礎(chǔ)的 3D 圖像識(shí)別的能力。當(dāng)手持蔬菜、水果等物品靠近攝像頭詢問時(shí),它可以很快告訴你這是什么物品。
和前兩種的 2D 圖像識(shí)別不同,3D 識(shí)別物體要做到的是不論你用何種角度拿著物品靠近攝像頭,它都能判斷出物體是什么,按照產(chǎn)品總監(jiān)釋空的解釋,這(難度)要比 2D 識(shí)別大得多。
因?yàn)?3D 識(shí)別不僅在考驗(yàn)系統(tǒng)對(duì)周圍環(huán)境光線的適應(yīng)、同時(shí)也要對(duì)你手持物體角度進(jìn)行準(zhǔn)確把握,還要有足夠的數(shù)據(jù)信息可以搜尋出物體。比如在你拿著一個(gè)已經(jīng)發(fā)霉變色的西蘭花時(shí),要想被識(shí)別出來,就必須知道這還是西蘭花,這對(duì)于機(jī)器來說并不容易。所以目前,天貓精靈能識(shí)別出的蔬菜水果不多,只有幾十種,但這種能力卻對(duì)于將來識(shí)別更多物品(包括商品),甚至于人臉都具有重要意義。
此外,發(fā)布會(huì)很重要的一部分在于天貓精靈的邊界擴(kuò)展,看到前面幾個(gè)功能也許有人能猜到,閱讀故事書,教人讀書寫字,這是面向兒童的能力。而幫你識(shí)別藥品,告訴你藥品功效,再告訴你還有多久會(huì)過期,這是更貼近老人的能力。
因此天貓精靈不但聯(lián)合了國(guó)內(nèi) 12 家少年兒童出版社,對(duì)市面上 117 套兒童讀物以及繪本進(jìn)行了有聲讀物化,還將通過馬云公益基金會(huì)將天貓精靈帶到更多偏遠(yuǎn)地區(qū),為當(dāng)?shù)貙W(xué)校教育以及兒童陪伴問題提供新的解決思路。
盡管發(fā)布會(huì)還另外帶來了阿里巴巴人工智能實(shí)驗(yàn)室的路由器、投影儀以及迷你版天貓精靈,但最核心的主角無疑就是全新升級(jí)的 AliGenie 2.0 系統(tǒng)。這不由得令人好奇,當(dāng)國(guó)內(nèi)外廠商紛紛升級(jí)了帶屏幕的智能音箱時(shí),為何阿里巴巴選擇了這樣一個(gè)“非常規(guī)”的升級(jí)方式?不是通過賣新的產(chǎn)品,而是用 App 和用戶自己的手機(jī),這樣一個(gè)更加“軟著陸”的方式來使用新產(chǎn)品(也是新系統(tǒng))呢?
殊途同歸的多模態(tài)交互
一個(gè)現(xiàn)狀是,帶有屏幕的智能音箱價(jià)格與人們期望存在差距。市面上帶屏幕的智能音箱,少則近千元,多則數(shù)千元??梢哉f在目前階段,當(dāng)用戶考慮用數(shù)千元買一個(gè)帶屏幕的智能音箱時(shí),他們會(huì)猶豫,并會(huì)和一些其它成熟產(chǎn)品(如 iPad 等)比較其是否值得?
這也是擺在包括淺雪在內(nèi)的團(tuán)隊(duì)成員面前同樣的問題,因此需要考慮的就是:如何用極低的成本,盡量做到現(xiàn)階段能實(shí)現(xiàn)的最優(yōu)體驗(yàn)?團(tuán)隊(duì)內(nèi)部對(duì)此曾出現(xiàn)過分歧,用釋空的說法,最終他們認(rèn)為,由于目前階段帶屏幕的智能音箱產(chǎn)品不具有足夠的議價(jià),因此就做出了用手機(jī)來完成這些的方案。
這讓人想起了谷歌在 VR 推進(jìn)早期曾大力推行的產(chǎn)品“CardBoard”。
紙板做的廉價(jià) VR 眼鏡——Google CardBoard
在 VR 產(chǎn)業(yè)剛剛起步階段,市面上 VR 產(chǎn)品不但價(jià)格貴,體驗(yàn)也并不優(yōu)秀,于是谷歌采取了用廉價(jià)紙盒做 VR 眼鏡的策略,滿足了大家在好奇期的想法,并成功向大眾普及了 VR 這一概念,這種方式不得不說是有其必要性的。
“我們最關(guān)注的事情是如何讓每個(gè)用戶用最低的成本入門就能完全體驗(yàn)?!睖\雪說,這種觀點(diǎn)最終指向的目標(biāo)是給每個(gè)人做有用有價(jià)值的人工智能,所以嘗試出這樣的方案在意料之中。
但在大方向上,智能音箱不應(yīng)該僅僅只有語音交互,應(yīng)該是語音、視覺、情感多模態(tài)交互的觀點(diǎn),這卻是 AliGenie 系統(tǒng),乃至整個(gè)智能音箱領(lǐng)域目前達(dá)成的一個(gè)基礎(chǔ)共識(shí)。
的確,智能音箱優(yōu)點(diǎn)很多,但嘗試過的用戶都會(huì)認(rèn)為它不夠完美,聲音交互的特性讓它在很多場(chǎng)景中不夠靈活,而要解決這個(gè)問題,利用屏幕也許是一個(gè)途徑,今年開年來,伴隨 CES 2018 展會(huì),我們見到了國(guó)內(nèi)外眾多帶有屏幕的智能音箱,谷歌甚至組建了一個(gè)“Smart Display”聯(lián)盟,想要讓這一趨勢(shì)迅速蔓延開來。
從左到右,LG、聯(lián)想、JBL 的 Smart Diaplay 產(chǎn)品
在淺雪看來,阿里人工智能系統(tǒng) AliGenie 2.0 系統(tǒng)升級(jí),它的“能力比一塊屏幕更重要”。目前階段下,通過一個(gè) App 和手機(jī)就能體驗(yàn)到的事情,既能讓用戶擁有更好的心理預(yù)期,又能在吸取經(jīng)驗(yàn)進(jìn)一步打磨未來產(chǎn)品,這樣的嘗試能讓更多用戶理解,有了屏幕交互的智能音箱不同于 iPad,語音控制和屏幕觸控也不是互相替代,而是互補(bǔ)關(guān)系。
一旦有了這種體驗(yàn),大家就會(huì)發(fā)掘出自己真正需要的到底是怎樣的智能音箱。如發(fā)布會(huì)現(xiàn)場(chǎng)演示的功能一樣,教育兒童,可以通過看到卡片和圖書來給孩子講故事;幫助老人,可以通過看到藥品盒子就說出功能功效和截止日期。這種輕度體驗(yàn)?zāi)茉谏钪新囵B(yǎng)人們對(duì)于智能音箱的新的認(rèn)知。
如果說 2017 年是國(guó)內(nèi)智能音箱競(jìng)賽元年,那么站在賽道上的阿里巴巴無疑通過雙 11 的 100 萬臺(tái)銷量成為了行業(yè)黑馬。而隨著 AliGenie 2.0 的推出,2018 年人工智能產(chǎn)品將更具擴(kuò)展性,多模態(tài),讓人更自如的交互無疑將成為接下來各大廠商關(guān)注的重點(diǎn)。
-
谷歌
+關(guān)注
關(guān)注
27文章
6178瀏覽量
105697 -
vr
+關(guān)注
關(guān)注
34文章
9641瀏覽量
150540 -
智能音箱
+關(guān)注
關(guān)注
31文章
1783瀏覽量
78680
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論