火爆的智能音箱真的會(huì)是一個(gè)智能家居入口嗎?BAT入局智能音箱,創(chuàng)業(yè)者站隊(duì)還是突圍?除了價(jià)格戰(zhàn),智能音箱還能怎么賣?AI技術(shù)應(yīng)用綜合集成后帶來的用戶使用場景會(huì)有哪些變革?資本市場如何看待像智能家居等前沿技術(shù)在產(chǎn)品中的應(yīng)用?
7 月 31 日晚上8點(diǎn)半,“騰訊創(chuàng)業(yè)01CLUB”推出了第一期的社群內(nèi)容分享活動(dòng)。明勢資本創(chuàng)始合伙人黃明明、小米生態(tài)鏈副總裁唐沐擔(dān)任了本期的對話嘉賓,就智能音箱行業(yè)聊聊對產(chǎn)業(yè)的幾大洞見,進(jìn)行了一場資本市場和頭部科技公司之間關(guān)于下一個(gè)“風(fēng)口”的對話,騰訊創(chuàng)業(yè)01CLUB為此整理出此次對話中的幾大精華觀點(diǎn):
1,智能家居發(fā)展的基礎(chǔ)是解決用戶剛需。
2,智能音箱技術(shù)突破難點(diǎn)為NLP(自然語言處理技術(shù))。
3,面對巨頭競爭,通過合作才能獲得突破。
4,如果智能音箱要加屏幕,目前還需解決在設(shè)備交互方面的互斥矛盾點(diǎn)。
5,掃地機(jī)器人可能是智能家居的下一個(gè)風(fēng)口。
針對這幾大觀點(diǎn),兩位對話嘉賓進(jìn)行了精彩的具體的分析講解和分享,以下為此次對話內(nèi)容的整理:
智能家居發(fā)展的基礎(chǔ)是解決用戶剛需
黃明明:我先簡單介紹明勢資本在AI領(lǐng)域的投資邏輯和案例。
在AI領(lǐng)域,我們的重點(diǎn)是找到核心技術(shù)的落地場景,或者能夠提升行業(yè)效率的領(lǐng)域進(jìn)行投資。我們投資的案例場景覆蓋出行、法律、醫(yī)療、工業(yè)等領(lǐng)域。
比如,在AI 出行領(lǐng)域,我們投資了易航智能和知行科技;在AI 法律方面,我們投資了思滿科技和秘塔科技;在AI 醫(yī)療方面,投了智能醫(yī)療外科手術(shù)機(jī)器人研發(fā)商術(shù)康醫(yī)療;在AI 工業(yè)領(lǐng)域,則投了智能工廠解決方案供應(yīng)商玄羽科技。
今天我主要和小米生態(tài)鏈副總裁唐沐聊些智能音箱在技術(shù)和商業(yè)模式方面的探討。
首先是技術(shù)方面,唐總(唐沐)認(rèn)為哪些底層技術(shù)的突破,推動(dòng)了智能音箱這一波高速發(fā)展?目前還有哪些突出的問題是嚴(yán)重影響到用戶體驗(yàn)的?比如遠(yuǎn)場的定位,本地軟硬件計(jì)算的能力,多人的聲場還有誤喚醒,包括多輪對話的能力,哪些是核心的制約瓶頸?你認(rèn)同未來智能家居的流量入口可能是智能音箱嗎?
唐沐:先說智能家居入口的問題。從2012年、2013年很多公司都在對此做嘗試、設(shè)想、去做相關(guān)的產(chǎn)品。當(dāng)時(shí)對于公司的自家產(chǎn)品,對外都會(huì)有這樣的一個(gè)說法:在做爭奪智能家居入口。兄弟不才,我當(dāng)時(shí)是做了路由器,所以對外喊“路由器是未來智能家居的入口”。
做了幾年之后,我發(fā)現(xiàn)當(dāng)時(shí)喊的兇的說自己是智能家居入口,到最后都沒留下來,反而那些真的踏踏實(shí)實(shí)的,把一個(gè)產(chǎn)品做到滿足用戶的高頻剛需,這樣的產(chǎn)品才能留下來。
你要問我路由器是不是入口,其實(shí)路由器也不是,我相信路由器只是智能家居其中一個(gè)的中心節(jié)點(diǎn)。
智能家居的中心未必是一個(gè)設(shè)備,很有可能是幾個(gè)設(shè)備,我回想起雷總邀請我加入小米的核心訴求是希望我能探索智能家居,路由器只是其中一個(gè)重心節(jié)點(diǎn),后面再做的智能音箱。
參與到智能音箱的項(xiàng)目后,我發(fā)現(xiàn)智能音箱是另外一個(gè)維度的智能家居中心。但現(xiàn)在我不太想強(qiáng)調(diào)它是一個(gè)中心,目前我們做產(chǎn)品的思路轉(zhuǎn)化成為:我們可以把一個(gè)產(chǎn)品設(shè)想的很宏大,我們可以想象很多東西給它留很多未來的發(fā)展空間的設(shè)想,但最根本的你要先把它的高頻剛需滿足掉。
智能音箱技術(shù)突破難點(diǎn)為NLP
唐沐:再說技術(shù)的問題。當(dāng)我們開始做智能音箱的時(shí)候,我發(fā)現(xiàn)主要有3個(gè)核心技術(shù)要準(zhǔn)備好:一個(gè)是ASR、一個(gè)是NLP、一個(gè)是TTS。ASR是語音轉(zhuǎn)文字的技術(shù),語音識(shí)別技術(shù);NLP是自然語言理解技術(shù);TTS是文字轉(zhuǎn)語音,文字合成語音的技術(shù),這三個(gè)技術(shù)基本上是智能音箱存在的一個(gè)基石,當(dāng)這三個(gè)技術(shù)準(zhǔn)備好了,智能音箱已經(jīng)具備了橫空出世的前提了。
關(guān)于核心制約瓶頸,黃明明說的幾個(gè)都是,有很多可以通過數(shù)據(jù)的積累,人工智能自我學(xué)習(xí)、自我進(jìn)步去改善的。但我認(rèn)為到目前為止,可能基本上目前我還沒有看到有解決的很明確的路徑,其實(shí)是NLP(自然語言理解)。很多時(shí)候目前我們在智能音箱里面呈現(xiàn)出來的人工智能,它有點(diǎn)像是一個(gè)簡單的問答機(jī),你提一個(gè)問題他給你一個(gè)回答,很多時(shí)候這種回答還是偏機(jī)械,離真正的人工智能還是有點(diǎn)距離。
黃明明:看來大家的認(rèn)知至少目前都是比較一致,最核心的目前難突破的還是在NLP這個(gè)領(lǐng)域,可能這一波我們所謂講的深度神經(jīng)網(wǎng)絡(luò)基本上在NLP這個(gè)領(lǐng)域,我問了很多大牛,短期之內(nèi)想要有突破是比較難。
拋開大家都短期之內(nèi)難以突破的NLP領(lǐng)域,我們以小米的小愛音箱為例,聊聊在技術(shù)方案的選擇(包括軟件、硬件,麥克風(fēng)的陣列,遠(yuǎn)近場的定位、輸入降噪,誤喚醒等等)你認(rèn)為做哪些選擇,才能讓產(chǎn)品有哪些特點(diǎn)和優(yōu)勢?
唐沐:我們做智能音箱最棒的心得是廣泛尋求合作。比如說我們在ASR領(lǐng)域有七八家合作伙伴,我們會(huì)把用戶的query同時(shí)發(fā)給七八家合作伙伴,等他們?nèi)慷挤答伣o我們結(jié)果,我們再經(jīng)過一個(gè)簡單的判斷算法,來決定選取誰的結(jié)果。我們自己在技術(shù)上花費(fèi)精力最大的還是NLP,這是智能音箱的核心,也人工智能語音助手的核心。
以小愛音箱為例,我們目前有兩大看家本領(lǐng),一個(gè)是對用戶點(diǎn)歌query的理解,一個(gè)是對用戶IoT控制的理解。我們發(fā)布音箱的時(shí)間比較久,收集到的query比較多,這會(huì)極大幫助我們更深入理解用戶的訴求到底是什么。
小米2C產(chǎn)品形態(tài)的“收斂點(diǎn)”遠(yuǎn)非硬件這么簡單
黃明明:正好唐沐這邊你講到很多方案,技術(shù)方案和很多外部的合作伙伴在合作。我也八卦一下,有媒體透露出小米目前也在跟亞馬遜Alexa合作,并且有可能考慮整合或者是說和微軟的小娜合作,推出咱們新的智能音箱的產(chǎn)品線,這個(gè)傳聞是有沒有點(diǎn)靠譜?如果是有這樣的考慮,是不是意味著我們可能會(huì)花更多的力量在硬件的生產(chǎn)制造方面,軟件方面我們也會(huì)和跟強(qiáng)有力的國外合作伙伴合作呢?
唐沐:所有傳言都是無風(fēng)不起浪,谷歌、亞馬遜、微軟,這幾家在我們發(fā)布智能音箱之后都找來了,他們更多看重小米在智能硬件領(lǐng)域里面的供應(yīng)鏈優(yōu)勢跟性價(jià)比優(yōu)勢。
但是大家也知道小米從來不是一個(gè)只甘心于做硬件終端的一家公司,所以我們在挑選合作伙伴的時(shí)候,一定也是在考慮在互聯(lián)網(wǎng)領(lǐng)域合作共贏的可能性。其實(shí)目前都還在談,我們不會(huì)只做硬件,而不碰里面的系統(tǒng)和背后的大腦的。
黃明明:非常感謝唐沐兄的坦誠,也給我們爆了好多料,我只問了一個(gè)亞馬遜,現(xiàn)在把谷歌都給爆出來了。我下面進(jìn)入稍微挑戰(zhàn)一點(diǎn)的問題,既然剛才提到了不光是跟國外的巨頭,包括跟國內(nèi)擁有海量內(nèi)容甚至是壟斷性的擁有海量內(nèi)容的巨頭,包括騰訊音樂、阿里這些,我們跟他的競合態(tài)勢也是回應(yīng)我們今天的主題,產(chǎn)品之爭還是內(nèi)容之爭?
面對巨頭競爭,合作共贏才能獲得突破
黃明明:現(xiàn)在市場上比較主流的一個(gè)聲音,因?yàn)椴还茉蹅儎偛胖v的語音的識(shí)別,語意的理解做的多好,最后用戶關(guān)心的是我后面想要獲取的內(nèi)容,內(nèi)容在巨頭手里,咱們怎么應(yīng)對?
唐沐:我覺得答案一定還是合作共贏。小米雖然已經(jīng)IPO,但我們內(nèi)部還是認(rèn)為自己是一個(gè)創(chuàng)業(yè)公司,我們永遠(yuǎn)沒有辦法有財(cái)力和BAT等一些互聯(lián)網(wǎng)巨頭比拼內(nèi)容的采購。
我認(rèn)為其實(shí)各家公司都有各家公司擅長的地方,有各家公司的“基因”。比如就音樂而言,騰訊一定是有它的基因在的,否則TME也不會(huì)做這么大。所以我花了很大的精力去跟騰訊去談合作,還能讓大家都做各自擅長的事情:小米擅長是做硬件做系統(tǒng),騰訊TME集團(tuán)擅長做音樂,我們就強(qiáng)強(qiáng)聯(lián)手一起合作就好了。
一方面我們會(huì)和QQ音樂合作,一起為小愛音箱的用戶提供相當(dāng)大部分的免費(fèi)音樂。另外,我們也愿意幫助QQ音樂以及背后的這些音樂版權(quán)公司去發(fā)展音樂會(huì)員,這個(gè)應(yīng)該是兩邊都非常愿意看到的。
另外,其實(shí)在合作的談判過程當(dāng)中,我也欣喜地看到在國內(nèi)的內(nèi)容產(chǎn)業(yè)也越來越良性發(fā)展,已經(jīng)有非常非常大的用戶群愿意去為好的內(nèi)容買單,給了我們很大的信心。
我們在小愛音箱每天的兩三千萬的query數(shù)里面看到,其中占60%、70%,甚至70%、80%的,都還是對內(nèi)容的獲取的query,關(guān)于對內(nèi)容播放控制的query。這個(gè)可說明一點(diǎn):其實(shí)語音內(nèi)容必定是國內(nèi)幾乎所有智能音箱的核心訴求,并且是高頻剛需。
黃明明:我也贊同唐沐的說法:每家公司的基因不同,還是要合作,每個(gè)人把自己擅長做的好的事做到最好,還是有機(jī)會(huì),未來的競合環(huán)境到底怎么樣,確實(shí)還是隨著時(shí)間的推移,會(huì)有很多的變局。
智能音箱要加屏幕還需解決在交互上的互斥矛盾點(diǎn)
黃明明:我直接進(jìn)入到下一個(gè)關(guān)于小米生態(tài)的問題,現(xiàn)在不管是亞馬遜還是國內(nèi)的其他競品他們都在音箱里加入了屏幕的概念。我知道唐沐你是一個(gè)超級產(chǎn)品經(jīng)理也是非常強(qiáng)調(diào)用戶體驗(yàn),智能音箱這個(gè)品類怎么看加入屏幕這個(gè)事情,小米的智能音箱會(huì)考慮加入屏幕這個(gè)事情嗎?
唐沐:其實(shí)關(guān)于智能音箱要不要帶屏幕這個(gè)考慮,確實(shí)也有過很多次的思考,但目前還是有些矛盾點(diǎn)需要解決。比如說在我的設(shè)想當(dāng)中,語音交互是一種遠(yuǎn)場交互,人和設(shè)備其實(shí)是可以間隔一定距離去直接做自然交互的。
但從屏幕交互來看,從帶多點(diǎn)觸控的手持設(shè)備出現(xiàn)后就是一個(gè)近場交互,遠(yuǎn)場交互和近場交互在本質(zhì)上有一些互斥。在音箱上面帶屏幕,會(huì)把一個(gè)本來大家可以做遠(yuǎn)場交互的設(shè)備拉近,變成是一個(gè)要求人去做近場交互的設(shè)備,這兩個(gè)東西出現(xiàn)在同一個(gè)設(shè)備上是有一點(diǎn)互斥。
目前的競爭態(tài)勢到達(dá)現(xiàn)在這個(gè)階段的時(shí)候,我想我妄下定論可能會(huì)打臉,我也只能說到這里。我們會(huì)積極討論或者是積極去準(zhǔn)備一個(gè)帶屏幕的音箱,因?yàn)橥ㄟ^長時(shí)間的觀察,我們發(fā)現(xiàn)其實(shí)有屏幕對于語音交互的信息反饋來說還是比較有幫助的。
黃明明:非常期待小米可能會(huì)有屏幕的智能音箱下一代產(chǎn)品的出現(xiàn)。小米的任何產(chǎn)品我們都離不開小米的生態(tài),我不知道有些數(shù)字方不方便唐沐能夠介紹一下,目前通過咱們小米的智能音箱互聯(lián)互通的智能設(shè)備,有多少種類和數(shù)量?咱們用戶在實(shí)際的調(diào)用頻次,剛才你講了內(nèi)容可能是主要的調(diào)用頻次,和其他的IoT,尤其智能家居調(diào)用的頻次是什么樣的比例?使用的黏性如何?
唐沐:目前連接在小米IoT云上面的設(shè)備已經(jīng)超過的一個(gè)億,這一個(gè)多億的設(shè)備它是連接在我們,它在過去小米做IoT四五年的時(shí)間里面去逐步積累起來的,智能音箱從去年剛剛出現(xiàn)的新事物,它的出現(xiàn)剛好把我們過去全部連接在互聯(lián)網(wǎng)上的IoT設(shè)備做了一次更緊密的連接,它使得用戶通過語音控制IoT設(shè)備的黏性大大增強(qiáng)。
比如說其中有一個(gè)數(shù)據(jù)蠻有意思的,叫“連帶購買率”。我們從很多用戶反饋和數(shù)據(jù)里可以觀察到,有更多小米IoT設(shè)備的用戶會(huì)更傾向于購買小愛音箱,買了小愛音箱之后,日常控制IoT設(shè)備的頻度和黏性都非常高。另外一個(gè)是說購買小愛音箱的用戶,哪怕他一開始沒有其他小米IoT設(shè)備,也更傾向于在買了小愛音箱之后一段時(shí)間里面積極購入小米其他IoT生態(tài)的產(chǎn)品。
這使得我看到了一個(gè)希望,智能家居會(huì)比以往更加接近現(xiàn)實(shí),更加落地。我們過去曾經(jīng)做App去控制IoT設(shè)備,很多用戶會(huì)認(rèn)為其實(shí)它并沒有改善人的生活體驗(yàn),或者是說這些設(shè)備的操控體驗(yàn),但是有了語音交互之后,很多用戶會(huì)認(rèn)為開燈關(guān)燈這么簡單的操作頻繁使用的操作,用語音控制簡直是天作之合,并且很多人都養(yǎng)成了這樣的習(xí)慣。
黃明明:剛才提過了這個(gè)query數(shù)量排在第二,我相信你們一定會(huì)統(tǒng)計(jì)重復(fù)使用的頻次和黏性,比如同一個(gè)用戶連續(xù)在多長的時(shí)長之內(nèi)養(yǎng)成用小米的智能音箱調(diào)用其他IoT設(shè)備的習(xí)慣,這樣的比例有多高?
我記得咱們那樣時(shí)候剛認(rèn)識(shí)聊天,投資機(jī)會(huì)里面看了一大批的所謂的智能家居的創(chuàng)業(yè)項(xiàng)目,那個(gè)最后我們得出一個(gè)很粗暴,但是很個(gè)直接的一個(gè)結(jié)論,用App去控制智能家居有點(diǎn)“滑稽”,比如說關(guān)一個(gè)燈還要拿起手機(jī)找到你的App,點(diǎn)開選擇那個(gè)燈,再選擇關(guān)閉,還不如直接下床關(guān)燈就完了。直到語音交互出現(xiàn)以后,我們認(rèn)為確實(shí)是智能家居這波場景尤其是以語音交互為主的場景爆發(fā)起來非常令人興奮的一個(gè)消息。
掃地機(jī)器人可能是智能家居的下一個(gè)風(fēng)口
黃明明:很高興今天唐沐兄弟又站在了最前沿,智能家居入口的最前沿。其實(shí)我記得在兩年前我們天使會(huì)有一次聚會(huì),正好和雷總,我記得在頤和園的湖邊上,我們在快走的時(shí)候,我們也聊起過一個(gè)話題,除了智能音箱之外,小米生態(tài)里面還有哪些是最有可能成為IoT的入口?我非常看好另外一個(gè)產(chǎn)品是掃地機(jī)器人,我不知道你的看法是什么?
我認(rèn)為掃地機(jī)器人需要的有兩個(gè)核心點(diǎn)。一個(gè)它是要快速,比如說SLAM算法要把用戶居住的環(huán)境,不管是現(xiàn)在2D或者未來3D的架構(gòu),它全部會(huì)掃描清楚,把相關(guān)的數(shù)據(jù)存儲(chǔ)在它的數(shù)據(jù)庫里面。實(shí)際上也是一個(gè)對用戶的家居、家庭居住情況等信息十分了解的一個(gè)機(jī)器人。第二,它的形態(tài)上包括和人的交互場景也比較多,比如說它是移動(dòng)的,所以很有可能成為另一個(gè)非常重要的交互或者是流量的入口。
一個(gè)是音箱,一個(gè)是機(jī)器人,都是我非??春玫念I(lǐng)域,這兩個(gè)領(lǐng)域小米都有自己的布局,我們也在這個(gè)領(lǐng)域持續(xù)看好的創(chuàng)業(yè)機(jī)會(huì),想聽聽唐沐你的看法?
唐沐:關(guān)于這點(diǎn)我們完全想到一塊去了。我想其實(shí)目前小愛音箱只是人工智能助手的一個(gè)容器,未來這個(gè)助手會(huì)出現(xiàn)在很多的設(shè)備里面,我會(huì)為最終它的終極形態(tài)就是機(jī)器人。但講出機(jī)器人的這個(gè)觀點(diǎn),其實(shí)很多用戶不一定會(huì)認(rèn)同,我們做產(chǎn)品,我們首先可以設(shè)想如果這個(gè)產(chǎn)品落戶在千家萬戶之后,它一定可以怎樣怎樣,但是其實(shí)第一步是最難的,怎么樣讓它落地在千家萬戶。
比如說用戶得有什么樣的實(shí)際需求才會(huì)花錢把它買到家里面?現(xiàn)在做機(jī)器人我覺得可能還是過于早,但是掃地機(jī)器人是我唯一看好的機(jī)器人形態(tài)。
很多好萊塢電影已經(jīng)把用戶對于智能化理解的預(yù)期提高到無限高,以至于用戶會(huì)覺得買回家的機(jī)器人是一個(gè)破玩意,甚至是一個(gè)垃圾,因?yàn)樗任覀兯私獾奈覀兯?jīng)看到的電影里面的機(jī)器人差的太遠(yuǎn)了,機(jī)器人這個(gè)品類沒法做,但是你在機(jī)器人前面加掃地兩個(gè)字的時(shí)候是可以考慮的。
我認(rèn)為,其實(shí)在到達(dá)最終機(jī)器人形態(tài)之前,是有一個(gè)產(chǎn)品的演化路徑。我認(rèn)為要經(jīng)過三大要素。
首先是語意,聲音的語意理解。AI音箱其實(shí)是搞定了AI語音的問題,它會(huì)收集非常多的query,讓大腦去識(shí)別并且理解人的意圖,但是其實(shí)AI視覺是下一個(gè)要攻克的領(lǐng)域,無論是通過家用攝像頭還是通過掃地機(jī)器人,都可以收集到足夠多的數(shù)據(jù)來訓(xùn)練大腦理解這些圖像。第二是AI視覺的理解,第三就是它的行動(dòng)部分、運(yùn)動(dòng)部分,這個(gè)部分的技術(shù)只要一具備,機(jī)器人形態(tài)出現(xiàn)就不遠(yuǎn)了。
形象一點(diǎn)來說,AI音箱解決的是“機(jī)器人的嘴和耳朵”的問題,后面我們還需要解決“眼睛的問題”和“腿的問題”。終有一天,當(dāng)用戶習(xí)慣身邊家里面有耳朵、有嘴、有眼睛這樣的終端出現(xiàn),他們會(huì)認(rèn)為也許集合成一體的產(chǎn)品是有機(jī)會(huì)在家里面出現(xiàn),是用戶自己愿意擁有的。
黃明明:感謝唐沐,我覺得大家在很多觀點(diǎn)上驚人的一致,我們內(nèi)部也討論過關(guān)于機(jī)器人的項(xiàng)目,現(xiàn)階段一切做成人形的所謂機(jī)器人形狀的創(chuàng)業(yè)產(chǎn)品,都會(huì)第一眼被我們pass掉,就是因?yàn)橛脩敉ㄟ^好萊塢電影或者個(gè)人自然反應(yīng)產(chǎn)生的期望值,都會(huì)遠(yuǎn)超我們現(xiàn)有產(chǎn)品能夠達(dá)到的期望值。
我最后再補(bǔ)充一句,從今天和唐沐的對話我非常興奮,得到了非常大的干貨和信息量。不管是IoT還是剛才跟唐沐討論的,對真正的未來家庭機(jī)器人的理解,包括服務(wù)機(jī)器人的階段性的往前走的步驟、計(jì)劃和未來的展望,讓人充滿了極大的信心和樂趣和對未來的想象空間。
評論
查看更多