以下為張永謙在“GTIC 2017全球(智慧)科技峰會”上的演講全文:
張永謙:謝謝大家,我來自地平線,地平線是由百度前IDL院長于凱博士創(chuàng)建的一家嵌入式人工智能的公司,今天很高興有這個機會給大家介紹一下我們對智能生活整個行業(yè)趨勢的一些思考以及我們在中間做的一些事情。
在講之前,先謝謝陳震剛才對我們的鼓勵。首先談到這個智能生活,其實在中國,大家看到我們有1億的中產(chǎn)階級家庭,這個市場非常大,這一億家庭他們的年平均收入在30萬到70萬人民幣左右,當然說到這個智能家居的市場,大家腦海中的第一個印象是電子設(shè)備,其實這個市場雖然很大,有一萬億,但是我們認為,他只是一個智能家居市場的非常小的一部分,真正的智能家居市場的潛力還是在于其他的家庭消費和服務(wù),這個每年的市場是50萬億,現(xiàn)在這個市場是10%通過線上的方式進行,當我們談智能家居的時候,如果哪個公司或者企業(yè)能夠更方便、更快捷和更精準的幫助我們的消費者進行他在家里的消費以及獲取想要的這個服務(wù),這個市場是最巨大的。
這個市場這么大,我們看一下對這個市場發(fā)展趨勢的一些思考,我們覺得有三個比較明顯的變化,是已經(jīng)發(fā)生或者會在未來的很快的時間內(nèi)發(fā)生的。第一個是物理入口,現(xiàn)在大家很多時候在家里面都是通過手機和PC上網(wǎng),大家會發(fā)現(xiàn),手機和屏幕是一個非常小的屏幕,也非常擁擠,千軍萬馬擠獨木橋,將來會有一個非常明顯的趨勢,就是整個消費和服務(wù)的接入是會分散到各個智能設(shè)備的,將來在家里,每一個硬件都是一個獨立的APP,你發(fā)現(xiàn)冰箱里面沒有飲料的時候,你不需要打開手機購買,你可以直接一句話告訴形象,下午給我送一打啤酒過來,將來家里的每一個智能硬件都會是一個服務(wù)的入口,這個是真正的給我們智能硬件帶來的巨大機會。
第二個是交互方式,最傳統(tǒng)的是通過鍵盤和觸摸屏這樣的方式,隨著語音技術(shù)的進步,這個會很快的普及到我們的生活當中,我們覺得,在不遠的將來一定會有一個更為重要、更為重量級的方式,就是通過視覺的交互,因為這個里面也是和人在家里的消費以及需要獲取服務(wù)的決策過程密切相關(guān)的。
因為現(xiàn)在大家可以看到,不管是通過觸控還是通過語音進行交互,其實他都是一個人的主動決策的過程,語音呢是作為最方便的一個交互方式,他有非常大的發(fā)展前景,但是他仍然是被動的。語音這個系統(tǒng)本身并不知道你要做什么,直到你告訴他。但是圖象這個方式,這是一個新的交互方式,是一個主動的交互方式。也就是說,在很多的場景之下,比如說舉個例子,我們可以想象一下,將來家里面在陽臺上放一個大的籃子,里面是臟衣服,現(xiàn)在我們有上門洗衣的服務(wù)了,這個籃子里面的衣服累計到一定程度的時候,這個陽臺有一個攝象頭,自動的聯(lián)系上門的洗衣服務(wù),你根本不用操心,所有的是通過 主動的方式完成的。
將來的消費以及服務(wù)會更多的是通過AI主動推薦的模式,這個里面帶來的市場商業(yè)機會是會遠遠大于傳統(tǒng)模式的。因為這個圖象的模式相比語音和觸控是更高維的模式,在這個里面我們獲取到的信息也是遠遠大于觸控和語音這樣的二維方式帶來的信息。我們現(xiàn)在看到智能家居的演進過程三個比較明顯的變化,這個是會給我們帶來很大的商業(yè)機會。
說到這個變化的趨勢以后,我們對于目前智能家居市場大家都說了很多年,但是為什么一直沒有起來,我們也仔細的思考了一下,我們覺得有四個方面的原因。第一,左上角這塊,應(yīng)用場景分散,比如安全娛樂、家庭服務(wù)等等,還有家里面的智能設(shè)備過于分散,比如玩具、機器人、攝象頭等等,所有這些分散的應(yīng)用場景和電子設(shè)備會導致當我們想把他們智能化的時候,你是很難快速復(fù)制的。第二個挑戰(zhàn),是技術(shù),在智能家居里面你要服務(wù)人,這個人是非常難以服務(wù)的,這個里面技術(shù)的挑戰(zhàn),有語音、圖象等等,我們今天要解決很多的技術(shù)難題,仍然是有很大的挑戰(zhàn)。第三個,數(shù)據(jù),數(shù)據(jù)的搜集和分析是一個很難的過程,首先,家里面每個場景都是高度分散化的,每個家庭的需求也是不一樣的。
其次我們覺得,大家可能會比較容易忽視的問題,你只是拿到大數(shù)據(jù),這其實是遠遠不夠的,因為我們今天會發(fā)現(xiàn),你家里安裝上很多的接口,你搜集到很多的數(shù)據(jù),但是這些數(shù)據(jù)很多都是沒用的數(shù)據(jù),如果不停的把這些數(shù)據(jù)上傳到云端,這會占用很多的資源,而這些數(shù)據(jù)基本都是無效的。所以我們搜集數(shù)據(jù)的時候,我們要思考,不僅僅要搜集數(shù)據(jù),而且要搜集真正有價值的數(shù)據(jù)。但是這個事情并不是這么容易做到的。第四個挑戰(zhàn),真正的用戶體驗,我們現(xiàn)在人工智能的技術(shù)得到了很快的發(fā)展,但是真正讓人滿意,讓人感覺到這個交互的方式和服務(wù)的方式非常自然,這仍然是非常大的挑戰(zhàn)。這并不是一個純技術(shù)的問題,牽涉到很多其他的問題。有了這些挑戰(zhàn),人工智能在智能生活上的普及,我們覺得一定不是一蹴而就的事情,一定需要一段時間的慢慢積累。
應(yīng)對這些挑戰(zhàn),我們地平線有自己的觀點,第一,應(yīng)用場景分散的問題,從我們的角度來看,我必須要抓緊中間的主觀矛盾和變量,我們認為這個主要矛盾和變量就是人,我們現(xiàn)在人工智能的技術(shù)在智能家居這個領(lǐng)域就應(yīng)該把人做透。比如說我們看安全,現(xiàn)在家里面裝很多攝象頭主要的目的是為了安全,而安全其實核心是什么呢?最主要的是想知道家里有沒有人,第二,我要知道這個人是什么人,第三,我要知道這個人的行為,他做的行為是安全的行為還是不安全的,比如小孩子進入廚房,會不會點煤氣灶,這些都是不安全的行為。這些所有的都是要人做的。比如娛樂,家庭服務(wù)、健康、教育等等,就不一一舉例了,如果你好好思考的話,這個背后主要矛盾和變量就是人。我們地平線在這里是從人臉到人的行為分析,到人體的環(huán)境,以及這個人的語音和設(shè)備的交互,我們主要的核心點就是圍繞人,把這個技術(shù)做好。在這塊再支撐巨大的分散的智能家居的需求。
第二個是技術(shù),技術(shù)上的挑戰(zhàn),我們也是把他簡化,因為人的交互方式和獲取信息的方式其實是一個融合的方式,單獨的語音和圖象,或者單獨的其他任何傳感器,都不能涵蓋所有的應(yīng)用場景。所以一定是要圖象+語音。另外圖象中間,這個視覺的價值是高維的,80%的價值信息來自于圖象,只有20%來自于語音,在技術(shù)上要完成對智能家居最好體驗的布局,我們認為這個必須把圖象和語音的技術(shù)融合,只是單獨的做語音和圖象是缺位的。
第三個,數(shù)據(jù),要獲取有價值的數(shù)據(jù),怎么獲取呢?這個本身是不容易做到的,我們的思路也是比較清晰,就是做嵌入式的人工智能,端+ 云的方式,端側(cè)呢,大家可以看到,他在將來的人工智能的體系里面,扮演了一個非常重要的角色,現(xiàn)在我們談到所謂的人工智能的創(chuàng)意也好,什么也好,包括很多大公司,他們其實更多的是在云端做但是端上有不可取代的價值,主要是三個方面,第一,端是不依賴于網(wǎng)絡(luò)的,不管是在家里,還是哪里,大家會發(fā)現(xiàn)家里的無限網(wǎng)絡(luò)覆蓋很難做到完美,如果是在樓下,或者是在移動的場景中,這個網(wǎng)絡(luò)的覆蓋其實是非常有挑戰(zhàn)的事情,特別是當你牽涉到一些智能圖象處理的時候,你很難時時的把圖象傳到云端再處理回來,這個時候及時性沒有了。
還有我們怎么樣把有價值的數(shù)據(jù)傳到云端,這個就要求在端上一定要有一個自己的審核,是一個有選擇性的審核。比如我陽臺上有一個洗衣服的籃子,我就只關(guān)注這個里面衣服滿的時候,這個狀態(tài)我傳到云端。如果這個里面沒有衣服,99%的時間,這些數(shù)據(jù)是毫無意義的,就拋棄了。必須采用一個端+云的方式,這樣才有可能真正的做到最高效,而且是最有性價比的智能服務(wù)。
有了端上的智能以后,在云端可以做很多的事情,一個是可以搜集數(shù)據(jù),持續(xù)的優(yōu)化用戶的體驗另外是每一個硬件,將來都是和手機的形態(tài)一樣,他在上面都可以下載很多的智能APP,這個硬件可能已經(jīng)脫離了原來的形態(tài)了,你買回來的時候可能是一個家電,也可能是一個機器人,但是隨著我們的升級,他可以變成任何一個東西。
當我們真的有了這個大數(shù)據(jù),也對人的喜好了解以后,這個就不局限在家里了,當我們?nèi)嗽谄渌胤?,到任何一個地方都可以把云端的功能使用起來。將來的智能家居市場一定是端+云的架構(gòu)。
第四個,真正的用戶體驗,這個服務(wù)人是非常難的事情,我們現(xiàn)在服務(wù)的人工智能技術(shù)在宣傳的過程中,過多的強調(diào)我們這個技術(shù)本身,比過去傳統(tǒng)的技術(shù)好了很多,但是我們也要意識到,真正在這個過程當中要達到讓人滿意仍然是一個非常有挑戰(zhàn)的過程。舉個例子,語音,我們現(xiàn)在都會說我們語音可以支持遠場和近場,也可以識別一些都口音的普通話,甚至是方言,但是我們在實際應(yīng)用中,我們在家里面看到很多語音的設(shè)備,如果很多人同時講話的時候,這個時候的識別率就會下降的比較厲害。
當我們考慮場景的時候,一定要讓人非常自然的使用這個技術(shù)。圖象也是一樣,我們今天在家里面有很多人工智能的方案做人臉識別,如果你離的很近的時候確實識別的很好,但是如果離的比較遠,如果是走動的狀態(tài)下,如果是背光的情況下,怎么辦?這些都要解決,只有這樣用戶體驗才能真正好,才能真正的愿意使用這個技術(shù),這個市場才能真正的起來。另外一個,我們這個技術(shù)更多的還要依賴于攝象頭做到主動的服務(wù),對這個用戶要懂他,只有懂他才能使用戶得到好的體驗。
剛才總結(jié)了智能家居市場的一個現(xiàn)狀和發(fā)展趨勢,以及我們現(xiàn)在看到的四個挑戰(zhàn),場景非常分散,技術(shù)挑戰(zhàn)很大,如何搜集有價值的數(shù)據(jù)以及最后如何做到真正好的用戶體驗,我們也介紹了一些地平線的思考和做的事情??偟膩碚f,我們地平線的核心點就一句話,我們是做嵌入式的人工智能,我們認為這是最好的切入點。我們跟別的公司鮮明的區(qū)分也很簡單,很多的人工智能公司是非常優(yōu)秀和成功的,但是他們主要是依靠云端的技術(shù),我們地平線的目標是希望讓人工智能真正的分布到每一個端上,我現(xiàn)在在智能家居這個領(lǐng)域,我們圍繞人,用最小的處理資源,比如說我們現(xiàn)在的技術(shù)可以在APP上做到我們介紹的所有的智能事情,以及將來我們很快的可以看到,包括很多公司,包括地平線研發(fā)的,基于生物學習的專用的處理器架構(gòu),用最小的資源做到真正的好的技術(shù)服務(wù),給大家?guī)碜詈玫挠脩趔w驗。
地平線本身的定位,在這里也說一下,我們的定位其實是一個2B的公司,我們不會做2C的任何產(chǎn)品,我們地平線希望在嵌入式的設(shè)備上,有我們自己的IP,也可能有別人的IP在這個上面支撐更多的智能設(shè)備,有玩具、家電和攝象頭,我們地平線還會提供一個智能系統(tǒng)支撐平臺,這個平臺之上我們希望支撐整個行業(yè)的各個合作伙伴以及我們的客戶,由他們再 去針對各種各樣的智能生活中的場景做各種各樣好的服務(wù)和應(yīng)用。最后,帶給消費者最方便、最快捷、最舒適的用戶體驗,達到所有人的共同目標。
智能家居已經(jīng)成為物聯(lián)網(wǎng)浪潮下的一個重要增長市場,智能家居和物聯(lián)網(wǎng)的互聯(lián)融合也在加速。行業(yè)專家認為,真正的連接是以用戶價值為中心的需求互聯(lián),而不是簡單的技術(shù)互聯(lián)和場景互聯(lián)。對于智能家居市場的最新熱點趨勢和市場技術(shù)解讀,你不能錯過電子發(fā)燒友主辦的【第六屆智能家居技術(shù)創(chuàng)新研討會】。
電子發(fā)燒友舉辦【第六屆智能家居技術(shù)創(chuàng)新研討會】,屆時邀請業(yè)內(nèi)知名大咖如微軟戰(zhàn)略顧問管震、和而泰智能董事長劉建偉、深圳易聯(lián)智能李學勇等來解讀最新智能家居云平臺、智能語音交互和智能家居市場痛點和最新趨勢,請直接報名。
評論
查看更多