正式發(fā)布Cloud AutoML后的半個(gè)月,谷歌AI中國中心總裁、谷歌云AI研發(fā)主管李佳亮相谷歌在北京舉辦的Think With Google創(chuàng)想大會(huì)。接受采訪時(shí)李佳分享了谷歌云AI團(tuán)隊(duì)的工作、AutoML研發(fā)過程中最大難點(diǎn)、如何將研究與產(chǎn)品結(jié)合起來形成良性循環(huán)等數(shù)十個(gè)最為關(guān)注的話題。
2月6日,谷歌Think With Google大會(huì)在北京舉辦,旨在向廣告客戶及其他機(jī)構(gòu)介紹最新研發(fā)技術(shù),細(xì)分行業(yè)思考、產(chǎn)品打磨落地等熱點(diǎn)以及幫助開發(fā)者解決問題、探索新機(jī)會(huì)。
距Cloud AutoML正式發(fā)布不到半個(gè)月,同時(shí)作為谷歌去年在中國布局AI最隆重的一筆,李佳,谷歌AI中國中心總裁、谷歌云AI研發(fā)主管亮相大會(huì)自然受到最大關(guān)注。
過去短短幾年,面向企業(yè)的AI從一個(gè)萌芽想法變成商業(yè)利器,李佳認(rèn)為縮短科技創(chuàng)新最佳途徑就是研究先行,深入了解細(xì)分領(lǐng)域的需求,個(gè)性化打磨產(chǎn)品使之成為一個(gè)良性循環(huán),而谷歌AI云就是其中最關(guān)鍵的加速器。
AI賦能的精髓在于所有人都使用它,在過去短短兩個(gè)月時(shí)間,AutoML的注冊(cè)用戶已經(jīng)超過1萬家,其中包括企業(yè)、學(xué)校、創(chuàng)業(yè)公司、研究組織等等。一個(gè)簡單的例子,倫敦動(dòng)物學(xué)會(huì)利用AutoML自動(dòng)標(biāo)注圖片追蹤野生動(dòng)物種群以學(xué)習(xí)更多關(guān)于它們的分布信息,更好地理解人類對(duì)這些物種的影響。
李佳:用研究來推動(dòng)ai,對(duì)垂直領(lǐng)域深入思考后最終產(chǎn)品落地,這是良性循環(huán)
問:關(guān)于AI 在教育和醫(yī)療的落地的情況,中國有沒有具體案例和推進(jìn)的進(jìn)度?
李佳:現(xiàn)在中國 AI 中心的關(guān)注點(diǎn)還是在基礎(chǔ)研究上面,但在教育方面有很多有意思的問題還需要大家去探討,比如說教育理念的對(duì)話,學(xué)生和老師如何去交流,由于雙方的角色不一樣,知識(shí)水平不一樣,對(duì)對(duì)話內(nèi)容的交流和理解也不同,所以我們很關(guān)注這方面教育的研究,但目前還沒有具體落地的進(jìn)展。
問:AutoML現(xiàn)在服務(wù)的企業(yè)都是什么樣類型?哪一些行業(yè)最集中在用?有何反饋?
李佳:AutoML 目前注冊(cè)的用戶背景很廣泛,我們看到有很多有意思的案例,就像剛才提到的倫敦動(dòng)物學(xué)學(xué)會(huì)它用來保護(hù)野生動(dòng)物,還有像零售業(yè)也有很多對(duì)此感興趣的,還有用來保護(hù)環(huán)境的,比如去檢測(cè)哪里有垃圾?哪里有礦泉水瓶子之類的,像這種很有創(chuàng)造力的案例還是很多的,而且有很多我們以前也沒有見到過。當(dāng)然云上面也有不少用戶在做醫(yī)療,有些醫(yī)療企業(yè)對(duì)這些功能也很感興趣。
問:您剛加入的時(shí)候已經(jīng)在研究或者準(zhǔn)備AutoML了,但是卻等到今年1月才發(fā)布,是不是過程中有遇到什么困難?最重要的一個(gè)或者最具挑戰(zhàn)性的技術(shù)難點(diǎn)是什么?
李佳:我們剛加入的時(shí)候做的一個(gè)事情實(shí)際上是看到底哪些機(jī)器學(xué)習(xí)和 AI 的應(yīng)用會(huì)比較受歡迎。AutoML 實(shí)際上已經(jīng)研究了有一段時(shí)間。大家也看到,包括我們?cè)诎l(fā)布的博客里面也列出了很多文章。
一般來說研究先行,而且我們還和很多團(tuán)隊(duì),包括 Google Brain,包括 Research,都有緊密合作。我覺得最大的難點(diǎn)在于,大家都覺得研究技術(shù)做的好,自然產(chǎn)品就有人用,但是在實(shí)際生活當(dāng)中,特別是在企業(yè) AI 這個(gè)方面,對(duì)產(chǎn)品的打磨和考量,是要與用戶的需求相結(jié)合的,我覺得這兩點(diǎn)的結(jié)合最關(guān)鍵。可能攻克了這一點(diǎn)以后,后面就會(huì)順利很多。
比如說在 AutoML 產(chǎn)品里面,它最先進(jìn)的技術(shù)是learning to learn這一塊,我們得到的效果也是最好的。但是同時(shí)我們會(huì)考量到learning to learn技術(shù)在計(jì)算方面的資源需要,我們實(shí)際上最后推出產(chǎn)品的時(shí)候是有兩個(gè)特點(diǎn),一個(gè)是非常簡單的遷移學(xué)習(xí)(transfer learning),很多的客戶他們可以在一分鐘或者幾分鐘之內(nèi)就能得到他們的結(jié)果。第二個(gè)是learning to learn與其他相結(jié)合的,這個(gè)更加的先進(jìn),而且他們的性能也會(huì)好很多,但是目前需要一天來達(dá)到產(chǎn)品級(jí)的效果。
雖然聽起來一天時(shí)間是比較長的,但是我們可以想想原來,剛剛我在演講里面也列出來了,在傳統(tǒng)意義上,大家去做一個(gè)機(jī)器學(xué)習(xí)定制的算法和產(chǎn)品的話,他這個(gè)周期是非常長的,包括你要去招募機(jī)器學(xué)習(xí)的一些專家,包括要去設(shè)計(jì)機(jī)器學(xué)習(xí)的算法、收集數(shù)據(jù),實(shí)際上通常要花費(fèi)數(shù)個(gè)月或者數(shù)年。AutoML 實(shí)際上現(xiàn)在自動(dòng)生成的模型已經(jīng)比專家設(shè)計(jì)的模型在圖片分類上效果要更好,所以這樣比起來產(chǎn)品開發(fā)的周期是大大縮小了,企業(yè)的花銷也是大大的縮小了。
問:在 CV 跟語言結(jié)合的方面,Google 有哪一些探索?您認(rèn)為 CV 的研究在圖象識(shí)別這類的感知領(lǐng)域進(jìn)化到圖像描述以及回答認(rèn)知領(lǐng)域還需要哪些突破?
李佳:在 CV 和語言方面,我自己進(jìn)行了一些比較淺的工作,包括去年我們?cè)?CVPR 有對(duì)圖片描述的工作,用強(qiáng)化學(xué)習(xí)來做圖片的描述,這些我覺得大家現(xiàn)在做的都還比較初期,因?yàn)檫@個(gè)問題確實(shí)非常的難,其中幾個(gè)重要的問題需要去探索的就是怎么樣把我們的知識(shí)和感知結(jié)合到一起。
因?yàn)楝F(xiàn)在最有效的這些算法,讓大家都聽性能有多好,但是人去理解一個(gè)圖片或者一個(gè)場(chǎng)景的時(shí)候,我們通常都帶著自己的知識(shí)和背景,也不需要那么大量的數(shù)據(jù)來做訓(xùn)練,其實(shí)領(lǐng)域里面也有一些很早的先行者在探索這方面的工作,但是我覺得真正要突破它還是需要一定的時(shí)間。
問:Cloud AutoML 會(huì)不會(huì)成為 AI 中心的核心產(chǎn)品?您能否分享一下AI 中國中心的發(fā)展規(guī)劃?
李佳:我們 AI 中國中心主要的關(guān)注點(diǎn)還是在基礎(chǔ)研究上,目前中國中心我們想聚集最好的AI的人才和國內(nèi)很多的優(yōu)秀的 AI 人才一塊來推動(dòng)基礎(chǔ)研究的發(fā)展,而且希望影響力是全球性的,剛才我也提到了 AI 本身是沒有國界的,所以我們希望最后 AI 的技術(shù)大家都能夠用的到。
AutoML 是今年我們?cè)?Cloud AI 團(tuán)隊(duì)重點(diǎn)的一個(gè)產(chǎn)品,它確實(shí)是我們想用于普及 AI 的一個(gè)很好的工具。剛才我在演講當(dāng)中也提到了想用 AI 的用戶分為幾種:
第一種是對(duì) AI 非常熟悉的,這些人他們可以用 TensorFlow 去開發(fā),他們可以用 Cloud,或者大家提供一些工具,自己就能夠把這個(gè)機(jī)器學(xué)習(xí)開發(fā)做的非常的好。
第二種是 API 的用戶,這些用戶通常沒有自己的數(shù)據(jù),他需要一些比較通用的或是描述性的東西,比如他只需要提供一張照片馬上就能達(dá)到結(jié)果,或者是給他提供一個(gè)音頻片段,他就可以得到一段轉(zhuǎn)錄,根本不需要花時(shí)間開發(fā)自己的模型,這是對(duì)很多大量的用戶非常方便的,包括翻譯之類的,我們剛才看到很多的用戶他們也是 Google 翻譯的 API 用戶。
第三種是他們有一些想法和數(shù)據(jù),想要定制自己的模型,但是他們不知道自己怎么去做。AutoML 能夠把這個(gè)門檻降低,讓他們不需要再去招募大量的機(jī)器學(xué)習(xí)的人才,也不需要花大量的時(shí)間去標(biāo)注他們的訓(xùn)練數(shù)據(jù),就直接可以得到自己定制的東西。
還有一種在演講里面沒有提到,其實(shí)有很多的傳統(tǒng)行業(yè)他來找我們談AI合作的時(shí)候,通常他們都是說 AI 我們覺得是一個(gè)非常重要的方向,我們不想錯(cuò)過這個(gè)方向,但是我們不知道要做什么?我們不知道拿它來怎么做?
我們通常都是把他們跟我們的高級(jí)解決方案實(shí)驗(yàn)室(Advanced Solution Lab)進(jìn)行密切的合作,在我們高級(jí)解決方案實(shí)驗(yàn)室(AdvancedSolution Lab)可以邀請(qǐng)我們的客戶到 Google 來,我們教他們?cè)趺从脵C(jī)器學(xué)習(xí),怎么用深度學(xué)習(xí),深度的密切合作,去了解行業(yè)領(lǐng)袖他們需要解決什么樣的問題,Google 的工程師會(huì)跟他們深度的合作,幫他們開發(fā)這些算法。所以實(shí)際上AI整個(gè)產(chǎn)業(yè),他的范圍非常的廣,我們需要開發(fā)各種不一樣的產(chǎn)品來幫助我們各種各樣的用戶都能夠從 AI 當(dāng)中受益。
問:現(xiàn)在云市場(chǎng)的競爭非常激烈,您覺得 Google云最大的優(yōu)勢(shì)是什么,以及未來三到五年如何來保持這樣的優(yōu)勢(shì)呢?
李佳:最大的優(yōu)勢(shì)是 AI,Google是一個(gè) AI first 的公司,我們現(xiàn)在幾乎所有的產(chǎn)品都是 AI 賦能,其實(shí)是十幾年的產(chǎn)品的迭代以及對(duì) AI 的理解,所以把我們帶到了這一步。在云上面,我們想把很多很好的科技分享給更多的用戶,讓他們能夠創(chuàng)造很多更好的產(chǎn)品,所以云目前是一個(gè) AI 很好發(fā)揮的機(jī)會(huì),AI 也是云很好的一個(gè)優(yōu)勢(shì),我們非常想用 AI 作為戰(zhàn)略方向,來幫助普及 AI 的使用。
問:目前已經(jīng)知道 AutoML 可以替代很多機(jī)器學(xué)習(xí)開發(fā)者的工作,但如果現(xiàn)在一個(gè)企業(yè)想使用 AutoML,那么他還需要這方面的開發(fā)者嗎?如果需要開發(fā)者,他們做的任務(wù)會(huì)發(fā)生哪些變化?
李佳:這是一個(gè)很好的問題,但有一點(diǎn)我想糾正一下,AutoML 他是為開發(fā)者所打造的一個(gè)產(chǎn)品。目前來看,全球可能有100萬人有能力去開發(fā)機(jī)器學(xué)習(xí)的算法,而根據(jù)我們的統(tǒng)計(jì)全球有大概2100萬的開發(fā)者可以使用這些 API 或者像 AutoML 這樣的產(chǎn)品。
實(shí)際上,我們發(fā)展 AutoML 就是把使用機(jī)器學(xué)習(xí)的門檻降低了,能夠讓更多的開發(fā)者或者對(duì)機(jī)器學(xué)習(xí)了解不多的人,更好的把產(chǎn)品發(fā)展起來,更好的把AI的技術(shù)運(yùn)用起來,因?yàn)槲覀兪冀K認(rèn)為當(dāng)所有人都可以使用 AI 的時(shí)候,它才是最有力量的。而現(xiàn)在是存在這樣的技術(shù)門檻,我們就是想把這個(gè)技術(shù)門檻降低,讓更多的人能使用的上。
由于有了像 AutoML 這樣的產(chǎn)品,或者將來會(huì)出現(xiàn)的各種各樣的 AI 產(chǎn)品,我看到的是會(huì)有更多的人能夠把這個(gè)技術(shù)能用起來,能夠創(chuàng)造去更多的機(jī)會(huì)。所以我反倒覺得這樣可能機(jī)會(huì)會(huì)變的更多,到那個(gè)時(shí)候就有更多懂行業(yè)、懂產(chǎn)品的人,能夠把他們的特長發(fā)揮到極致。
問:去年有兩個(gè)比較轟動(dòng)的事件,一個(gè)是Facebook 的虛假新聞,另一個(gè)是 Google YouTube 里一個(gè)叫做艾沙門的事件。有一些兒童影片看起來色彩很鮮艷,但是里面的內(nèi)容其實(shí)比較暴力,不太適合兒童觀看。比較有意思的是 Facebook 、Google 以及 今日頭條,他們目前選擇的方式是上線到近萬名的人工來審核這些內(nèi)容。我的問題是:我們的機(jī)器學(xué)習(xí)算法能夠在哪一些方式上改進(jìn)這些機(jī)器審核,不再讓技術(shù)型的企業(yè)變成勞動(dòng)密集型的產(chǎn)業(yè)。
李佳:實(shí)際上這種 Adversarial(對(duì)抗性) 的行為是最難做的。因?yàn)闄C(jī)器的算法是人設(shè)計(jì)的,他只是根據(jù)人的設(shè)定去進(jìn)行工作。另外一邊是一些惡意去干擾機(jī)器算法的人。目前來看,這還是一個(gè)非常活躍的研究領(lǐng)域,Google 內(nèi)部成立了一個(gè)專門的團(tuán)隊(duì)從研究的角度來解決類似偏見、隱私這類的問題。
另外一方面,確實(shí)也反映 AI 實(shí)際上處在一個(gè)非常初期的狀態(tài),我們希望有更多的聰明人,把他們的聰明和才智用在好的方面,去創(chuàng)造更多正面的價(jià)值,而不是用來進(jìn)行一些很惡意的行為。因?yàn)锳I 其實(shí)只是一個(gè)工具,就像繩子一樣,你可以用它來做好的事情,也可以用它來做壞的事情,我們希望有更多的正面的人去做更多的正面的事。
問:是像殺毒軟件一樣,有惡意的攻擊,殺毒軟件就來進(jìn)行應(yīng)對(duì)?
李佳:有一點(diǎn)像這樣,我希望研究能夠進(jìn)展到一定的程度,這樣能夠使人工方面和研究方面的任務(wù)都可以有所緩解。
問:李佳老師您好,最近AI芯片的話題比較火熱,就像云服務(wù)器芯片跟端智能芯片,而 Google 也有TPU芯片,您覺得AI芯片的熱潮是一種短時(shí)間?還是會(huì)長時(shí)間影響AI產(chǎn)業(yè)?
李佳:我覺得芯片代表的是算力,在我半年前的演講里面提過,人工智能有幾個(gè)支柱,包括:數(shù)據(jù)、算法、算力以及人才。所以算力也是給我們帶來了很多的新的機(jī)會(huì),包括像 learning to learn (學(xué)會(huì)學(xué)習(xí))這種做 Neural ArchitectureSearch 的算法,如果沒有大量的算力支撐,是無法辦到的。以前都是靠專家自己通過大量的調(diào)試,通過多年的經(jīng)驗(yàn)才能做到這樣的效果,現(xiàn)在因?yàn)樗懔Φ倪M(jìn)步,我們看到了這些新的機(jī)會(huì)出現(xiàn),所以芯片的進(jìn)步對(duì)于 AI 來說一直都是一個(gè)非常正面的支持。
問:今天分享了很多AI+行業(yè)的話題,比如說教育以及醫(yī)療的,我想知道這些具體行業(yè)的選取標(biāo)準(zhǔn)是什么?是 Google 的一個(gè)興趣?還是看到一些技術(shù)已經(jīng)成熟了,可以能夠更好的進(jìn)行結(jié)合,或者說這類的領(lǐng)域的需求度比較高?
李佳:我認(rèn)為,做產(chǎn)品的話,通常是會(huì)關(guān)注用戶的需求和技術(shù)的發(fā)展去進(jìn)行結(jié)合。而做研究就需要更大膽一些,我們會(huì)看到哪一領(lǐng)域出現(xiàn)的一些重要的問題,但是目前還沒有辦法來解決。我們就會(huì)選擇這些方面來進(jìn)行探索,比如說像醫(yī)療這種很難啃的領(lǐng)域,實(shí)際上它也是需要更多的人來助力把這些事情做好。
問:當(dāng)某一個(gè)零售行業(yè)要使用 AutoML 來做一個(gè) AI 模型的時(shí)候,他在什么場(chǎng)景下用?因?yàn)槲抑垃F(xiàn)在做零售要 AI 軟硬件結(jié)合,AutoML 可能只是軟件方面,那硬件方面呢,需要如何與其他的硬件供應(yīng)商進(jìn)行配合?
李佳:零售方面大家都在考慮線上線下、軟硬結(jié)合的模式。就如我剛提到的例子,他是專門針對(duì)在商品圖片上面的分類。比如說在迪斯尼里,如果你需要找一個(gè)米老鼠或者是想找一個(gè)艾莎的照片,他們需要定制的模型才能夠?qū)崿F(xiàn)你的需求。當(dāng)然如果我們提到這種無人店,他對(duì)于機(jī)器學(xué)習(xí)和洞察力這樣的需求就更多了。
-
谷歌
+關(guān)注
關(guān)注
27文章
6169瀏覽量
105439 -
AI
+關(guān)注
關(guān)注
87文章
30947瀏覽量
269214 -
李佳
+關(guān)注
關(guān)注
0文章
2瀏覽量
1148
原文標(biāo)題:十問李佳,機(jī)器學(xué)習(xí)開發(fā)者會(huì)因谷歌AutoML失業(yè)嗎?
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論