11月28日上午,2017年Google APAC Press在東京舉行,本次會(huì)議的主題是Made With AI,Google Brain團(tuán)隊(duì)負(fù)責(zé)人、Google Research Group資深院士Jeff Dean以及Google AI軟硬件產(chǎn)品研發(fā)的負(fù)責(zé)人發(fā)表了演講,闡述了Google如何將AI運(yùn)用到自己的軟硬件產(chǎn)品上,以及如何與社會(huì)機(jī)構(gòu)合作解決人類(lèi)面臨的重大問(wèn)題。
Jeff Dean首先登場(chǎng),他闡述了Google在人工智能領(lǐng)域的愿景,即通過(guò)三種途徑讓每個(gè)人都從中受益。這三個(gè)方面包括:利用AI使得Google產(chǎn)品更加實(shí)用,幫助企業(yè)和開(kāi)發(fā)者創(chuàng)新,以及為研究人員提供工具,從而解決人類(lèi)面對(duì)的各項(xiàng)重大挑戰(zhàn)。
一、AI已經(jīng)完全深入Google的軟硬件產(chǎn)品
Jeff Dean表示,機(jī)器學(xué)習(xí)是Google在人工智能領(lǐng)域的工作重心。通過(guò)機(jī)器學(xué)習(xí),可以極大的改善Google的產(chǎn)品。這些產(chǎn)品有:將機(jī)器學(xué)習(xí)用于分類(lèi)的軟件Goolge Photos 中的照片搜索(Photo Search)、Google Translate中的即時(shí)相機(jī)翻譯(Word Lens)和 Google Lens。將機(jī)器學(xué)習(xí)用于預(yù)測(cè)的系統(tǒng)程序,如Gmail 和 Inbox 中的智能回復(fù)(Smart Reply),Google Maps 中停車(chē)難易度的圖標(biāo)(Parking difficulty icons)。將機(jī)器學(xué)習(xí)用于理解的系統(tǒng)程序,如Google Assistant,YouTube 中的自動(dòng)字幕(Auto captions)和神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(Neural Machine Translation)。
1、Goolge Photos
Goolge Photos是圍繞機(jī)器視覺(jué)建立的一個(gè)產(chǎn)品,可以讓用戶(hù)輕松在照片庫(kù)中搜索到特定照片,比如搜索 “狗”或者“擁抱”的照片。另外,Google Photos還可以自動(dòng)向用戶(hù)推薦與哪些好友分享照片。
2、Google Translate
自去年以來(lái),Google開(kāi)始將神經(jīng)網(wǎng)絡(luò)用于翻譯中,大大提高了翻譯的準(zhǔn)確性和質(zhì)量。據(jù)Jeff Dean透露,Google Translate中已經(jīng)有97個(gè)語(yǔ)言對(duì)使用了神經(jīng)網(wǎng)絡(luò)翻譯,整體上使得翻譯效果更流暢、更好。而即時(shí)相機(jī)翻譯功能也已經(jīng)成為Google Translate的一大特色。
值得一提的是,Google Translate是目前在中國(guó)大陸唯一能夠使用的谷歌產(chǎn)品。
3、Google Lens
Google Lens在今年5月份的Google I/O開(kāi)發(fā)者大會(huì)上發(fā)布,是一款基于圖像識(shí)別和OCR技術(shù)的人工智能應(yīng)用,能夠讓機(jī)器學(xué)會(huì)“看圖說(shuō)話”。Google Lens能實(shí)時(shí)識(shí)別用智能手機(jī)相機(jī)所拍攝的物品并提供與之相關(guān)的內(nèi)容,目前Google Lens已經(jīng)集成到Google Assistant和Google Photos中。
4、Gmail 和 Inbox
Google將機(jī)器學(xué)習(xí)用于郵件回復(fù)中,推出智能回復(fù)的功能,當(dāng)用戶(hù)要回復(fù)郵件的時(shí)候,智能回復(fù)可以自動(dòng)給一些建議的回復(fù)內(nèi)容,可以加速我們的辦公效率,尤其是在使用手機(jī)回復(fù)郵件的時(shí)候。Jeff Dean稱(chēng),目前有12%的郵件回復(fù)是在手機(jī)上進(jìn)行的。
5、Google Maps
通過(guò)機(jī)器學(xué)習(xí),Google Maps可以變成一個(gè)實(shí)用的地圖,比如目前的停車(chē)難問(wèn)題,Google Maps可以預(yù)測(cè)這個(gè)地方有沒(méi)有停車(chē)位,標(biāo)出停車(chē)難易度的圖標(biāo),然后幫你導(dǎo)航過(guò)去。
另外,通過(guò)機(jī)器學(xué)習(xí),基于你愿意看什么節(jié)目,愿意聽(tīng)什么音樂(lè),它還可以幫助用戶(hù)推薦一些歌曲或一系列相關(guān)的音樂(lè)產(chǎn)品,這就能運(yùn)用到Google Play Music上。
6、Google Allo
Google Allo是一款主打定制表情的即時(shí)通信類(lèi)App,使用者在發(fā)送這些表情或文字的時(shí)候,可以改變進(jìn)行涂鴉表情回復(fù),以此來(lái)表示預(yù)期和心情。另外,人工智能甚至在Allo上可以幫助你聊天,人工智能能自動(dòng)推送你一些常用的回答方式。
7、Google Assistant
Google Assistant核心技術(shù)是語(yǔ)音識(shí)別。比如詢(xún)問(wèn)Google新德里的天氣是什么樣的,它會(huì)通過(guò)語(yǔ)音識(shí)別、理解,然后以合理的形式展示給用戶(hù)。Jeff Dean說(shuō),這個(gè)系統(tǒng)是非常復(fù)雜的,其中包含了很多機(jī)器學(xué)習(xí)的相關(guān)技術(shù)。這個(gè)產(chǎn)品沒(méi)有機(jī)器學(xué)習(xí)是不存在的。
8、YouTube
在YouTube上,通過(guò)機(jī)器學(xué)習(xí)給超過(guò)10億的視頻自動(dòng)加上字幕,可以讓世界上近3億的聾啞人或者有聽(tīng)覺(jué)障礙的人可以看到視頻上的東西。Jeff Dean成,我們還在不斷的改進(jìn)這個(gè)語(yǔ)音識(shí)別系統(tǒng),使“自動(dòng)字幕”的文字準(zhǔn)確性提升了50%?!巴ㄟ^(guò)神經(jīng)網(wǎng)絡(luò)等技術(shù),可以讓聽(tīng)力有障礙或者不精通視頻播放語(yǔ)言的人通過(guò)自動(dòng)字幕享受到視頻?!?/p>
9、Pixel Buds
Google將AI與新型硬件、軟件相結(jié)合的另一個(gè)實(shí)例是 Pixel Buds。這是一種能實(shí)時(shí)將你周?chē)鷦e人說(shuō)的話翻譯成你的母語(yǔ)的耳機(jī),運(yùn)用了語(yǔ)音識(shí)別和翻譯技術(shù)。Jeff Dean表示,有了它你就能在陌生的語(yǔ)言環(huán)境中漫游,幾秒鐘后便能翻譯成你的母語(yǔ)。
Jeff Dean同時(shí)提到,在2017年5月,我們發(fā)布了TensorFlow1.0,同時(shí)我們也在不斷的進(jìn)一步發(fā)開(kāi)增加新的功能,讓這個(gè)平臺(tái)變得更好用,更強(qiáng)大。
二、人工智能對(duì)于硬件產(chǎn)品使用體驗(yàn)的提升
Google Pixel Camera產(chǎn)品經(jīng)理Isaac Reynolds詳細(xì)闡述了人工智能對(duì)于硬件產(chǎn)品的體驗(yàn)提升。
首先,他介紹了Pixel 2 XL上的人像模式(Portrait Mode)。Isaac Reynolds到達(dá)東京的以后,他用Pixel 2 XL拍攝了很多人像照片,通過(guò)機(jī)器學(xué)習(xí)技術(shù),可以自動(dòng)判別哪個(gè)是人,哪些物體距離更近,哪些更遠(yuǎn),從而自動(dòng)進(jìn)行背景虛化,達(dá)成更好的人像效果。Isaac Reynolds說(shuō),雖然手機(jī)硬件的創(chuàng)新看上去是結(jié)束了,但還有很多AI與軟件方面的創(chuàng)新。
機(jī)器學(xué)習(xí)還被用于為Google Home智能音箱提供語(yǔ)音配對(duì)功能(Voice Match)。機(jī)器學(xué)習(xí)有助于識(shí)別不同的語(yǔ)音,使最多六個(gè)用戶(hù)連接到同一臺(tái) Google Home。Isaac Reynolds稱(chēng),Google Home是首個(gè)具備此功能的智能音箱。另外,機(jī)器學(xué)習(xí)技術(shù)也幫助Google Home僅適用兩個(gè)麥克風(fēng)就能判斷聲源位置。
另外,基于地理位置,機(jī)器學(xué)習(xí)可以幫助Google Home Max判別音箱所在的位置,自動(dòng)調(diào)節(jié)適合錄音室還是家中的音響效果。
三、用機(jī)器學(xué)習(xí)
Google研究項(xiàng)目總監(jiān)Linne Ha詳細(xì)闡述了機(jī)器學(xué)習(xí)如何幫助解決語(yǔ)言問(wèn)題。她說(shuō),世界上有6000種語(yǔ)言,另外還有很多方言,這其中超過(guò)100萬(wàn)人以上使用的語(yǔ)言有400種,但是,目前網(wǎng)絡(luò)上的內(nèi)容大約50%以上都是英文,這就是用機(jī)器學(xué)習(xí)來(lái)解決語(yǔ)言互通的重要性。
Linne Ha稱(chēng),語(yǔ)言是身份不可或缺的一部分,谷歌想要?jiǎng)?chuàng)造一個(gè)技術(shù),能夠讓更多的人聯(lián)網(wǎng),讓不同語(yǔ)言的人上網(wǎng)更容易。
另外,機(jī)器學(xué)習(xí)技術(shù)在輸入法也是非常重要的。首先是鍵盤(pán),英文有26個(gè)字母,這個(gè)鍵盤(pán)排列很普遍,但是有一些語(yǔ)言有30個(gè)字幕,我們通過(guò)機(jī)器學(xué)習(xí)來(lái)做預(yù)測(cè)排列方式。
其次是谷歌手寫(xiě)輸入,Google Handwriting Input,利用機(jī)器學(xué)習(xí)可以更準(zhǔn)確的判斷手寫(xiě)內(nèi)容。
第三還有語(yǔ)音輸入Voice Input,在機(jī)器學(xué)習(xí)的幫助下,自然語(yǔ)言處理系統(tǒng)能夠更好地理解你想說(shuō)的話。語(yǔ)音搜索支持 119 種語(yǔ)言,其中包括 11 種印度語(yǔ)言和 3 種印度尼西亞語(yǔ)言。
對(duì)于小數(shù)據(jù)的語(yǔ)言模型的訓(xùn)練,Linne Ha說(shuō)到,他們還發(fā)起了Unison Date Collection活動(dòng),到小語(yǔ)種地區(qū),讓當(dāng)?shù)氐娜嗣咳苏f(shuō)45分鐘,收集數(shù)據(jù)進(jìn)行訓(xùn)練。另外,Google 還發(fā)起了文本轉(zhuǎn)語(yǔ)音 (Text-to-Speech)項(xiàng)目Project Unison,這是一個(gè)利用機(jī)器學(xué)習(xí)實(shí)現(xiàn)文本向語(yǔ)音轉(zhuǎn)換的實(shí)驗(yàn)項(xiàng)目。通過(guò)轉(zhuǎn)換引擎,手機(jī)可以用語(yǔ)料并不豐富的語(yǔ)種,如孟加拉語(yǔ),高棉語(yǔ)和爪哇語(yǔ)與您對(duì)話。而機(jī)器學(xué)習(xí)模型有助于減少構(gòu)建文本到語(yǔ)音模型所需的數(shù)據(jù)量。
Linne Ha稱(chēng),方言是我們的下一步需要解決的問(wèn)題。
四、打造新的人機(jī)交互方式:Google Assistant
Google Assistant 工程總監(jiān)Pravir Gupta介紹了這款智能助手的情況。他說(shuō),目前的 Google Assistant支持不同種類(lèi)的任務(wù),比如尋找某一問(wèn)題的答案、導(dǎo)航服務(wù)、獲取新聞或得到日程安排方面的幫助,在現(xiàn)場(chǎng),Pravir Gupta為了一個(gè)“在東京是不是要給小費(fèi)”、“給我XXX的照片”、”中巴犬是怎么叫的“等問(wèn)題,Google Assistant簡(jiǎn)潔完整的回答了這個(gè)問(wèn)題。最值得一提的是, Google Assistant 可以在不同設(shè)備間通用,并且可以無(wú)縫切換。
目前,Google Assistant可以在澳大利亞、巴西、加拿大(英文和法文)、德國(guó)、法國(guó)、意大利、印度(英文和印度文)、印度尼西亞、日本、韓國(guó)、墨西哥、新加坡、西班牙、英國(guó)、美國(guó)等國(guó)家和地區(qū)使用。
五、機(jī)器學(xué)習(xí)在企業(yè)中的應(yīng)用
Google AI在企業(yè)領(lǐng)域的布局逐步清晰,Google為企業(yè)及開(kāi)發(fā)者提供三種創(chuàng)新工具:TensorFlow,云機(jī)器學(xué)習(xí) API (Cloud Machine Learning APIs) 以及張量處理器 (Tensor Processing Unit, TPU) 電腦芯片。主要目的是為了幫助企業(yè)進(jìn)行創(chuàng)新,同時(shí)優(yōu)化流程。
會(huì)上,Google邀請(qǐng)了日本當(dāng)?shù)厥称菲髽I(yè)丘比(Kewpie)公司上臺(tái)演講,闡述了丘比公司使用AI改善日本管理思想中的現(xiàn)場(chǎng)管理,包括顧客管理、供應(yīng)鏈等方面。丘比使用 TensorFlow 開(kāi)發(fā)出一個(gè)工具,可以從嬰兒食品中所使用的切塊土豆中檢測(cè)出食品生產(chǎn)中有缺陷的成分。
六、利用AI解決人類(lèi)面臨的巨大挑戰(zhàn)
會(huì)議最后,Google產(chǎn)品經(jīng)理、醫(yī)療成像團(tuán)隊(duì)負(fù)責(zé)人Lily Peng登臺(tái)演講,闡述了Google的AI技術(shù)如何幫助人類(lèi)解決目前面臨的一些重大挑戰(zhàn):如醫(yī)療保艦?zāi)茉春铜h(huán)境保護(hù)問(wèn)題。
在醫(yī)療方面,Lily Peng 的團(tuán)隊(duì)與印度、泰國(guó)和美國(guó)的一些醫(yī)院合作開(kāi)發(fā)一種工具,可以通過(guò)機(jī)器學(xué)習(xí)幫助診斷糖尿病所引起的視網(wǎng)膜病變(數(shù)據(jù)顯示,全世界有4.15億人收到此病的困擾,50%的患者因?yàn)榈貌坏教崆皺z查致盲。)的篩查工作。他們所開(kāi)發(fā)的算法的準(zhǔn)確性可以媲美專(zhuān)業(yè)的眼科醫(yī)生,能夠在缺少眼科醫(yī)生的地方發(fā)揮重要作用。
Lily Peng回顧了他們對(duì)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行了培訓(xùn)的過(guò)程,她的團(tuán)隊(duì)獲得了眾多的糖尿病指視網(wǎng)膜病變的圖像,一共收集了13萬(wàn)張這種圖片,然后找了54個(gè)專(zhuān)業(yè)醫(yī)生進(jìn)行閱讀,進(jìn)行了88萬(wàn)個(gè)診斷,對(duì)圖像進(jìn)行分級(jí)和模型訓(xùn)練。最終的這個(gè)系統(tǒng)的結(jié)果,機(jī)器學(xué)習(xí)系統(tǒng)的表現(xiàn)比專(zhuān)業(yè)眼科醫(yī)生的識(shí)別準(zhǔn)確率還要高一點(diǎn)。
另外,機(jī)器學(xué)習(xí)還用乳腺癌的診斷,通過(guò)將機(jī)器學(xué)習(xí)應(yīng)用于乳腺X光檢查,來(lái)探索新的方法以提高乳腺癌的檢測(cè)幾率。Google、DeepMind聯(lián)合英國(guó)癌癥研究中心研發(fā),希望建立一種機(jī)器學(xué)習(xí)模型,能夠快速、準(zhǔn)確地檢測(cè)出癌癥的跡象,幫助醫(yī)生盡早發(fā)現(xiàn)癌癥,以便盡早開(kāi)始治療。
機(jī)器學(xué)習(xí)運(yùn)用到醫(yī)療領(lǐng)域之外,還可以推進(jìn)很多的進(jìn)展,還可以找到新的治療方法,用到基因測(cè)序,計(jì)算機(jī)環(huán)保、能源、交通領(lǐng)域的問(wèn)題,Lily Peng說(shuō),我們還是處在一個(gè)開(kāi)端,我們希望這些方法能為研究機(jī)構(gòu)提供更多的方法。
在環(huán)保問(wèn)題上,Google邀請(qǐng)維多利亞大學(xué)博士生Victor Anton闡述了如何利用機(jī)器學(xué)習(xí)來(lái)保護(hù)鳥(niǎo)類(lèi)。Victor Anton 致力于追蹤新西蘭瀕臨滅絕的鳥(niǎo)類(lèi),以改善對(duì)它們的保護(hù)工作。他收集了 5 萬(wàn)個(gè)小時(shí)的音頻并將其轉(zhuǎn)換成譜圖,通過(guò) TensorFlow 更加快速高效地分析這些音頻,對(duì)鳥(niǎo)類(lèi)的聲音進(jìn)行分類(lèi),識(shí)別譜圖中的鳥(niǎo)鳴聲,以便更好的了解鳥(niǎo)類(lèi)。他希望此研究能夠?yàn)樾挛魈m未來(lái)的動(dòng)物保護(hù)工作提供有價(jià)值的信息。
七、總結(jié),Google是一家AI First的公司
Jeff Dean在會(huì)議最后總結(jié)到,作為一家 AI First 的公司,Google 致力于讓每個(gè)人都能夠從人工智能中獲益。Jeff Dean稱(chēng),雖然取得了一些成績(jī),但是還有很多困難需要克服。
例如需要想方設(shè)法讓機(jī)器學(xué)習(xí)模型的創(chuàng)作過(guò)程更加觸手可及?為了解決這個(gè)問(wèn)題,Google已經(jīng)開(kāi)展了人工智能的內(nèi)部培訓(xùn),已經(jīng)有1.8萬(wàn)名Google員工參加過(guò)此項(xiàng)培訓(xùn),而且Google將于2018年在互聯(lián)網(wǎng)上提供免費(fèi)的機(jī)器學(xué)習(xí)課程。Jeff Dean同時(shí)透露,Google也同時(shí)在中國(guó)招募機(jī)器學(xué)習(xí)相關(guān)的人才。
另外一個(gè)挑戰(zhàn)是,如何確保我們構(gòu)建的機(jī)器學(xué)習(xí)模型具有包容性,并且能夠真正為每個(gè)人所用?Jeff Dean說(shuō),Google已經(jīng)啟動(dòng)了People + AI Research (PAIR) 計(jì)劃,這個(gè)計(jì)劃旨在將 Google 的研究人員聚集在一起,研究并重新設(shè)計(jì)人與人工智能系統(tǒng)交互的方式。Facets 正是此計(jì)劃所孕育出的一種工具,能夠 將用于機(jī)器學(xué)習(xí)的訓(xùn)練數(shù)據(jù)可視化。
除此之外,Google還與Geena Davis 研究所合作建立了GD-IQ,可以利用機(jī)器學(xué)習(xí)檢測(cè)電影中性別偏見(jiàn)的工具。
評(píng)論
查看更多