Google 稍早在日本東京總部舉辦 AI Day,與來自日、韓、中等11個國家、將近60家媒體,說明有關 Google 發(fā)展 AI 的三個方向,強調(diào) AI 主要在幫助人類解決日常所需,并非用來取代人類。而對所有領域來說,AI 跟機器學習雖然有很大的進展,但一切都只是剛起步而已,唯有人工智能進入人類生活,才能抓住它改善全人類生活的潛力與機會。
Google 發(fā)展人工智能已經(jīng)長達15年,不過近期來說,全球人工智能真正開始積極推展的,主要還是 AlphaGo 在韓國對上李世石一役,因為圍棋擁有驚人的10 的170 次方種可能的棋盤布局,相較于1997 年打敗棋王Gary Kasparov 的西洋棋程式 DeepBlue,可謂大幅度進展。
首度抵日的 Google 研究團隊資深研究員 Jeff Dean 在這次的大會中揭示 Google 發(fā)展 AI 的三個方向,分別為「貼近人類需求的Google 產(chǎn)品」、「持續(xù)打造創(chuàng)新的服務跟應用」,以及「研究出可解決人類難題的工具」。
Google 研究團隊資深研究員 Jeff Dean。
方向一:持續(xù)打造創(chuàng)新的服務跟應用
大家都知道,Google CEO Sundar Pichai 在 Google I/O 期間,曾明確揭示 Google 公司的下個十年將會從 Mobile-First 朝向以 AI-First 為核心發(fā)展。事實上,像是Android、Chrome、Google Search、Google Play、Gmail、Google Maps、YouTube 等 7 個導入人工智能的產(chǎn)品,目前已經(jīng)有超過 10 億用戶。
Jeff Dean 在現(xiàn)場展示了透過機器學習怎么樣學習貓、狗、汽車、蘋果、花等影像,然后最后辨識出貓。現(xiàn)在透過 Goolge Lens 可以辨識獅子、聲音語調(diào)、文字內(nèi)容,甚至照片,好比說你給他一張火車的照片,系統(tǒng)已經(jīng)可以清楚辨識,并告訴你這是一輛藍、黃相間車身的火車,目的地是往哪里。
除此之外, Google Lens 還可以輕易辨識地點、路邊書本的名字、圖片上的地圖、拍攝美術(shù)館,還可以進一步了解美術(shù)館正在展覽的內(nèi)容,而導入機器學習的 Gmail 現(xiàn)在可以成功阻擋 99.9% 的垃圾郵件;最新推出的 Google Home 可支援多達 6 個人的語音配對。
其他還有像是 Google Play Music 透過導入 AI 技術(shù),能理解用戶喜歡的音樂、然后提供相對應的個性推薦。如果是美國部分城市用戶,使用 Google Maps 還有「停車預測」功能,其背后更集合了群眾回饋以及機器學習技術(shù),建構(gòu)了一套系統(tǒng)來幫助使用者預測停車位。至于大家?guī)缀趺刻焓褂玫?YouTube 平臺,透過機器學習為YouTube 自動上了超過十億支影片,讓全球三億以上的失聰或聽障朋友也能了解影片內(nèi)容。 Google 翻譯透過神經(jīng)機器翻譯系統(tǒng) (Neural Machine Traslation, NMT),也有效提升翻譯的品質(zhì),目前已可支援近 97 種語言跟英文的互譯,其中包括許多亞太地區(qū)的語言...等等。
Google Maps 在美國 25 個城市提供停車廠建議功能。
透過 Google Lens 可以在拍下照片之后,確實了解身邊的事物,或者快速翻譯不熟悉的語言。
透過導入機器學習,現(xiàn)在 Gmail 與 Inbox 已經(jīng)能夠 12% 辨識信件內(nèi)容,并給予回覆建議。
方向二:貼近人類需求的產(chǎn)品
除了軟件之外,這兩年積極搶攻硬件市場的 Google,同樣透過 AI 進行產(chǎn)品軟硬件整合。負責 Google Pixel 相機開發(fā)的產(chǎn)品經(jīng)理 Isaac Reynolds 表示,透過 Googe Home,家中的所有人(最多同時6 人)都跟機器對話,而機器可以快速回應各種不同需求,好比說請它設定房間的鬧鐘、問它義大利的時間、要它開啟客廳的電視并播放 Netflix 等等,而且可以清楚辨識每個人的聲音,這是深度學習的一環(huán),Google 已經(jīng)導入超過 1000 個不同的房間位置的聲音模組,現(xiàn)在透過機器學習機制,它能了解每個人的聲音、回應每個人的需求,后續(xù)推出的 Google Home Max 是高階的音箱,提供跟Google Home 一樣的功能,并且更能夠理解人們的所在地點。
Google HOME 的實際應用很廣,可在居家辨別6 個不同的家族成員的聲音,并給予即時回應,包括可以在電視還未開啟的前提下,使用「幫我在電視里秀出我養(yǎng)的狗狗的照片」的指令。
至于 Google Pixel 的人像模式,同樣也是導入機器學習技術(shù),借由認識環(huán)境,以及誰是主體,借此模擬出景深效果。至于 Pixel 2 人像模式又更進階,除了上述的學習機制,透過兩個不同的 Photodiode,在一個非常小的單鏡頭當中,可以認識環(huán)境做出深度地圖,有效區(qū)別出人像與背景,接著將「劃分遮罩」和「深度圖」組合成一張優(yōu)化過的深度圖,然后根據(jù)估計的距離決定背景模糊的程度,兩者互相結(jié)合起來,做出更自然的人像模式。
Google Pixel 相機開發(fā)產(chǎn)品經(jīng)理 Isaac Reynolds。
方向三:研究出可解決人類難題的工具
首先談到自然語言學習,Google 人工智慧研究總監(jiān) Linne Ha 分享一位名為 Arm 的故事,一名泰國工人透過跟機器對話,轉(zhuǎn)換成文字之后,成功找到失散多年的家人。目前全球有超過6000 種語言,當中的4000 種語言人口只有100 萬人,如果能夠透過機器學習的技術(shù),讓每個能夠上線的人們都能用自己的語言與其他人交流,將可望創(chuàng)造更多類似Arm 的故事。
Google 人工智慧研究總監(jiān) Linne Ha。
除了自然語言,最近這幾年相當火紅的語音助理當中,Google Assistant 應該是近年來最具有人工智慧色彩的語音助理。 Google Assistant 工程技術(shù)總監(jiān)Pra Gupta 表示,一年前推出的 Google Assistant,現(xiàn)在已經(jīng)在搜尋、Google Maps、Android Wear、Android TV、Google Home 等服務當中都有她的影子,透過Google Assistant 用戶可以輕易地控制家電、操作App,而且不用遙控器就可以讓電視透過聲控的方式啟動、選擇影片等等。
Pra Gupta 指出,Google Assistant 還在成長當中,目前支援英文、德文、韓文、西班牙文、法文、義大利文、日文、葡萄牙文,現(xiàn)在希望能為更多的裝置提供 Assistant 服務。
Google Assistant 工程技術(shù)總監(jiān) Pra Gupta。
而事實上除了Google Assistant,Google 云端平臺開發(fā)顧問 Kaz Sato 表示,Google 發(fā)展云端應用超過18 年,現(xiàn)在也已經(jīng)全面導入 AI 技術(shù),現(xiàn)在已經(jīng)可以有效地處理旗下與第三方合作廠商各項服務的后端處理,這包括影像分析、數(shù)據(jù)管理等等,有效提升企業(yè)運作效率。
除了 Google 內(nèi)部,這次也有第三方合作廠商導入 AI 技術(shù)。像是創(chuàng)立于 1919 年的兒童食品公司 Kewpie,在日本因為當?shù)匦枨螅枰铀偕a(chǎn)才能因應市場變化,因此該公司最后選擇導入 AI 技術(shù)。
正所謂「好的產(chǎn)品從好的想法開始」,AI 提供許多很好的建議,好比說透過AI 來協(xié)助檢驗哪些馬鈴薯是適合嬰兒食用,快速篩檢哪些條件的馬鈴薯是不適合食用的,初期食品廠在 2 個月內(nèi)提供 AI 超過100 萬顆馬鈴薯給它辨識,像是有些馬鈴薯已經(jīng)變色了、代表不安全,借此減少人工檢測上的負擔,現(xiàn)在生產(chǎn)線已經(jīng)突破以往的生產(chǎn)效率。這是我們與 Google 合作的一個重大突破。
兒童食品公司Kewpie 導入 AI 技術(shù),透過機器學習的方式協(xié)助機器每天過濾上萬顆馬鈴薯顆粒,協(xié)助控管兒童食品安全。
談到機器學習,Google 研究團隊產(chǎn)品經(jīng)理、醫(yī)學博士彭浩怡(Lily Peng)再次說明了Google 與印度當?shù)蒯t(yī)療機構(gòu)的合作,以及透過機器學習能夠快速篩檢出糖尿病視網(wǎng)膜病變,借此知道哪些人是高風險的糖尿病患者。
Google 研究團隊產(chǎn)品經(jīng)理、醫(yī)學博士彭浩怡(Lily Peng)分享 Google 怎么與第三方醫(yī)療機構(gòu)協(xié)助貧苦人家進行診斷醫(yī)療。
人工智能應用也能應用在生態(tài)環(huán)境保護方面,新西蘭威靈頓維多利亞大學博士Victor Anton 分享他在威靈頓,透過多的設置錄音裝置(如黃色的點),錄制超過 15,000 小時的聲音資料,接著搭配機器學習的方式,然后整理資料、訓練Tebsorflow、測試、分辨,讓機器可以明確分析出哪些鳥在什么時候在哪些地方。
新西蘭威靈頓維多利亞大學博士 Victor Anton 分享他在威靈頓,透過多的設置錄音裝置(如黃色的點),搭配機器學習的方式,分析鳥類習性。
舉例來說,透過不斷的測試,團隊已經(jīng)可以清楚了解 Kakariki、hihi 兩種不同的鳥叫聲,下一步,只要透過手機,就可以確認附近會有哪一種鳥。
Victor Anton 表示,目前團隊已經(jīng)訓練三種鳥類模組,透過搜集影像跟相關資料了解動物行為,包括他們遷徙的狀況、獵食與被獵食的狀況,對于政府與保育團體來說,這類型的研究可說已經(jīng)解決生態(tài)保育當中最大的難題,實際上當?shù)卣膊粩嗤高^提供資源跟技術(shù),應用在生態(tài)保育。
不過畢竟導致鳥不在某個棲息地的變因很多,這包括鳥的棲息地、移動的位置,透過機器學習還沒有辦法一次性的解決所有人類對于動物生態(tài)的問題,目前還是需要透過專業(yè)研究、以實驗的方式搭配足夠量的數(shù)據(jù),不過目前這些數(shù)據(jù)還未公開,主要的原因是整個研究還未結(jié)束,透過參數(shù)的調(diào)整,研究出一個模組之后,才會分享給更多保育團體參考。
Google 發(fā)展 AI 的下一步
談到下一步,Google 這次談得相當深入,包括建構(gòu)出更普及的機器學習(Accessibility of building ML)訓練模組,這包括在教育領域幫助更多人建構(gòu)自己的機器學習模型,內(nèi)部也將持續(xù)透過機器學習速成課程,訓練更多Googler。外部將擴大影響范圍,募集更多學生與科學家參與培訓計畫,預計 2018 年初會把這個免費的線上課程開放給所有使用者。
Jeff Dean 也談到 SketchRNN 跟 Auto Mechine Learning,前者讓使用者和神經(jīng)網(wǎng)路一起合作畫畫。使用者僅需畫一朵花就能讓系統(tǒng)自動完成畫作。后者透過建立一組作為控制組網(wǎng)路 (controller network) 的神經(jīng)網(wǎng)路能夠推導出上千個子模型架構(gòu) (“child” model architecture),以找出執(zhí)行效率最好的一個子模型架構(gòu)。
而在未來,Google 希望能有效提升機器學習技術(shù)的精準與正確性,目前也開放讓公民大眾參與研究,為 TensorFlow 提供足夠的訓練資料并驗證分類的正確性。
再者透過遠端感測可以讓科學家更輕易的獲得大量數(shù)據(jù)資料,未來希望透過建立人工智慧開源的方式,讓生物學家可以利用機器學習歸納大量數(shù)據(jù),其他時間就可以省下來做后續(xù)的結(jié)果判讀和歸納,進而更有效的保育鳥類。
相較于微軟亞洲研究院院長洪小文在 AI Day 當中宣布微軟投入 AI 領域的六大承諾、三大研發(fā)面向、以及十二項產(chǎn)業(yè)應用情境,Google 研究團隊資深研究員Jeff Dean 在這次的大會中揭示 Google 發(fā)展 AI 的三個方向,兩者其實都是殊途同歸,同樣著重攜手開發(fā)者導入自家人工智慧研究,不過微軟看起來比較朝向商務合作領域發(fā)展,而 Google 則是著重人本應用,從行動面下手。
Jeff Dean 表示,在理想的人工智能之前,我們相信一切只是開端,并相信唯有讓人工智能進入每個人的生活,才能發(fā)現(xiàn)與抓住它改善全人類生活的潛力和機會。
-
谷歌
+關注
關注
27文章
6172瀏覽量
105519 -
AI
+關注
關注
87文章
31054瀏覽量
269407
原文標題:Google 公開 AI 發(fā)展三大方向,直言一切才剛剛開始
文章出處:【微信號:gh_211d74f707ff,微信公眾號:重慶人工智能】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論