谷歌I/O大會終于來了。今天的大會上,谷歌有三個值得業(yè)界關(guān)注的新產(chǎn)品發(fā)布:TPU3.0、能讓機器人打電話的Google Duplex和Android P。今年谷歌I/O大會,全場都在談AI,谷歌的AI First戰(zhàn)略已經(jīng)深入到每個產(chǎn)品中。
跟去年一樣,7000人來到了谷歌I/O開發(fā)者大會現(xiàn)場。
Pichai上場。
Pichai先是講了谷歌“核心”產(chǎn)品中最大的問題:emoji中的偷工減料問題,比如,漢堡和啤酒表情。
最后它們解決了這兩個讓人不爽的問題。Pichai只是開玩笑,其實在技術(shù)大爆炸的時代,谷歌有更多責(zé)任去減少數(shù)字鴻溝、承擔(dān)更多社會責(zé)任,而AI提供了一種解決社會問題的途徑。
Pichai舉了三個AI應(yīng)用到現(xiàn)實社會中的例子。
第一個例子:AI應(yīng)用于醫(yī)療。
使用深度學(xué)習(xí)分析視網(wǎng)膜圖像,以此預(yù)測心血管疾病突發(fā)的風(fēng)險。
谷歌通過在來自284335名患者數(shù)據(jù)上訓(xùn)練的深度學(xué)習(xí)算法,能夠從12026名和999名患者的兩個獨立數(shù)據(jù)集中患者的視網(wǎng)膜圖像,以驚人的高準確度預(yù)測病人的心血管疾病風(fēng)險因子。例如,算法通過視網(wǎng)膜圖像區(qū)分吸煙者與不吸煙者的準確率有71%。
左圖:眼球背部圖像顯示斑疹(中間的黑點),視盤(右側(cè)亮點)和血管(右側(cè)亮點旁的深紅線)。右圖:視網(wǎng)膜圖像呈灰色,使用了深度學(xué)習(xí)算法的像素可以預(yù)測血壓(綠色陰影高亮顯示)。我們發(fā)現(xiàn)每個心血管風(fēng)險因子預(yù)測使用不同模式,例如血管用于血壓,視盤用于其他預(yù)測。
在Pichai演講的同時,Google AI也公布了谷歌與斯坦福大學(xué)醫(yī)學(xué)院等合作的研究成果“用于電子健康記錄的可擴展、準確的深度學(xué)習(xí)”。
圖:病人記錄中的數(shù)據(jù)以時間線的形式表示。
研究人員設(shè)計了一個計算機系統(tǒng)來進行預(yù)測,而無需為每項任務(wù)手動制作新的數(shù)據(jù)集,并且可以采用可擴展的方式。但構(gòu)建數(shù)據(jù)只是工作的一部分; 預(yù)測還需要準確。
評估準確性的最常見方法是接收者操作特征曲線(ROC曲線),該曲線衡量模型如何區(qū)分具有特定未來結(jié)果的患者與不具有特定未來結(jié)果的患者之間的區(qū)別。在這個度量標(biāo)準中,1.00表示完美,0.50表示不比隨機結(jié)果好,因此數(shù)字越高意味著模型越準確。谷歌報告的模型預(yù)測患者是否會住院的得分為0.86(傳統(tǒng)邏輯回歸方法得分為0.76); 在預(yù)測住院死亡率方面得分為0.95(傳統(tǒng)方法為0.86),在預(yù)測出院后意外再住院率方面得分為0.77(傳統(tǒng)方法為0.70)。
這些模型也被用來評估患者接受治療的條件。例如,如果醫(yī)生為患有高溫,發(fā)熱和咳嗽的患者開具頭孢曲松和強力霉素,則該模型可以將這些標(biāo)識為患者正在接受肺炎治療的信號。
該研究的一個重點是深度學(xué)習(xí)模型的可解釋性。
圖:在患者入院后24小時使用深度學(xué)習(xí)模型進行預(yù)測。
這對患者和臨床醫(yī)生意味著什么呢?機器學(xué)習(xí)可用于改善醫(yī)療,這項工作是一個開始。
Pichai說,AI可以影響的最大的領(lǐng)域是醫(yī)療。
第二個例子:聲畫分離。
當(dāng)人們在電視上互相交談時,字幕就會很糟糕。谷歌試圖用AI解決問題。
谷歌用一種深度學(xué)習(xí)音頻-視覺模型,用于將單個語音信號與背景噪聲、其他人聲等混合聲音分離開。例如,AI可以通過YouTube幫助谷歌識別誰在說話,即使是在一場爭吵比賽中,自動生成字幕。
Pichai說,辯論很好,大喊大叫不好。我希望谷歌能解決人們在電視上互相吼叫的問題。
第三個例子:Gboard。
Pichai介紹了谷歌的輸入法Gboard的功能:添加了摩爾斯電碼。
谷歌展示了開發(fā)者Tania Finlayson的視頻。由于疾病,Tania Finlayson無法通過自然聲音與其他人交流。視頻中,Tania Finlayson通過摩爾斯電碼發(fā)出了聲音。
通過頭戴的定制設(shè)備,可以分析她的頭部的動作并將其轉(zhuǎn)碼為摩爾斯電碼。當(dāng)她觸發(fā)左鍵時,該設(shè)備會添加一個短信號,而右鍵則會觸發(fā)一個長信號。接著,設(shè)備將文本轉(zhuǎn)換為語音。
谷歌的Gboard用兩個區(qū)域代表短信號和長信號。鍵盤上方有多個單詞建議,就像普通鍵盤上的一樣。目前,Gboard已經(jīng)在iOS和Android上提供測試版。Tania也來到了I/O大會現(xiàn)場,受到了大家的熱烈歡迎。
谷歌一直在用AI帶來改變。
比如Gmail的新功能,這個功能被稱為智能組合。
簡而言之就是在你輸入文字后,谷歌使用機器學(xué)習(xí)推薦你可能輸入的短語。你所要做的就是按Tab鍵。
Pichai說,它負責(zé)處理日常事務(wù),比如地址?!埃ㄊ褂昧诵鹿δ芎螅┪医o公司發(fā)了更多的郵件。”
本月晚些時候,所有Gmail用戶都將使用智能組合。
接下來是Google Photo。Pichai說,在谷歌的照片中,每天都有超過50億張照片被觀看。它也融入AI技術(shù),比如自動修正亮度。
同時,在谷歌照片中,名為Smart Actions的新智能功能將會識別照片中的人物,比如照片中如果有Lisa,可以把其中關(guān)于Lisa的照片發(fā)給她。
另外,如果照片曝光不足,在谷歌照片中的人工智能將提供一個建議來修復(fù)亮度。谷歌照片可以使用人工智能將照片中的主體分離出來,并在顏色上重新創(chuàng)建一個灰度照片。
并且能夠?qū)εf照片著色,這是一個非常有趣的圖像識別應(yīng)用(國內(nèi)騰訊AI Lab也做過類似的技術(shù))。
最后是文檔轉(zhuǎn)換功能,Google Photo能識別文檔并將其轉(zhuǎn)換為PDF。這對工作人士非常有幫助。
第一個重磅產(chǎn)品:TPU 3.0,性能是TPU2.0的八倍
接下來,Pichai講到了重磅部分——TPU 3.0。
Pichai說,3.0的能力是去年芯片的8倍,性能達到100 petaflops?!斑@些芯片如此強大,以至于我們第一次不得不在我們的數(shù)據(jù)中心用上了冷卻液?!?/p>
作個比較,一個包含16個英偉達最新版GPU的芯片組能夠提供的計算能力是2 petaflops。
TPU(張量處理器)是谷歌為機器學(xué)習(xí)定制的專用芯片,專為谷歌的深度學(xué)習(xí)框架TensorFlow而設(shè)計。
谷歌在2016年的I/O大會上首次公布TPU。不過在此之前 TPU已在 Google 內(nèi)部的一些項目中使用了一年多,如 Google 街景服務(wù)、 DeepMind的AlphaGo 等都用到了 TPU。
在去年的I/O大會上,谷歌發(fā)布了第二代TPU。第二代 TPU 設(shè)備單個的性能就能提供高達 180 teraflops 的浮點運算能力。不僅如此,谷歌還將這些升級版的 TPU 集成在一起成為 Cloud TPU。每個 TPU 都包含了一個定制的高速網(wǎng)絡(luò),構(gòu)成了一個谷歌稱之為 “TPU pod” 的機器學(xué)習(xí)超級計算機。一個 TPU pod 包含 64 個第二代 TPU,最高可提供多達 11.5 petaflops。
Pichai說,谷歌公司第一次不得不在其數(shù)據(jù)中心采用液體冷卻——液體冷卻通常用于高性能計算芯片或PC中的一些性能導(dǎo)向的芯片。
值得一提的是,在隨后Waymo CEO上臺介紹谷歌自動駕駛取得的新進展時,特別強調(diào)Waymo自動駕駛系統(tǒng)使用TPU,將性能提高了15倍!
幾乎所有大公司都在開發(fā)自己的AI定制芯片,這一領(lǐng)域競爭激烈。Facebook的硬件針對其Caffe2框架進行了優(yōu)化,該框架旨在處理其對用戶的大量信息圖。亞馬遜試圖通過AWS構(gòu)建云基礎(chǔ)架構(gòu)的生態(tài)系統(tǒng)。微軟則押注比定制芯片更靈活的FPGA,在昨天BUILD大會上公布Project Brainwave,其性能可與定制芯片相媲美,并且實時 AI 能力延遲相比TPU低 5 倍。
Google Duplex:完美與人類溝通,讓機器人為你打Call
接下來應(yīng)該是本次大會的明星產(chǎn)品——Google Assistant。
Google Assistant用到了DeepMind的WaveNet技術(shù),并且能夠模擬6個人的聲音,而且這六個人的聲音聽起來相當(dāng)自然。每個人的聲音都有完全不同的效果。
其中還包括歌手John legend的聲音。
Google Assistant的更詳細的功能交給負責(zé)人Scott Huffman介紹??偨Y(jié)有四大亮點:
連續(xù)對話
以前喚醒Google Assistant每次都要說“Hey Google”或“OK Google”等熱門詞匯,現(xiàn)在可以進行更自然的談話,而無需在每次帶助手的句子后觸發(fā)命令,并且還可以區(qū)分何時與其通話或與其他人交談。Scott Huffman介紹,這個功能將在“未來幾周”推出。
多個操作
Google的虛擬助理可以在同一個語音命令中執(zhí)行同時操作,使用協(xié)調(diào)減少功能即使使用更長的命令也能準確找出用戶的含義。例如,用戶可以要求它設(shè)置提醒并在一條語音消息中播放。
Pretty Please有點像亞馬遜對最近推出的Echo Dot兒童版一樣,谷歌助理添加了一些技巧,為用戶(特別是孩子)提供了積極的支持。
當(dāng)孩子們與助理通過禮貌的詞語(如Please和Thank You)交談時,助理會表揚孩子有禮貌,并且還提供免費的適合家庭的內(nèi)容,包括Google合作伙伴(如迪士尼)的游戲、活動和故事。
Google Duplex
今晚最大的亮點之一就是Google Duplex。
它不僅能夠像一般的助理一樣安排日程,更重要的是能夠以極為類似人聲的角色為你操作接下來的行動!
左邊是機器人,右邊是真人
Pichai演示了為發(fā)型設(shè)計師助理安排預(yù)約餐廳的案例,在視頻中,谷歌助理記錄下了需求,并真!的!給餐廳打!電!話!了!
Pichai說,機器人打電話的過程是實時的,不是表演的。而餐廳服務(wù)員與這個機器人交流完全沒有障礙。
這個功能將來會上線。
智能化的Android P
第三個是重要部分是Android P。
Android P有三大特性智能、簡潔、Digital wellbeing,其中第一個也是最重要的一個是智能。
智能體現(xiàn)在以下幾個方面:
智能適應(yīng)電池功能。谷歌與DeepMind合作開發(fā)了一項名為“自適應(yīng)電池”的新功能,利用AI來檢查用戶如何使用手機,并尋找方法來減緩耗電。
具體來說,該功能使用AI來預(yù)測用戶接下來會使用那些App,以及那些App只會偶爾被打開一下。Android P將不經(jīng)常使用APP會進入睡眠狀態(tài)。谷歌表示,這能讓App的喚醒次數(shù)平均減少30%,得以延長手機的電池續(xù)航時間。
智能亮度調(diào)節(jié)。Android P還通過“自適應(yīng)亮度”的功能來節(jié)省電池壽命。該功能可以根據(jù)用戶的使用習(xí)慣來控制手機屏幕的亮度。例如,如果是白天,手機會自動降低屏幕亮度以節(jié)省電量。
自適應(yīng)電池和自適應(yīng)亮度兩項功能都由DeepMind與谷歌Android團隊合作開發(fā)。
智能識別用戶活動。將最常用或即將使用的應(yīng)用提前,為用戶智能推薦應(yīng)用。
Slices。在Google搜索中輸入相關(guān)詞匯,如果涉及到手機上的應(yīng)用,就會出現(xiàn)該應(yīng)用的相關(guān)功能。比如輸入Lyft,就會在搜索結(jié)果中看到一個應(yīng)用程序slice,用戶可以直接從該頁面使用應(yīng)用功能(類似搜索里的直達號?)
MLKit API接口。第三方App也能即時使用AI模板。
其他產(chǎn)品:地圖、媒體、自動駕駛等全部AI化
I/O大會,其實是全面展示Google產(chǎn)品的大會,包括地圖、媒體、自動駕駛(Waymo)等。
比如說Google News。
在News首頁,谷歌為提供的五個Top新聞,這是全球頭條新聞、本地新聞和你一直關(guān)注的新聞的最新動態(tài)。
然后,你可以切換到標(biāo)題,看世界各地的頭條新聞。這里的附加部分讓你深入到不同的主題,如體育、商業(yè)或技術(shù)。
谷歌推出了一種新的視覺形式叫newscast,它使用自然語言理解提供一個單一主題的文章、視頻和引用。這可以讓你在短時間內(nèi)通過瀏覽不同的源來獲得一個事件的基本信息,這樣你就可以決定是否要進繼續(xù)看一個新聞。
如果你想深入到一個特定的話題,谷歌新聞的“Full Coverage”功能可以讓你看到一個新聞是如何從不同的地方和多種形式出現(xiàn)的,如社會評論、地方新聞來源、和頂級出版商的報道。谷歌新聞將收集如何實時地討論和發(fā)布新聞,并將它們聚集在一個地方。
自動駕駛方面,Waymo的CEO也上臺演講,現(xiàn)在,Waymo是世界唯一一個有在公共道路上路的Fully Selfdriving Car的公司,已經(jīng)有超過600萬英里的行駛記錄。
前文提到,Waymo自動駕駛系統(tǒng)使用TPU,將性能提高了15倍,而使用深度學(xué)習(xí)也讓W(xué)aymo自動駕駛有了對比:(上圖是使用前,下圖是使用后)
至此,谷歌2018I/O大會到此結(jié)束,你覺得哪項產(chǎn)品能改變未來?
-
谷歌
+關(guān)注
關(guān)注
27文章
6178瀏覽量
105697 -
AI
+關(guān)注
關(guān)注
87文章
31316瀏覽量
269659
原文標(biāo)題:谷歌TPU 3.0重磅發(fā)布;I/O大會上機器人真的能打Call!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論