在 Google I/O 2019 上,除了面向消費(fèi)者的功能改進(jìn)和開發(fā)者的工具革新,Google 將大會(huì)的一個(gè)重點(diǎn)也放在了如何用 AI 解決人類面臨的棘手難題上。
美國工程界的最高學(xué)術(shù)團(tuán)體美國國家工程院 (National Academy of Engineering) 于2008年發(fā)布了21世紀(jì)人類面臨的十四大工程挑戰(zhàn)[1]。而 Google 的科研領(lǐng)袖Jeff Dean 告訴硅星人,他所領(lǐng)導(dǎo)的 Google AI 正在著手解決這些挑戰(zhàn)。
如果這些挑戰(zhàn)背后的難題不得到一定程度的緩解,很可能意味著人類將無法健康地延續(xù)到22世紀(jì)。這些難題在世界各地有所體現(xiàn),也面向各行各業(yè),但是 Google AI 都在用自己擅長的手段去嘗試攻克它們(或者貢獻(xiàn)一份力量)。
NAE 一共列出14條工程挑戰(zhàn),標(biāo)紅的是 Google AI 正在參與解決的 圖/Jeff Dean
毫無疑問,Google AI 擅長的,正是深度學(xué)習(xí)。
為什么深度學(xué)習(xí)可以用于解決能源、交通、診斷、醫(yī)藥、安全等等諸多方面的問題,成為泛用的科學(xué)探索工具?
Jeff Dean 認(rèn)為,這是因?yàn)樯疃葘W(xué)習(xí)可以從原始、異構(gòu)、攜帶噪音的數(shù)據(jù)開始學(xué)習(xí),即便開發(fā)者不具備特別領(lǐng)域知識(shí),也可以開發(fā)出達(dá)到甚至超過領(lǐng)域內(nèi)最高水平的神經(jīng)網(wǎng)絡(luò)。
而且,機(jī)器學(xué)習(xí)技術(shù)日新月異,現(xiàn)在每天發(fā)到 ArXiv 上的論文就有90篇;深度學(xué)習(xí)的技巧也層出不窮,使得神經(jīng)網(wǎng)絡(luò)能夠掌握越來越多過去公認(rèn)只有人類才能掌握的復(fù)雜能力。
現(xiàn)在,人類不得不應(yīng)對(duì)重大的工程挑戰(zhàn),并尋求在本世紀(jì)內(nèi)解決他們。Jeff Dean 認(rèn)為,深度學(xué)習(xí)可以成為很好的工具。
1維護(hù)和改進(jìn)城市基礎(chǔ)設(shè)施
Restore & Improve Urban Infrastructure
交通是城市基礎(chǔ)設(shè)施的重要部分,也是隨著人口增長和城市化加劇面臨壓力最大的領(lǐng)域之一。社會(huì)在變化,而道路通常是一成不變的。因此,交通在21世紀(jì)工程難題里尤為顯著。
Google 采取的切入角度是提高道路交通安全和效率,而除了開車放下手機(jī)之外,最有效的方法可能就是自動(dòng)駕駛。
Waymo 自動(dòng)駕駛汽車從研發(fā)到今天已經(jīng)將近10年,截至去年已經(jīng)累計(jì)行駛800萬英里,并且在全球所有自動(dòng)駕駛試驗(yàn)者當(dāng)中取得了最低的事故率。
Jeff Dean 指出,深度學(xué)習(xí)是 Google/Waymo 取得這一成就的功臣,讓自動(dòng)駕駛系統(tǒng)可以整合并學(xué)習(xí)來自不同傳感器的原始數(shù)據(jù),繪制高精度地圖,“看懂”周圍的車輛、行人和障礙物都在哪里,甚至可以預(yù)測其他道路參與者的行進(jìn)方向,輔助自動(dòng)駕駛汽車做出決策。
他介紹,現(xiàn)在 Waymo 在亞利桑那州已經(jīng)有超過100輛測試自動(dòng)駕駛汽車,可以在沒有安全駕駛員的條件下載客前往目的地。許多業(yè)內(nèi)人士都認(rèn)為,理論上如動(dòng)駕駛汽車占一個(gè)地區(qū)總車輛的比例越高,地區(qū)的事故率越小、交通效率將越高。
除了自動(dòng)駕駛之外,機(jī)器學(xué)習(xí)也可以通過其它方式提高交通效率。比如在摩托車流行的東南亞國家和地區(qū),Google 在地圖導(dǎo)航加入了“兩輪模式”,讓系統(tǒng)能夠匯總多元的數(shù)據(jù)來源,為摩托車駕駛者推薦捷徑、小道,從而避免高峰擁堵。
2用深度學(xué)習(xí)帶來醫(yī)療信息革命
Advance Health Informatics
作為糖尿病的并發(fā)癥之一,糖尿病視網(wǎng)膜病變 (Diabetic Retinopathy, DR) 侵蝕著患者,一般患病10年才開始出現(xiàn)病變,導(dǎo)致失明。這一病癥實(shí)際上可預(yù)防,有經(jīng)驗(yàn)的眼科醫(yī)師往往能通過視網(wǎng)膜眼底掃描觀察到先兆。然而,以印度為例,全國存在大約 12 萬名眼科醫(yī)師的缺口,DR 患者往往無醫(yī)可投,導(dǎo)致大量人口失去視力。
Google AI(原 Google Research)的研究員莉莉·彭博士帶領(lǐng)團(tuán)隊(duì),基于卷積神經(jīng)網(wǎng)絡(luò)搭建,利用眼科專家標(biāo)記好的掃描圖作為訓(xùn)練數(shù)據(jù),最終得到了一個(gè) DR 預(yù)估模型。
此前,硅星人/PingWest品玩曾采訪報(bào)道過這項(xiàng)技術(shù)[2]。當(dāng)時(shí),該模型在發(fā)現(xiàn)癥狀的敏感度 (98.8) 和判斷癥狀的準(zhǔn)確性 (99.3) 上,都比人的得分要高(在統(tǒng)計(jì)學(xué)上這個(gè)得分叫做 F-score,普通眼科醫(yī)生的分?jǐn)?shù)是 0.91,模型 0.95)。
好消息是,Jeff Dean 告訴我們,經(jīng)過兩年的發(fā)展,現(xiàn)在新模型更進(jìn)一步,得分和專門的視網(wǎng)膜眼底醫(yī)師持平。
這還沒完,該項(xiàng)技術(shù)的潛力遠(yuǎn)不止診斷 DR。Jeff Dean 透露,莉莉·彭的團(tuán)隊(duì)在這個(gè)模型上取得了更卓越的科學(xué)成就。正是因?yàn)樯疃葘W(xué)習(xí)的泛用型強(qiáng),現(xiàn)在他們可以用同樣的眼底掃描圖像,來預(yù)測性別、年齡、血壓、骨齡以及其他病癥的發(fā)病幾率,并且準(zhǔn)確度極高。
這在醫(yī)療信息學(xué)上是重大的突破,因?yàn)樗軌蜓a(bǔ)充因?yàn)獒t(yī)療條件限制未能獲取的關(guān)鍵信息。最短期和直接的效果就是為眼科醫(yī)生的診斷和治療推薦提供更多可參考的數(shù)據(jù),長期來看還能提前預(yù)測和診斷更多病癥(比如心血管疾病)。盡管這并非專業(yè)的診斷,但仍足以提前 5 年甚至 10 年,拯救現(xiàn)在的普通人,未來的患者。
3打造科學(xué)突破的工具:通用 AI
Engineer the tools for Scientific Discovery
以青霉素和X光為例,曾幾何時(shí)知名的科學(xué)突破都存在一定的偶然性。即便如此,人們也一直沒有停止試圖發(fā)現(xiàn)讓科學(xué)突破持續(xù)發(fā)生的“永動(dòng)機(jī)”。
Jeff Dean 指出,在更強(qiáng)大計(jì)算力的加持下,深度學(xué)習(xí)可以更方便地投入到更多領(lǐng)域當(dāng)中。因此,深度學(xué)習(xí)有成為這樣工具的潛力。因?yàn)檎缜笆觯疃葘W(xué)習(xí)的技巧層出不窮,讓神經(jīng)網(wǎng)絡(luò)掌握越來越多過去公認(rèn)只有人類才能掌握的復(fù)雜能力。
以 TensorFlow 為代表,這一由 Google 主導(dǎo)并開源的深度學(xué)習(xí)項(xiàng)目,現(xiàn)在正在被農(nóng)業(yè)種植養(yǎng)殖、工業(yè)生產(chǎn)、互聯(lián)網(wǎng)、醫(yī)療金融等多個(gè)行業(yè)使用,在三大產(chǎn)業(yè)中持續(xù)促成效率進(jìn)步。一個(gè)例子在歐洲的一座農(nóng)場,農(nóng)場主運(yùn)用了 TensorFlow 搭建養(yǎng)殖監(jiān)控技術(shù),通過攝像頭、動(dòng)作捕捉等傳感器時(shí)刻追蹤和分析牲畜的健康狀況和運(yùn)動(dòng)軌跡,顯著提高了出欄率。
至于科學(xué)突破,前述的視網(wǎng)膜眼底掃描也可以作為一個(gè)例子。
前年,Google 宣布了神經(jīng)架構(gòu)搜索 (NAS)/AutoML 技術(shù),可以比喻為“用神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)和訓(xùn)練神經(jīng)網(wǎng)絡(luò)”,在包括圖像識(shí)別在內(nèi)的一些領(lǐng)域超過了手調(diào)神經(jīng)網(wǎng)絡(luò)的效果。
但是現(xiàn)在,Google AI 已經(jīng)不滿足于已經(jīng)取得的成就。Jeff Dean 說,他們正在思考一種全新的神經(jīng)網(wǎng)絡(luò)形式:一個(gè)巨大的、稀疏激活的模型 (a large model, but sparsely activated)。
這種新的神經(jīng)網(wǎng)絡(luò),具備的參數(shù)之多,和現(xiàn)有神經(jīng)網(wǎng)絡(luò)相比可能是幾何級(jí)的。但是,當(dāng)它處理不同任務(wù)時(shí),只需要激活少數(shù)路徑上的節(jié)點(diǎn),并不需要全部激活。這樣設(shè)計(jì)的目的,是讓一個(gè)神經(jīng)網(wǎng)絡(luò)能夠執(zhí)行多種不同的任務(wù)——少則數(shù)百,多則上百萬種,以此顯著降低神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)、搭建和訓(xùn)練的計(jì)算量和耗時(shí),實(shí)現(xiàn)更強(qiáng)的通用性。
Jeff Dean 向硅星人表示,他所描繪的這個(gè)新神經(jīng)網(wǎng)絡(luò),確實(shí)和人們?cè)?jīng)熱議但認(rèn)為短期內(nèi)不會(huì)實(shí)現(xiàn)的“通用人工智能”(general AI) 些許相似。但是他強(qiáng)調(diào),Google AI 的主張是即便在這個(gè)新的巨大且稀疏激活的網(wǎng)絡(luò)內(nèi),訓(xùn)練仍然是自我監(jiān)督的。
2017年,他和幾位同事(包括 Geoff Hinton、Quoc Le等 Google AI 頂級(jí)學(xué)者)以及外部研究伙伴共同提交了這一方向的首篇論文,名為《Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer》,呈現(xiàn)了一個(gè)超過1370億參數(shù),擁有數(shù)千個(gè)子網(wǎng)絡(luò)的巨大神經(jīng)網(wǎng)絡(luò)架構(gòu),在語言建模、機(jī)器翻譯等場景下,用更少的計(jì)算量實(shí)現(xiàn)了對(duì)當(dāng)前最高水平神經(jīng)網(wǎng)絡(luò)的超越。[3]
Jeff Dean 展示了 Google AI 對(duì)于這一技術(shù)的未來構(gòu)想:除了優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)之外,Google 可能還將開發(fā)新的、面向該網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化的機(jī)器學(xué)習(xí)超級(jí)計(jì)算機(jī)(就像他們?yōu)?TensorFlow 設(shè)計(jì)了 TPU 那樣。)屆時(shí),新的計(jì)算范式將為 Google AI 解決21世紀(jì)偉大工程挑戰(zhàn)帶來更多幫助。
-
谷歌
+關(guān)注
關(guān)注
27文章
6179瀏覽量
105738 -
AI
+關(guān)注
關(guān)注
87文章
31338瀏覽量
269747
原文標(biāo)題:事關(guān)人類存亡的 14 大工程難題,要靠 AI 來搞定了
文章出處:【微信號(hào):smartman163,微信公眾號(hào):網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論