0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度解讀DeepMind 與谷歌的 AI拉鋸戰(zhàn)

mK5P_AItists ? 來源:YXQ ? 2019-03-22 17:50 ? 次閱讀

2010年8月的一個下午,在舊金山灣,一個34歲的倫敦人大步流星地走上舞臺。他深吸一口氣,放松緊繃的神經(jīng),露出一個蹩腳的微笑,開口講道:“今天,我要講述如何用一個完全不同的方法去構(gòu)建......” 空氣突然安靜,好像在等待著一個意欲改變世界的人吶喊出自己重大的野心——“ AGI ” Demis Hassabis說道。

AGI指通用型人工智能,是一種擁有與人類相同智力水平或甚至超過人類的理想化計算機(jī)程序。AGI能夠出色地完成離散型任務(wù),例如識別照片或翻譯語言等,這與我們手機(jī)和計算機(jī)中所見到過的人工智能(AI)本質(zhì)上是相同的。

但除此之外,它還會做加減運算、下棋、說法語;可以解物理論文、撰寫小說、制定投資策略、陌生人進(jìn)行愉快的交談;它甚至可以監(jiān)測核反應(yīng)、管理電網(wǎng)和交通流量,毫不費力地在各個領(lǐng)域獲得一個又一個的成就——AGI將使當(dāng)今最先進(jìn)的AI融合成一個袖珍計算器。

目前,人類是唯一擁有完成所有這些任務(wù)能力的智慧生物,但人類的智力受限于身體所能提供的能量;而AGI是在計算機(jī)上運行的,所以它不會受到這些限制,AGI的能力上限僅由處理器的數(shù)量決定。

AGI將從完成監(jiān)測核反應(yīng)任務(wù)開始,按照其一秒閱讀上萬篇物理論文的速度吸收知識,不久便可以具備發(fā)現(xiàn)新能源的能力,而這一速度是人類經(jīng)過千年進(jìn)化也比不上的。當(dāng)人類智能可以被計算機(jī)的速度和可擴(kuò)展性輔助,目前看似不可解決的問題將被輕松解決。

Hassabis曾向英國報紙《Observer》的記者描述,他希望AGI能夠掌握“癌癥、氣象、能源、基因組學(xué)、宏觀經(jīng)濟(jì)和金融系統(tǒng)”等學(xué)科知識。

Hassabis發(fā)言的這場大會被稱為奇點峰會。根據(jù)未來學(xué)家的說法,“奇點”指的是由于AGI出現(xiàn)引發(fā)的結(jié)果。由于AGI將以高速處理信息,很快它就將變得“聰明絕頂”。自我改善的快速循環(huán)將導(dǎo)致機(jī)器智能的“爆炸”,使人類窒息于“硅塵”之中。那么這個奇點將帶來烏托邦還是地獄?這已經(jīng)成為了一個宗教信仰一般的問題。

“如何建立人造思維”、 “ AI解決老齡化問題”、“取代我們的身體”、 “改變生與死的界限”……從會談的標(biāo)題來看,這場大會的與會者傾向于將人工智能視為救世主;相比之下,Hassabis的發(fā)言似乎沒有那么大的噱頭——“基于神經(jīng)科學(xué)的研究方法探究AGI架構(gòu)”。

Hassabis語速飛快,踱步于講臺和屏幕之間。他身著一件栗色套頭衫和一件白色系扣襯衫,像極了一個在校的大學(xué)生,但他瘦小的身材下卻蘊藏了極高的智慧和無限的力量。Hassabis解釋道:到目前為止,科學(xué)家已從兩個大方向上探索AGI。

一條支路可以稱為基于規(guī)則的人工智能。在這一支路上的研究人員試圖描述出一個可以像人類一樣思考的系統(tǒng)所需的所有規(guī)則,并通過編程加以實現(xiàn)。這種方法在20世紀(jì)80年代和90年代很流行,但沒有產(chǎn)生預(yù)期的結(jié)果。Hassabis認(rèn)為形成人類認(rèn)知的神經(jīng)結(jié)構(gòu)太過于精妙,根本無法以這種方式描述。

另一條支路的研究人員試圖數(shù)字化復(fù)現(xiàn)大腦的神經(jīng)網(wǎng)絡(luò)。這雖然有一定的道理,畢竟腦是人類智慧的所在;但Hassabis認(rèn)為這些研究人員的這一企圖就像想要繪制宇宙中的每一顆恒星,也走在了一個歪路上。更根本的問題是,這一研究方法就像試圖通過鑿開計算機(jī)檢查晶體管的相互作用來了解Microsoft Excel的工作原理,他們所關(guān)注的大腦加工水平是錯誤的。

Hassabis提出了一個中間立場:AGI應(yīng)該從大腦處理信息的宏觀方法中獲取靈感——而不是物理系統(tǒng)或它在特定情況下的應(yīng)用規(guī)則。換句話說,它應(yīng)該專注于理解大腦的軟件,而不是硬件。

現(xiàn)有如功能性磁共振成像(fMRI)這樣的新技術(shù),使得研究人員可以探究人類在特定活動下的大腦活動,說明這一方向具有一定的可行性。他告訴觀眾,最新的研究表明,大腦會在睡眠期間通過重播經(jīng)驗學(xué)習(xí)一般原則,研究人員應(yīng)該嘗試模仿這種系統(tǒng)構(gòu)造AI。

在演講幻燈片的右下角出現(xiàn)了一個圓形的藍(lán)色漩渦,緊貼的兩個單詞DeepMind赫然出現(xiàn)在Logo之下——這是該公司第一次正式出現(xiàn)在公開場合。

這次發(fā)言遠(yuǎn)遠(yuǎn)沒有看起來那么簡單,Hassabis為了這個邀請,努力了一年之久。他真正的目的是與硅谷億萬富翁彼得·泰爾(Peter Thiel)的一分鐘會面,而Thiel正是這場會議的贊助方——Hassabis想要Thiel的投資。

Thiel似乎比Hassabis本人對AGI更有熱情。在2009年奇點峰會的一次演講中,Thiel曾表示,他對未來最大的恐懼不是機(jī)器人起義(他在新西蘭內(nèi)陸地區(qū)擁有一個末日避難所,他其實比大多數(shù)人做好了充足的準(zhǔn)備)。相反,他擔(dān)心奇點來得太晚,世界更需要新技術(shù)來抵御經(jīng)濟(jì)衰退。

DeepMind最終總募資200萬英鎊,其中Thiel投資了140萬英鎊。當(dāng)Google以6億美元的價格在2014年1月收購該公司時,Thiel和其他早期投資者的投資收益率高達(dá)5,000%。

對于許多創(chuàng)始人來說,這是一個圓滿的結(jié)局。他們可能會放慢發(fā)展速度,甚至退后一步,花更多的時間和錢打交道。但對于Hassabis來說,谷歌的收購只是他建造AGI帝國的另一步進(jìn)展。2013年,他花了很多時間談判交易的條款,使DeepMind獨立于Google運營,DeepMind在不失去控股權(quán)的前提下獲得了Google提供的現(xiàn)金流和計算能力。

Hassabis認(rèn)為DeepMind將是一個混合體:它作為創(chuàng)業(yè)公司擁有強(qiáng)大的自我驅(qū)動力,又匯集了來自各大頂尖大學(xué)的聰明頭腦,同時擁有世界上最有價值公司之一的雄厚資金支持——這些因素都將加速AGI的到來,解決人類所面臨的難題。

01

有著中國血統(tǒng)的天才圍棋少年

Demis Hassabis于1976年出生于倫敦北部,是三個兄弟姐妹中最大的一個。父親是生活在塞浦路斯的希臘人,經(jīng)營著一家玩具店;母親是生活在新加坡的華人,在英國百貨公司約翰·劉易斯工作。

他從小便體現(xiàn)出驚人的才能——在他四歲時,旁觀了一場父親和叔叔的國際象棋比賽,從此迷上了國際象棋,沒過幾周他竟然在棋局上擊敗了許多成年人,等到他13歲時,他已在世界同齡棋手中位居第二。而且在他八歲時,他已經(jīng)可以在一臺計算機(jī)上實現(xiàn)自己的代碼,僅通過自學(xué)掌握了編程技術(shù)。

1992年,Hassabis比原計劃提前兩年完成了他的A-levels課程。他找到一份在Bullfrog Productions的電子游戲編程工作。Hassabis編寫了一個名為主題公園(Theme Park)的游戲,在這個游戲里,玩家可以設(shè)計并運營了一個虛擬游樂園,這個游戲的銷量高達(dá)1500萬份。之后這家公司優(yōu)化并開發(fā)了更大規(guī)模的虛擬城市游戲,Hassabis編寫的主題公園(Theme Park)成為這個大規(guī)模游戲的一部分。

除了編寫游戲外,他還很擅長玩游戲,比如國際象棋、拼字游戲、撲克和西洋雙陸棋。1995年,在劍橋大學(xué)學(xué)習(xí)計算機(jī)科學(xué)時,Hassabis多次在學(xué)生圍棋錦標(biāo)賽擊敗對手。圍棋比國際象棋要復(fù)雜得多,玩家只有通過長期訓(xùn)練才能獲得足夠多的經(jīng)驗進(jìn)而熟練制定游戲戰(zhàn)略。沒有人知道Hassabis以前是否玩過圍棋。

Hassabis很快稱霸了初學(xué)者的比賽,然后又擊敗了經(jīng)驗豐富的圍棋專業(yè)玩家,那位專業(yè)玩家對于自己敗給一名19歲的新手頗為震驚。劍橋圍棋大師Charles Matthews看了Hassabis的比賽后,決定開始培養(yǎng)他。

Hassabis一次又一次在圍棋比賽上展現(xiàn)他的天賦,漸漸地,他開始好奇計算機(jī)是否可以像人類一樣通過不斷積累的經(jīng)驗來學(xué)習(xí)。游戲提供了一個現(xiàn)實世界無法比擬的學(xué)習(xí)環(huán)境。游戲雖然是從現(xiàn)實世界中發(fā)展而來,但它們可以在沒有外界干擾的情況高效進(jìn)行。與現(xiàn)實世界相比,在游戲里,時間可以過得比現(xiàn)實生活中快很多:幾天內(nèi),玩家就能組建一個團(tuán)體,并在幾分鐘內(nèi)就能進(jìn)行戰(zhàn)斗。

1997年的夏天,Hassabis去日本旅游。那年5月,IBM的Deep Blue計算機(jī)擊敗了世界象棋冠軍Garry Kasparov。這是計算機(jī)第一次在國際象棋比賽中擊敗了一位大師。這場比賽引起了全世界的關(guān)注,同時還引發(fā)了人們對計算機(jī)不斷發(fā)展和潛在威脅的擔(dān)憂。

Hassabis遇到日本棋盤游戲大師Masahiko Fujuwarea,他談到了一個將戰(zhàn)略游戲和人工智能結(jié)合起來的想法:有一天他會建立一個計算機(jī)程序,這個程序會擊敗全世界最厲害的人類圍棋玩家。20歲的Hassabis認(rèn)為,他目前的能力還不足以支持他實現(xiàn)自己的夢想,但他心中已經(jīng)有了一個藍(lán)圖。

1998年,他創(chuàng)辦了一個名為Elixir的游戲工作室。Hassabis專注于開發(fā)一個名為共和國革命(Republic: The Revolution)的政治模擬游戲。當(dāng)Hassabis還在上學(xué)時,他告訴他的朋友Mustafa Suleyman,這個世界需要一個能模擬復(fù)雜的社會動態(tài)并解決棘手社會問題的模型?,F(xiàn)在,他嘗試在游戲中這樣做。

事實證明,這很難。Elixir最終發(fā)布了這款游戲的精簡版,但這款游戲沒有火起來。其他類似的游戲也相繼失敗(比如一個名為Evil Genius的邦德惡棍模擬器)。2005年4月,Hassabis關(guān)閉了Elixir。Matthews認(rèn)為,Hassabis創(chuàng)立公司只是為了獲得管理經(jīng)驗?,F(xiàn)在,在Hassabis開始尋求AGI之前,他還不夠了解一個至關(guān)重要的領(lǐng)域——人類的大腦。

2005年,Hassabis在倫敦大學(xué)學(xué)院(UCL)獲得神經(jīng)科學(xué)博士學(xué)位。他在博士期間進(jìn)行了記憶和想象力方面的研究。一篇被引用超過1000次的論文表明,健忘癥患者很難進(jìn)行想象,這表明記憶和創(chuàng)造心理圖像之間存在聯(lián)系。為了解決AGI,Hassabis正在嘗試?yán)斫獯竽X。他的大部分工作最后都回到了一個問題:人類大腦是如何獲得并記住概念和知識?

Hassabis于2010年11月15日正式成立了DeepMind。該公司的使命宣言與現(xiàn)在一樣—— “解決智能(solve intelligence)”,然后用它來解決其他問題。正如Hassabis告訴Singularity Summit的參會者,這意味著讓計算機(jī)像人類大腦一樣理解并執(zhí)行任務(wù)。

Hassabis并不覺得科學(xué)已經(jīng)完全了解人類的思想。他認(rèn)為不能簡單地從數(shù)百項神經(jīng)科學(xué)研究中提出AGI藍(lán)圖。他自信地認(rèn)為以他現(xiàn)在的水平足夠支撐他進(jìn)行AGI的研究。然而,事實并非如此。我們對大腦的實際運作方式仍然知之甚少。2018年,一群澳大利亞研究人員對Hassabis的博士論文研究結(jié)果提出質(zhì)疑。他們認(rèn)為文章的統(tǒng)計數(shù)據(jù)很糟糕。雖然質(zhì)疑是針對一篇論文,但也足夠表明DeepMind還有很長的路要走。

Suleyman和Shane Legg是兩個癡迷AGI的新西蘭人,Hassabis在倫敦大學(xué)學(xué)院認(rèn)識了他們,他們后來成為了DeepMind的聯(lián)合創(chuàng)始人。

Hassabis很有天賦,DeepMind在他的帶領(lǐng)下發(fā)展地越來越快。DeepMind前運營經(jīng)理Ben Faulkner說:“Hassabis有點像磁鐵,吸引著越來越多的人才?!痹S多人拒絕了谷歌和Facebook等硅谷巨頭的offer,選擇進(jìn)入DeepMind。也許DeepMind最大的成功就是聘請并留下最聰明和最優(yōu)秀的人才。DeepMind在布魯姆斯伯里的羅素廣場(Russell Square)里開設(shè)了商店,地址在倫敦大學(xué)學(xué)院(UCL)的馬路對面。

DeepMind所關(guān)注的一種機(jī)器學(xué)習(xí)技術(shù)——強(qiáng)化學(xué)習(xí)(reinforcement learning),源于Hassabis對游戲和神經(jīng)科學(xué)的雙重?zé)釔?。這種程序是為收集相關(guān)環(huán)境信息而建立的,通過重放積累的經(jīng)驗來進(jìn)行學(xué)習(xí),就像Hassabis在Singularity Summit lecture講座中給出的人類大腦活動的描述一樣。

計算機(jī)在強(qiáng)化學(xué)習(xí)領(lǐng)域還是一片空白。該程序展示了一個虛擬環(huán)境,和國際象棋或視頻游戲的模擬一樣,只有規(guī)則是已知的。該程序包含至少一個稱為神經(jīng)網(wǎng)絡(luò)的組件,它由多層計算結(jié)構(gòu)組成,這些計算結(jié)構(gòu)可以篩選信息并識別特定的特征或策略。

每個層都以不同的抽象級別對環(huán)境進(jìn)行檢查。起初,這些網(wǎng)絡(luò)的成功率很低,但重要的是,它們會不斷的積累經(jīng)驗。在嘗試不同的策略時,它們會變得越來越復(fù)雜,如果它們成功,就會獲得獎勵,而且一旦犯過一次錯誤就不會再犯。人工智能的最牛逼的地方在于重復(fù)做任務(wù)的速度。

2016年,DeepMind吸引了全世界的目光,它建立了一個結(jié)合強(qiáng)化學(xué)習(xí)和其他技術(shù)的AI程序來玩圍棋。

這就是廣為人知的AlphaGo。2016年,AlphaGo在首爾的五場比賽中擊敗了世界冠軍,全世界都為之震驚。次年,改進(jìn)版的AlphaGo擊敗了中國圍棋冠軍。

像1997年的Deep Blue一樣,AlphaGo改變了人類對自我成就的看法,人類世界的冠軍,已經(jīng)不再是地球上最智慧的存在了。Hassabis在將他的野心告知了Fujuwarea近20年后,實現(xiàn)了這一目標(biāo)。Hassabis說,這場比賽讓他幾乎要喜極而泣。傳統(tǒng)來說,AlphaGo的學(xué)生回報它的方式就是在一場比賽中擊敗它,而Hassabis就是通過贏得整場比賽來感謝Matthews的。

DeepBlue是通過蠻力和高速運算的優(yōu)勢贏得的勝利,但AlphaGo卻風(fēng)格迥異,它看起來就很有藝術(shù)性,很具人性化。它的優(yōu)雅和精致,及其超強(qiáng)的計算力,都表明在疾病治療和城市管理的項目設(shè)計方面,DeepMind要比其競爭對手更進(jìn)一步。

02

結(jié)緣谷歌,走向世界

Hassabis堅信DeepMind將會改善世界。但AGI具有很大的不確定性,即使有一天它實現(xiàn)了,我們也不知道它是好是壞,又或者它是否會服從人類的控制?即使它能被控制,那又應(yīng)該由誰來控制它?

從一開始,Hassabis就一直試圖保護(hù)DeepMind的獨立性,他堅持認(rèn)為DeepMind應(yīng)該留在倫敦。2014年,當(dāng)谷歌要收購該公司時,控制權(quán)問題變得更加緊迫。Hassabis其實不需要向Google出售DeepMind,他手頭上有大量現(xiàn)金,而且他還想出了一個商業(yè)模式,可以讓公司設(shè)計游戲來資助研究。

但是,就像許多創(chuàng)始人一樣,他沒能抵擋谷歌的巨額的資金吸引。Hassabis并不愿交出他所精心創(chuàng)立的公司,因此作為交易的一部分,DeepMind制定了一項計劃,來阻止谷歌單方面控制公司的知識產(chǎn)權(quán)。據(jù)知情人士透露,在收購前一年,雙方簽署了一份名為“道德與安全審查協(xié)議”的合同。

審核協(xié)議規(guī)定,作為DeepMind的核心技術(shù)AGI,無論其合何時能夠研究成功,都將被一個稱為道德委員會的理事會掌控。根據(jù)同一消息來源,道德委員會不僅僅是谷歌表面的讓步,它還為DeepMind提供了堅實的法律支持,以控制其最有價值和最危險的技術(shù)。

小組成員的名字尚未公開,但另一個與DeepMind和Google關(guān)系密切的消息人士表示,DeepMind的三位創(chuàng)始人都是委員會成員。(DeepMind拒絕回答有關(guān)審核協(xié)議的一系列詳細(xì)問題,但表示“道德監(jiān)督和治理從一開始就是我們的首要任務(wù)?!保?/p>

Hassabis能決定DeepMind命運的還有其他方式,那便是忠誠。無論是過去的老員工還是現(xiàn)在的新員工,都認(rèn)為Hassabis的研究課題是DeepMind最大的優(yōu)勢之一。他的課程吸引了世界上數(shù)百名最有才華的專家,使其放棄自己的學(xué)術(shù)研究并心甘情愿地加入他的團(tuán)隊工作。DeepMind在巴黎、阿爾伯塔和阿姆斯特丹均設(shè)有分公司。

許多員工認(rèn)為與Hassabis和DeepMind的關(guān)系比與谷歌的關(guān)系更為親密,畢竟谷歌收購DeepMind就是為了獲益。他們都認(rèn)為只要自己保持個人忠誠度,Hassabis相比其唯一的股東就擁有較大的權(quán)力。對于谷歌來說,通過代理服務(wù)的DeepMind吸納AI人才比從Facebook或Apple挖人更好。

DeepMind有另一個杠桿來源,就是其公眾影響力,但這是需要不斷的增加曝光的。該公司最擅長的就是這一點,其中AlphaGo就是一場公關(guān)演出。自被谷歌收購以來,該公司一再引起全球關(guān)注。

其中一款火爆的應(yīng)用產(chǎn)品,可以在眼睛掃描中發(fā)現(xiàn)作為黃斑變性指標(biāo)的圖案。另一個軟件則學(xué)會了使用與AlphaGo相似的架構(gòu)從頭開始下棋,并成為了有史以來最偉大的國際象棋選手,僅用了9個小時它就可以對抗自己。2018年12月,一項名為AlphaFold的計劃比其他競爭對手更準(zhǔn)確地預(yù)測了復(fù)合材料清單中蛋白質(zhì)的三維結(jié)構(gòu),這很大程度上為治療帕金森氏癥和阿爾茨海默氏癥等疾病提供了契機(jī)。

DeepMind對其開發(fā)的算法感到特別自豪,該算法可以計算出最有效的方法來給谷歌的數(shù)據(jù)中心制冷,其數(shù)據(jù)中心包含大約250萬臺計算機(jī)服務(wù)器。DeepMind在2016年表示,他們將谷歌的能源費用減少了40%,但一些內(nèi)部人士表示,這種吹噓行為過于夸張。

早在DeepMind存在之前,谷歌就一直在使用算法來優(yōu)化其數(shù)據(jù)中心。一位谷歌的員工表示“他們只想擁有一些所謂的在Alphabet中有價值增值的Prso”。谷歌的母公司Alphabet為這些服務(wù)支付了DeepMind費用。2017年,DeepMind向Alphabet公司收取了5400萬英鎊。與DeepMind的管理費用相比,這個數(shù)字相形見絀。而那一年,它僅在員工身上花費了2億英鎊??偟膩碚f,DeepMind在2017年損失了2.82億英鎊。

這對現(xiàn)金充裕的巨人來說雖然微不足道,但其他出現(xiàn)赤字的子公司卻引起了Alphabet的首席財務(wù)官Ruth Porat的注意。作為互聯(lián)網(wǎng)服務(wù)提供商的谷歌光纖(Google Fibre)就陷入了財務(wù)困境,因為其明確表示需要數(shù)十年之后才能獲得投資回報。私下里人工智能研究人員都知道DeepMind最后是否會成為獨立的公司。

DeepMind在人工智能推進(jìn)方面很謹(jǐn)慎,這是其管理戰(zhàn)略的一部分,這也向當(dāng)權(quán)者表明了其聲譽(yù)價值。在谷歌被指控侵犯用戶隱私和傳播假新聞的時候,這一點特別有價值。

DeepMind也很幸運能夠獲得最高級別的認(rèn)可——Larry Page,他是谷歌兩位創(chuàng)始人之一,現(xiàn)在是Alphabet的首席執(zhí)行官。Page是Hassabis唯一的交集可能就是 Page的父親Carl在20世紀(jì)60年代研究過神經(jīng)網(wǎng)絡(luò)。Page表示在他的職業(yè)生涯早期,他就是為了建立一家人工智能公司而建立的谷歌。

DeepMind對發(fā)刊管理的嚴(yán)格控制并不符合公司普遍存在的學(xué)術(shù)精神。一些研究人員抱怨說,發(fā)表他們的作品很困難:他們必須先進(jìn)行內(nèi)部審批,然后才能將工作提交給會議和期刊。

DeepMind認(rèn)為,它需要謹(jǐn)慎行事,以避免嚇跑公眾,并破壞AGI的前景。但過于緊張可能會開始惡化學(xué)術(shù)氛圍并削弱員工的忠誠度。在谷歌收購之后的第五年,誰控制DeepMind的問題顯得至關(guān)重要。

該公司的創(chuàng)始人和早期員工即將獲得分紅,他們可以通過收購獲得的經(jīng)濟(jì)補(bǔ)償離開(Hassabis的股票價值約為1億英鎊)。但一位與該公司關(guān)系密切的消息人士表示,Alphabet已將創(chuàng)始人的收益發(fā)放推遲了兩年。鑒于此,Hassabis不太可能跳槽。

他只對金錢感興趣,因為錢可以幫助他實現(xiàn)自己的人生。但是有些同事已經(jīng)離開了,自2019年初以來,已有三名AI工程師離職。全球最著名的安全工程師之一Ben Laurie現(xiàn)已返回其前任雇主谷歌。這個數(shù)字雖然很小,但DeepMind提供了如此寶貴且令人振奮的工作機(jī)會和豐厚的薪酬情況下,任何人其實都應(yīng)該不會離職的。

直至目前,谷歌都沒有過于干涉DeepMind。但近期的一件事情使人們開始懷疑DeepMind還能保持多久的獨立性。

03

DeepMind遭遇瓶頸

DeepMind一直計劃使用AI來改善醫(yī)療保健。2016年2月,它成立了一個新部門:DeepMind Health。該部門由該公司的聯(lián)合創(chuàng)始人之一Mustafa Suleyman領(lǐng)導(dǎo)。Suleyman的母親曾是一位NHS護(hù)士。他希望創(chuàng)建一個名為Streams的程序,當(dāng)患者的健康狀況惡化時,該程序會警告醫(yī)生。

DeepMind從中獲得基于程序效果分成的費用。由于這項工作需要訪問有關(guān)患者的敏感信息,Suleyman建立了一個由英國醫(yī)療保健與科技行業(yè)精英組成的獨立審查小組(IRP)。DeepMind這樣謹(jǐn)慎行事是非常明智的——英國信息專員隨后發(fā)現(xiàn)其中一家合作醫(yī)院違反了處理患者數(shù)據(jù)的法律。盡管如此,截至2017年底,Suleyman已與四家大型NHS醫(yī)院簽署了協(xié)議。

2018年11月8日,谷歌宣布創(chuàng)建了自己的醫(yī)療保健部門Google Health。五天后,又宣布DeepMind Health將被納入其母公司。

DeepMind似乎沒有收到什么預(yù)警。根據(jù)信息自由要求(Freedom of Information Act)所得到的信息,它僅提前三天向合作醫(yī)院發(fā)布了變更通知。DeepMind拒絕透露有關(guān)合并的討論是何時開始的,但表示從通知到發(fā)布正式公告如此短的實踐是為了保證信息透明度的。

Suleyman在2016年寫道:“在任何階段,患者數(shù)據(jù)都不會與谷歌的賬戶、產(chǎn)品或服務(wù)相關(guān)聯(lián)?!彼某兄Z似乎已被打破。(回應(yīng)1843雜志的問題,DeepMind說“在這個階段,我們的合同都沒有轉(zhuǎn)移到谷歌,而且只有得到我們合伙人的同意后他們才能轉(zhuǎn)移合同。Streams成為Google服務(wù)并不意味著患者數(shù)據(jù)......可被用于提供其他Google產(chǎn)品或服務(wù)?!埃?/p>

谷歌的吞并激怒了DeepMind Health的員工。據(jù)知情人員表示,一旦吞并完成,更多員工將計劃離開公司。IRP的一名成員Mike Bracken已經(jīng)離開Suleyman了。據(jù)多位知情人士透露,Bracken于2017年12月辭職,是因為擔(dān)心該獨立審查小組更多的是為了裝飾門面而并非真正為了應(yīng)對信息隱私方面的漏洞。

當(dāng)Bracken問Suleyman是否會給小組成員賦予非執(zhí)行董事的問責(zé)制和治理權(quán)時,Suleyman發(fā)出了嘲笑。(DeepMind的一位發(fā)言人表示他們“并不記得存在”此事件)。IRP負(fù)責(zé)人Julian Huppert認(rèn)為,該小組的管理“比Bracken預(yù)期更為激進(jìn)”,因為成員能夠公開發(fā)言而不受保密義務(wù)的約束。

這一事件顯示DeepMind的外圍運營容易受到谷歌的影響。DeepMind在一份聲明中表示,“我們都同意,將多方力量凝聚一起共同努力能夠增加資源。”這就引出了一個問題,即Google是否會將相同的邏輯應(yīng)用于DeepMind的AGI工作。

大體上看,DeepMind看起來已經(jīng)取得了很大的進(jìn)步。它已經(jīng)搭建了可學(xué)習(xí)執(zhí)行超人類任務(wù)的軟件。Hassabis經(jīng)常引用Breakout,這是Atari游戲機(jī)上的視頻游戲。玩家控制一個可以在屏幕底部水平移動小平板,用它將一個球反彈到懸停在屏幕上方的方塊,球撞擊到方塊時會摧毀它們。當(dāng)所有塊都被摧毀時,玩家獲勝。

如果平板沒有接到球那么玩家就輸了。在沒有人工指導(dǎo)的情況下,DeepMind的程序不僅學(xué)會了玩這個游戲,而且還研究了如何將球反彈進(jìn)方塊背后的空間中,利用多次反彈來打破更多的方塊。Hassabis說,這證明了強(qiáng)化學(xué)習(xí)的力量和DeepMind計算機(jī)程序超越自然的能力。

這個演示非常令人驚訝,但Hassabis還是有所保留。如果虛擬平板略微往上移動一點點,程序就會失敗。DeepMind程序所學(xué)到的技能是如此受限制——它甚至無法對環(huán)境的微小變化(比人類走路時對環(huán)境產(chǎn)生的微小影響還小)作出反應(yīng)——至少在沒有數(shù)千輪強(qiáng)化學(xué)習(xí)的情況下既是如此。但是現(xiàn)實世界已經(jīng)內(nèi)置了這樣的應(yīng)對系統(tǒng)。

對于智能診斷來說,沒有兩個身體的器官是完全一樣的。對于智能機(jī)械,沒有兩個引擎可以以相同的方式進(jìn)行調(diào)整。因此,將在虛擬空間中完善的程序發(fā)布到現(xiàn)實世界其實充滿了困難。

DeepMind很少談到的第二個問題是,虛擬環(huán)境中的成功取決于獎勵功能的存在:允許程序衡量其進(jìn)展的信號。該程序?qū)W習(xí)到,發(fā)射小球到方塊上方的空間使其多次反彈能夠使得分上升。DeepMind與AlphaGo的大部分工作在于構(gòu)建與這種復(fù)雜游戲兼容的獎勵功能。不幸的是,現(xiàn)實世界并不提供如此簡單的獎勵。

進(jìn)展很少能夠通過單一分?jǐn)?shù)來衡量。即使在存在此類度量的情況下,政治挑戰(zhàn)也會使問題復(fù)雜化。將氣候問題的獎勵信號(大氣中每百萬的二氧化碳顆粒數(shù))與石油公司的獎勵信號(股價)相協(xié)調(diào),需要同時滿足許多有沖突動機(jī)的人。獎勵信號往往非常弱。在身臨其中時,人類大腦基本無法接收任務(wù)成功度的直接反饋。

04

DeepMind的強(qiáng)化學(xué)習(xí)之路

DeepMind花費了大量的計算機(jī)電力后找到了解決這個問題的方法。為學(xué)習(xí)任何東西,AlphaGo都需要數(shù)千年的人類游戲時間。很多AI研究者對此提出質(zhì)疑:這種解決方案是不可持續(xù)的。DeepMind承認(rèn)存在這種含糊之處。它最近專注于星際爭霸2,一款策略計算機(jī)游戲。

在游戲早期做出的決定會在后期產(chǎn)生影響,這更接近于那些類似許多現(xiàn)實世界任務(wù)的錯綜復(fù)雜的延遲反饋。1月份,DeepMind軟件在一場演示中擊敗了一些世界頂級的人類玩家;雖然許多功能依然受到大量限制,但這仍然令人印象深刻。該程序也開始通過遵循人工任務(wù)主管的反饋來學(xué)習(xí)獎勵功能。但是,將人類指令置于流程循環(huán)中可能會喪失無人計算機(jī)處理所帶來的規(guī)模與速度紅利。

DeepMind和谷歌的現(xiàn)任和前任研究人員(由于嚴(yán)格的保密協(xié)議而要求匿名)對于DeepMind通過這些方法達(dá)到AGI的可能性表示懷疑。這些人認(rèn)為,過于關(guān)乎在模擬環(huán)境中的優(yōu)秀表現(xiàn)使得獎勵信號問題難以解決。然而,這種方法是DeepMind的核心。它有一個內(nèi)部排行榜,互相競爭團(tuán)隊的程序爭奪對虛擬域的掌控。

Hassabis一直將生活視為一種游戲。他的職業(yè)生涯的很大一部分都致力于制作游戲,而他休閑時間的很大一部分都花在了打游戲上。DeepMind是他選擇開發(fā)AGI的工具。就像他的軟件一樣,Hassabis只能從他的經(jīng)歷中學(xué)習(xí)。

追求AGI可能最終會導(dǎo)致失去方向——即使他們已經(jīng)發(fā)明了一些有用的醫(yī)療技術(shù),還超越了世界上最偉大的棋盤游戲玩家。這些確實是重大成就,但并非他渴望達(dá)到的。但他仍然可以將AGI引入現(xiàn)實應(yīng)用——就在谷歌眼前卻遠(yuǎn)超其掌控。如果Demis Hassabis這樣做,他將贏得的是最艱難的比賽。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6171

    瀏覽量

    105504
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31024

    瀏覽量

    269363
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    130

    瀏覽量

    10879

原文標(biāo)題:萬字長文解讀DeepMind與谷歌的AI拉鋸戰(zhàn)

文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進(jìn)行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報道,谷歌近期發(fā)布了一款名為“深度研究”的先進(jìn)AI工具。這款工具借助其內(nèi)部的Gemini大型語言模型,實現(xiàn)了對網(wǎng)絡(luò)信息的高效檢索與深度挖掘,進(jìn)一步滿足了用戶對精準(zhǔn)、詳盡信息的
    的頭像 發(fā)表于 12-16 09:35 ?231次閱讀

    OpenAI從谷歌DeepMind挖角三名高級工程師

    近日,據(jù)Wired最新報道,OpenAI在人才爭奪戰(zhàn)中取得了顯著成果,成功從競爭對手谷歌DeepMind“挖角”了三名高級計算機(jī)視覺和機(jī)器學(xué)習(xí)領(lǐng)域的專家。 據(jù)悉,這三名工程師分別是Lucas
    的頭像 發(fā)表于 12-04 14:13 ?305次閱讀

    谷歌DeepMind被曝抄襲開源成果,論文還中了頂流會議

    谷歌DeepMind一篇中了頂流新生代會議CoLM 2024的論文被掛了,瓜主直指其抄襲了一年前就掛在arXiv上的一項研究。開源的那種。
    的頭像 發(fā)表于 07-16 18:29 ?603次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>DeepMind</b>被曝抄襲開源成果,論文還中了頂流會議

    谷歌AI新突破:為無聲視頻智能配音

    近日,谷歌DeepMind團(tuán)隊公布了一項革命性的技術(shù)——利用AI為無聲視頻生成背景音樂的“video-to-audio”技術(shù)。這一技術(shù)的出現(xiàn),不僅為視頻創(chuàng)作領(lǐng)域帶來了新的可能,也為觀眾帶來了更加豐富的視聽體驗。
    的頭像 發(fā)表于 06-21 10:50 ?504次閱讀

    谷歌CEO皮查伊探討AI革命:影響深遠(yuǎn),AI將融入日常工作

    在訪談中,主持人首先詢問皮查伊為何選擇使用谷歌AI,他回應(yīng)稱,AI將對我們的生活產(chǎn)生深遠(yuǎn)影響?!?b class='flag-5'>AI的應(yīng)用多種多樣,能提升用戶體驗,簡化工作流程,還能與
    的頭像 發(fā)表于 05-28 15:00 ?586次閱讀

    谷歌DeepMind發(fā)布人工智能模型AlphaFold最新版本

    谷歌DeepMind近日發(fā)布了人工智能模型AlphaFold的最新版本——AlphaFold 3,這一革命性的工具將在藥物發(fā)現(xiàn)和疾病治療領(lǐng)域發(fā)揮巨大作用。
    的頭像 發(fā)表于 05-10 11:26 ?604次閱讀

    谷歌DeepMind推出新一代藥物研發(fā)AI模型AlphaFold 3

    谷歌DeepMind公司近日重磅推出了一款名為AlphaFold 3的全新藥物研發(fā)AI模型,這一創(chuàng)新技術(shù)將為科學(xué)家們提供前所未有的幫助,使他們能更精確地理解疾病機(jī)制,進(jìn)而開發(fā)出更高效的治療藥物。
    的頭像 發(fā)表于 05-10 09:35 ?401次閱讀

    谷歌DeepMind推出SIMI通用AI智能體

    近日,谷歌DeepMind團(tuán)隊發(fā)布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),這是一個通用人工智能智能體,能夠在多種3D虛擬環(huán)境
    的頭像 發(fā)表于 03-18 11:39 ?986次閱讀

    京東方報價太低?LG Display廣州LCD工廠出售協(xié)議暫未達(dá)成

    WitDisplay消息,LG Display 正與京東方等中國企業(yè)展開拉鋸戰(zhàn),出售其在中國廣州的8.5代LCD工廠。
    的頭像 發(fā)表于 02-29 14:42 ?1180次閱讀

    谷歌計劃重新推出改進(jìn)后的Gemini AI模型人像生成功能

    谷歌DeepMind的首席執(zhí)行官德米斯·哈薩比斯在2月26日透露,公司計劃在接下來的幾周內(nèi)重新發(fā)布其備受關(guān)注的Gemini AI模型人像生成功能。此前,由于在某些歷史圖像生成描述中出現(xiàn)了不準(zhǔn)確的問題,
    的頭像 發(fā)表于 02-28 10:17 ?610次閱讀

    谷歌DeepMind推新AI模型Genie,能生成2D游戲平臺

    據(jù)報道,谷歌公司的DeepMind團(tuán)隊近期發(fā)布了AI模型Genie,此模型擁有多達(dá)110億個參數(shù),能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當(dāng)完整的2D游戲場景。
    的頭像 發(fā)表于 02-27 14:53 ?795次閱讀

    谷歌宣布Gemma大模型全球開放使用

    谷歌公司近日宣布,其先進(jìn)的AI大模型Gemma即日起在全球范圍內(nèi)開放使用。這一新模型由谷歌DeepMind和其他團(tuán)隊合作開發(fā),并與其最大的AI
    的頭像 發(fā)表于 02-23 10:41 ?793次閱讀

    谷歌AI聊天機(jī)器人改名為Gemini

    谷歌(Google)近日宣布,旗下備受矚目的AI聊天機(jī)器人Bard正式更名為Gemini,并推出了一款功能更加強(qiáng)大的付費版本——Gemini Advanced。這一戰(zhàn)略調(diào)整旨在與微軟、OpenAI等科技巨頭在
    的頭像 發(fā)表于 02-18 11:28 ?1124次閱讀

    谷歌DeepMind資深AI研究員創(chuàng)辦AI Agent創(chuàng)企

    近日,剛從谷歌DeepMind離職的資深AI研究員Ioannis Antonoglou宣布創(chuàng)辦了一家名為“AI Agent”的創(chuàng)企。Ioannis Antonoglou常駐倫敦,此前曾
    的頭像 發(fā)表于 02-04 10:02 ?802次閱讀

    谷歌DeepMind科學(xué)家欲建AI初創(chuàng)公司

    據(jù)知情人士透露,谷歌人工智能部門DeepMind的兩名杰出科學(xué)家Laurent Sifre和Karl Tuyls正在與投資者商討在巴黎成立一家新的人工智能初創(chuàng)公司的事宜。
    的頭像 發(fā)表于 01-22 14:41 ?509次閱讀