DeepMind和谷歌的關(guān)系可能并不像看上去那么美好。DeepMind缺乏持續(xù)穩(wěn)定的營(yíng)收能力,而谷歌畢竟不是做慈善的。雙方之間爭(zhēng)奪“獨(dú)立自主權(quán)“的控制與反控制的戰(zhàn)爭(zhēng)已經(jīng)開始!
DeepMind和谷歌的關(guān)系可能并不像看上去的那么美好。
2014年谷歌擊敗Facebook,斥資6億美元收購(gòu)了DeepMind。DeepMind致力于解決人工通用智能方面的挑戰(zhàn),它最為世人熟知的產(chǎn)品就是AlphaGo和AlphaZero。
因?yàn)镈eepMind缺乏持續(xù)穩(wěn)定的營(yíng)收能力,并非所有谷歌員工都認(rèn)為收購(gòu)是明智之舉;而對(duì)DeepMind的員工而言,谷歌這位金主也不是那么令人滿意,他們之間的矛盾點(diǎn)在于“獨(dú)立自主權(quán)“。
谷歌與DeepMind的控制與反控制的戰(zhàn)爭(zhēng)已經(jīng)開始!
真相究竟如何?近日《***》發(fā)表萬(wàn)字長(zhǎng)文:帶你了解DeepMind的前世今生,深度洞察其與谷歌的人工智能控制權(quán)之爭(zhēng)。
AGI將讓目前最先進(jìn)的AI就像袖珍計(jì)算器一樣
2010年8月的一個(gè)下午,在舊金山灣的會(huì)議廳里,一名叫Demis Hassabis的34歲倫敦人大步走上舞臺(tái)。他盡量控制著自己的情緒,微笑著說(shuō):“今天我將要談?wù)撘环N不同的構(gòu)建方法......”他停頓了一下, 好像要大聲說(shuō)出他的話題。 然后他說(shuō):“那就是AGI”。
AGI代表通用型人工智能,是一種假設(shè)的計(jì)算機(jī)程序,可以執(zhí)行與人類相同或更好的智力任務(wù)。 AGI將能夠完成離散任務(wù),例如識(shí)別照片或翻譯語(yǔ)言,這些只是我們手機(jī)和計(jì)算機(jī)中眾多人工智能(AIs)形式的一種表現(xiàn)。 但它也會(huì)加減法、下棋和說(shuō)法語(yǔ)。 它還能理解物理類論文、撰寫小說(shuō)、制定投資策略并與陌生人進(jìn)行愉快的交談。它將監(jiān)測(cè)核反應(yīng)、管理電網(wǎng)和交通流量,并毫不費(fèi)力地取得一切成功。
AGI將使今天最先進(jìn)的AI看起來(lái)像袖珍計(jì)算器。
目前只有人類的智力能夠完成所有這些任務(wù)。 但人類的智力受到大腦顱骨大小的限制,它的力量受到身體能夠提供的微量能量的限制。但AGI將在計(jì)算機(jī)上運(yùn)行,所以它不會(huì)受到這些限制。其智能僅受可用處理器數(shù)量的限制。AGI可能從監(jiān)測(cè)核反應(yīng)開始,但很快它就可以通過(guò)在瞬間消化更多的物理論文來(lái)發(fā)現(xiàn)新的能量來(lái)源,而這個(gè)過(guò)程,人類可能花費(fèi)畢生精力也比不上。
人機(jī)智能和計(jì)算機(jī)的速度和可擴(kuò)展性,將解決掉目前看似不可解決的問(wèn)題。哈薩比斯告訴英國(guó)報(bào)紙觀察家,他希望AGI能夠掌握“癌癥、氣候變化、能源、基因組學(xué)、宏觀經(jīng)濟(jì)和金融系統(tǒng)”等學(xué)科。
哈薩比斯發(fā)言的會(huì)議被稱為奇點(diǎn)峰會(huì)。 根據(jù)未來(lái)學(xué)家的說(shuō)法,“奇點(diǎn)”指的是AGI出現(xiàn)的最可能后果。因?yàn)锳GI將以高速處理信息,所以它會(huì)很快變得非常聰明。 自我改善的快速循環(huán)將導(dǎo)致機(jī)器智能的爆炸,使人類窒息于硅塵。由于這是完全建立在未經(jīng)考驗(yàn)的假設(shè)上,因此無(wú)論是將奇點(diǎn)視為烏托邦還是地獄,都是近乎宗教信仰的問(wèn)題。
從會(huì)談的標(biāo)題來(lái)看,會(huì)議的與會(huì)者傾向于將人工智能當(dāng)成救世主:“如何建立人類思想”; “AI對(duì)抗衰老”; “取代我們的身體”; “修改生與死的界限”。 相比之下,哈薩比斯的講話“建立AGI的系統(tǒng)神經(jīng)科學(xué)方法”似乎沒有給人留下深刻的印象。
哈薩比斯在講臺(tái)和屏幕之間踱步,語(yǔ)速很快。 他穿著一件栗色套頭衫和一件白色的扣子襯衫,像個(gè)學(xué)生。他那瘦小的身材似乎反襯出他的智力強(qiáng)大。哈薩比斯解釋說(shuō),到目前為止,科學(xué)家已從兩個(gè)方面接近AGI。 其中一個(gè)就是AI,研究人員試圖描述和編程一個(gè)可以像人類一樣思考的系統(tǒng)的所有規(guī)則。 這種方法在20世紀(jì)80年代和90年代很流行,但沒有產(chǎn)生預(yù)期結(jié)果。哈薩比斯認(rèn)為大腦的結(jié)構(gòu)太微妙,無(wú)法通過(guò)這種方式描述。
另一個(gè)就是以數(shù)字形式復(fù)制大腦的物理網(wǎng)絡(luò)。這樣做有一定道理,畢竟大腦是人類智慧所在。但哈薩比斯說(shuō),那些研究人員也被誤導(dǎo)了。他們的任務(wù)與繪制宇宙中每顆恒星的任務(wù)類似。 更離譜的是,這種方法專注于錯(cuò)誤的大腦功能水平,就像試圖通過(guò)撕開計(jì)算機(jī)并檢查晶體管的相互作用來(lái)了解Microsoft Excel的工作原理一樣。
相反,哈薩比斯提出了一個(gè)中間立場(chǎng):AGI應(yīng)該從大腦處理信息的廣泛方法中獲取靈感,而不是物理系統(tǒng)或它在特定情況下應(yīng)用的特定規(guī)則。 換句話說(shuō),它應(yīng)該專注于理解大腦的軟件,而不是硬件,像功能性磁共振成像(fMRI)這樣的新技術(shù),大腦在活動(dòng)時(shí)能夠在大腦內(nèi)部進(jìn)行對(duì)等活動(dòng),已經(jīng)開始使這種理解變得可行。
他告訴觀眾,最新的研究表明,大腦通過(guò)在睡眠期間重播經(jīng)驗(yàn)來(lái)學(xué)習(xí),以便得出一般原則。 AI研究人員應(yīng)該模仿這種系統(tǒng)。
在他的幻燈片的右下角出現(xiàn)了一個(gè)標(biāo)志,一個(gè)圓形的藍(lán)色漩渦,下面印著兩個(gè)單詞:DeepMind。這是該公司第一次公開亮相。 這次演講并不簡(jiǎn)單,哈薩比斯花了一年的時(shí)間試圖收到奇點(diǎn)峰會(huì)的邀請(qǐng)。他真正想要的是與硅谷億萬(wàn)富翁彼得·蒂爾(Peter Thiel)交談一分鐘,而蒂爾正是這次會(huì)議的贊助商。 哈薩比斯想要蒂爾的投資。
哈薩比斯從來(lái)沒有說(shuō)過(guò)為什么他特別想要蒂爾的支持。但蒂爾比哈薩比斯更相信AGI。 在2009年奇點(diǎn)峰會(huì)的一次演講中,蒂爾曾表示,他對(duì)未來(lái)最大的恐懼不是機(jī)器人起義(盡管在新西蘭內(nèi)陸地區(qū)有一個(gè)避難所,其實(shí)他比大多數(shù)人做好了準(zhǔn)備)。 相反,他擔(dān)心奇點(diǎn)將花費(fèi)太長(zhǎng)時(shí)間,而世界需要新技術(shù)來(lái)抵御經(jīng)濟(jì)衰退。
DeepMind最終籌集了200萬(wàn)英鎊; 蒂爾貢獻(xiàn)了140萬(wàn)英鎊。 當(dāng)Google以6億美元的價(jià)格在2014年1月收購(gòu)該公司時(shí),蒂爾和其他早期投資者的投資收益率為5000%。
對(duì)于許多創(chuàng)始人來(lái)說(shuō),這是一個(gè)圓滿的結(jié)局。他們可能會(huì)放慢速度,退后一步,花更多的時(shí)間與錢打交道。對(duì)于哈薩比斯來(lái)說(shuō),谷歌的收購(gòu)只是他追求AGI的其中一步。 2013年,他花了很多時(shí)間談判交易條款。DeepMind將獨(dú)立于谷歌運(yùn)營(yíng),將在不失去控股權(quán)的前提下獲得谷歌提供的現(xiàn)金和算力。
哈薩比斯認(rèn)為DeepMind將是一個(gè)混合體:它將擁有創(chuàng)業(yè)公司的驅(qū)動(dòng)力,頂尖大學(xué)的大腦,以及世界上最有價(jià)值公司的雄厚資金。 每一個(gè)因素都是為了加速AGI的到來(lái),并解決人類的苦難。
哈薩比斯其人
哈薩比斯于1976年出生于倫敦北部,父親是希臘塞浦路斯人,母親是新加坡籍華人。 他是三個(gè)兄弟姐妹中最大的一個(gè)。 他的母親在英國(guó)百貨公司約翰·劉易斯工作,他的父親經(jīng)營(yíng)著一家玩具店。他四歲時(shí),在看完父親和叔叔的比賽后,迷上了國(guó)際象棋,幾周之內(nèi),他就擊敗了成年人。 到了13歲時(shí),他在同齡棋手中位居世界第二。八歲時(shí),他自學(xué)了基礎(chǔ)計(jì)算機(jī)代碼。
哈薩比斯于1992年完成了他的A-levels課程,比計(jì)劃提前了兩年。 他找到了Bullfrog Productions的電子游戲編程工作。哈薩比斯開發(fā)了主題公園,玩家可以在其中設(shè)計(jì)并運(yùn)營(yíng)虛擬游樂(lè)園,這取得了很大成功,銷售了1500萬(wàn)份,之后還衍化出了新的模擬游戲類型,其目標(biāo)不是擊敗對(duì)手,而是優(yōu)化復(fù)雜系統(tǒng)的功能,如企業(yè)或城市。
除了開發(fā)游戲外,他還很擅長(zhǎng)玩游戲。 作為一個(gè)青少年,他會(huì)在棋盤游戲比賽中跑到兩個(gè)樓層之間,同時(shí)參加國(guó)際象棋、拼字游戲、撲克和步步高比賽。 1995年,在劍橋大學(xué)學(xué)習(xí)計(jì)算機(jī)科學(xué)時(shí),哈薩比斯經(jīng)常出入學(xué)生圍棋錦標(biāo)賽。圍棋是一種古老的戰(zhàn)略棋盤游戲,比國(guó)際象棋復(fù)雜得多,這需要長(zhǎng)期經(jīng)驗(yàn)獲得直覺。 沒有人知道哈薩比斯以前是否曾經(jīng)參加過(guò)比賽。
首先,哈薩比斯贏得了初學(xué)者的比賽。然后他擊敗了經(jīng)驗(yàn)豐富的參賽者。參加錦標(biāo)賽的劍橋圍棋大師查爾斯·馬修斯記得,一位專家級(jí)球員被一名19歲的新手打敗后感到非常震驚。劍橋圍棋大師馬修斯隨后將哈薩比斯收于麾下。
哈薩比斯總是通過(guò)一次次的比賽來(lái)展現(xiàn)其智慧和野心。慢慢地,游戲引發(fā)了他對(duì)智力的迷戀。當(dāng)他觀察自己在國(guó)際象棋中的成長(zhǎng)時(shí),他想知道計(jì)算機(jī)是否可以通過(guò)積累的經(jīng)驗(yàn)編程來(lái)學(xué)習(xí)。游戲提供了一個(gè)現(xiàn)實(shí)世界無(wú)法比擬的學(xué)習(xí)環(huán)境。游戲是從現(xiàn)實(shí)世界中汲取的,它們可以在沒有干擾的情況下實(shí)踐并且有效地掌握。游戲加快了時(shí)間進(jìn)度:玩家在幾天內(nèi)組建團(tuán)隊(duì),并在幾分鐘內(nèi)進(jìn)行戰(zhàn)斗。
1997年夏天,哈薩比斯前往日本。那年5月,IBM的深藍(lán)計(jì)算機(jī)擊敗了世界象棋冠軍加里卡斯帕羅夫。這是計(jì)算機(jī)第一次在國(guó)際象棋中擊敗了一位大師。這場(chǎng)比賽引起了全世界的關(guān)注,并引發(fā)了對(duì)計(jì)算機(jī)力量和潛在威脅的擔(dān)憂。當(dāng)哈薩比斯遇到日本棋盤游戲大師Masahiko Fujuwarea時(shí),他談到了一個(gè)將他在戰(zhàn)略游戲和人工智能方面的興趣結(jié)合起來(lái)的計(jì)劃:有朝一日,他會(huì)建立一個(gè)計(jì)算機(jī)程序來(lái)?yè)魯∽顐ゴ蟮娜祟悋逋婕摇?/p>
哈薩比斯有條不紊地去完成自己的事業(yè)。 “20歲時(shí),哈薩比斯認(rèn)為,在進(jìn)入人工智能領(lǐng)域之前,他還需要做一些事情?!瘪R修斯說(shuō)。 “他有一個(gè)計(jì)劃?!?/p>
1998年,他創(chuàng)辦了一個(gè)名為Elixir的游戲工作室。哈薩比斯專注于開發(fā)一個(gè)雄心勃勃的游戲—《共和國(guó)革命》。它是一個(gè)錯(cuò)綜復(fù)雜的政治模擬游戲。多年前,當(dāng)他還在學(xué)校時(shí),哈薩比斯告訴他的朋友穆斯塔法·蘇萊曼,世界需要一個(gè)模擬復(fù)雜的動(dòng)態(tài)并解決最棘手的社會(huì)問(wèn)題的游戲?,F(xiàn)在,他嘗試在游戲中這樣做了。
事實(shí)證明,由于代碼開發(fā)的問(wèn)題他并未達(dá)到預(yù)期目標(biāo)。Elixir最終發(fā)布了這款游戲的精簡(jiǎn)版,反響平平。其他類似游戲也紛紛失?。ㄆ渲幸粋€(gè)是名為Evil Genius的模擬游戲)。2005年4月,哈薩比斯關(guān)閉了Elixir。馬修斯認(rèn)為,哈薩比斯創(chuàng)立公司只是為了獲得管理經(jīng)驗(yàn)。現(xiàn)在,在開始進(jìn)軍AGI之前,哈薩比斯只缺乏一個(gè)至關(guān)重要領(lǐng)域的知識(shí),他需要了解人類的大腦。
2005年,哈薩比斯在倫敦大學(xué)學(xué)院(UCL)獲得神經(jīng)科學(xué)博士學(xué)位。他發(fā)表了一篇很有影響力的有關(guān)記憶和想象力的研究報(bào)告。這篇被引用超過(guò)1000次的論文顯示,健忘癥患者在想象新事物方面也存在困難,這表明記憶和創(chuàng)造心理圖像之間存在聯(lián)系。哈薩比斯試圖去理解大腦的活動(dòng)。他的大部分工作回歸到了一個(gè)問(wèn)題:人類大腦如何獲得并保留概念和知識(shí)?
DeepMind的理想:先解決AI,再用AI解決所有問(wèn)題
哈薩比斯于2010年11月15日正式成立了DeepMind。該公司的使命宣言與現(xiàn)在一樣:“Slove Intelligence”,然后用Intelligence來(lái)解決其他所有問(wèn)題。正如哈薩比斯告訴Singularity Summit的與會(huì)者所說(shuō)的那樣,這意味著將我們對(duì)大腦如何完成任務(wù)的原理翻譯給軟件,讓軟件用相同的辦法進(jìn)行自學(xué)。
哈薩比斯并沒有假裝科學(xué)已經(jīng)完全理解了人類的思想。AGI的藍(lán)圖不能簡(jiǎn)單地從數(shù)百項(xiàng)神經(jīng)科學(xué)研究中得出。但他很明白以他想要的方式開始研究AGI已經(jīng)足夠了。也有可能他過(guò)于自信了。我們對(duì)大腦的實(shí)際運(yùn)作方式仍然知之甚少。2018年,一群澳大利亞研究人員質(zhì)疑哈薩比斯博士的研究結(jié)果。統(tǒng)計(jì)數(shù)據(jù)很糟糕,雖然只是一篇論文,但它表明保障DeepMind工作的科學(xué)問(wèn)題遠(yuǎn)未解決。
Suleyman和Shane Legg是兩個(gè)癡迷AGI的新西蘭人,哈薩比斯也在倫敦大學(xué)學(xué)院認(rèn)識(shí)了他們,他們成了聯(lián)合創(chuàng)始人。該公司的聲譽(yù)迅速增長(zhǎng)。哈薩比斯很有天賦。 “他有點(diǎn)像磁鐵,”DeepMind前運(yùn)營(yíng)經(jīng)理Ben Faulkner說(shuō)。公司許多新人來(lái)自歐洲,他們沒有選擇谷歌和Facebook這樣的硅谷巨頭。也許DeepMind最大的成就是盡早聘請(qǐng)并保留了最聰明和最優(yōu)秀的人才。該公司在布魯姆斯伯里羅素廣場(chǎng)(Russell Square)的一個(gè)排屋的閣樓里開設(shè)了商店,這個(gè)房子位于倫敦大學(xué)學(xué)院(UCL)的馬路對(duì)面。
該公司所關(guān)注的一種機(jī)器學(xué)習(xí)技術(shù):強(qiáng)化學(xué)習(xí),源于哈薩比斯對(duì)游戲和神經(jīng)科學(xué)的雙重迷戀。這樣的程序是為了收集有關(guān)環(huán)境的信息而建立的,然后通過(guò)反復(fù)重放其經(jīng)歷來(lái)學(xué)習(xí)它,就像哈薩比斯在奇點(diǎn)峰會(huì)講座中所描述的睡覺時(shí)人類大腦的活動(dòng)一樣。
強(qiáng)化學(xué)習(xí)領(lǐng)域剛開始一片空白。該程序展示了一個(gè)只知道規(guī)則的虛擬環(huán)境,與國(guó)際象棋或視頻游戲的模擬一樣,包含至少一個(gè)神經(jīng)網(wǎng)絡(luò)組件,它由多層計(jì)算結(jié)構(gòu)組成,這些計(jì)算結(jié)構(gòu)可以篩選信息以識(shí)別特定的特征或策略。
每個(gè)層都以不同的抽象級(jí)別檢查環(huán)境。起初,這些網(wǎng)絡(luò)的成功率很低,但重要的是,這些失敗會(huì)紀(jì)錄在編碼里。當(dāng)他們?cè)趪L試不同的策略時(shí)會(huì)變得越來(lái)越復(fù)雜,但如果最終成功就會(huì)獲得獎(jiǎng)勵(lì)。如果程序移動(dòng)棋子并因此輸?shù)粲螒?,它之后則不會(huì)再犯這個(gè)錯(cuò)誤。人工智能的大部分魔力在于它重復(fù)任務(wù)的速度。
DeepMind的成名之路
DeepMind的工作在2016年迎來(lái)了一個(gè)高潮,他們的一個(gè)團(tuán)隊(duì)建立了一個(gè)AI程序,該程序運(yùn)用了強(qiáng)化學(xué)習(xí)和其他一些技術(shù)來(lái)玩圍棋。2016年,這項(xiàng)名為AlphaGo的程序在首爾一場(chǎng)五局三勝制比賽中擊敗了世界冠軍,引起了極大的轟動(dòng)。這場(chǎng)勝利被2.8億人收看到,比專家預(yù)測(cè)的要早十年。第二年,AlphaGo的改進(jìn)版本擊敗了中國(guó)圍棋冠軍。
像1997年的Deep Blue一樣,AlphaGo改變了人們對(duì)于人類所取的成就的看法。人類冠軍,地球上一些最聰明的人,不再站在智慧的頂峰。在將自己的野心告知了Fujuwarea近20年后,哈薩比斯實(shí)現(xiàn)了這一目標(biāo)。哈薩比斯說(shuō),這場(chǎng)比賽讓他差點(diǎn)流淚。傳統(tǒng)上,學(xué)圍棋的學(xué)生在一場(chǎng)比賽中擊敗他們的老師作為回報(bào)。而哈薩比斯通過(guò)擊敗這項(xiàng)比賽來(lái)感謝馬修斯。
DeepBlue通過(guò)蠻力和高速的運(yùn)算贏得了勝利,但AlphaGo的風(fēng)格看起來(lái)更有藝術(shù)性和人性化。DeepMind的優(yōu)雅、精致以及日益增長(zhǎng)的計(jì)算力,似乎表明在尋求可以治療疾病和管理城市方面比競(jìng)爭(zhēng)對(duì)手更進(jìn)一步。
一直以來(lái),哈薩比斯認(rèn)為,DeepMind將會(huì)讓世界變得更好,但AGI沒有確定性。如果它發(fā)展下去,我們不知道它是無(wú)私的還是惡毒的,或者它是否會(huì)受到人類的控制。即便它能被控制,那又有誰(shuí)來(lái)掌控呢?
從一開始,哈薩比斯就一直在努力保護(hù)DeepMind的獨(dú)立性。他一直堅(jiān)持想把DeepMind留在倫敦。當(dāng)谷歌在2014年收購(gòu)該公司時(shí),控制權(quán)問(wèn)題變得更加緊迫。哈薩比斯不需要向Google出售DeepMind。他手頭上有大量現(xiàn)金,并勾勒出了一個(gè)商業(yè)模式,公司將設(shè)計(jì)游戲來(lái)資助研究。
谷歌的財(cái)力很有吸引力,然而,和許多創(chuàng)始人一樣,哈薩比斯不愿交出他所培育的公司。作為交易的一部分,DeepMind制定了一項(xiàng)計(jì)劃,阻止谷歌單方面控制公司的知識(shí)產(chǎn)權(quán)。
據(jù)知情人士透露,在收購(gòu)前一年,雙方簽署了一份名為“道德與安全審查協(xié)議”的合同。沒被報(bào)道過(guò)的這項(xiàng)協(xié)議是由倫敦的高級(jí)大律師制定的。
審核協(xié)議將DeepMind的核心AGI技術(shù)(無(wú)論是什么時(shí)候創(chuàng)建的)控制在一個(gè)稱為道德委員會(huì)的理事會(huì)手中。道德委員會(huì)不僅僅是谷歌表面上的讓步,它還為DeepMind提供了堅(jiān)實(shí)的法律支持,以控制其最有價(jià)值和最危險(xiǎn)的技術(shù)。小組成員的名字尚未公開,但另一個(gè)與DeepMind和Google關(guān)系密切的消息人士表示,三位DeepMind的創(chuàng)始人都在名單上。(DeepMind拒絕回答有關(guān)審核協(xié)議的一系列詳細(xì)問(wèn)題,但表示“道德監(jiān)督和治理從一開始就是我們的首要任務(wù)?!保?/p>
哈薩比斯也可以通過(guò)其他方式來(lái)決定DeepMind的命運(yùn),其中一個(gè)是忠誠(chéng)。過(guò)去和現(xiàn)在的員工都表示,哈薩比斯的研究議程是DeepMind最大的優(yōu)勢(shì)之一。他的項(xiàng)目給大家提供了令人著迷和重要的工作而且沒有學(xué)術(shù)壓力,以此吸引了數(shù)百名世界上最有才華的專家。
DeepMind在巴黎、阿爾伯塔和阿姆斯特丹設(shè)有分公司。許多員工感覺哈薩比斯及其使命比只追求利潤(rùn)的母公司更有吸引力。只要能保持員工的個(gè)人忠誠(chéng)度,哈薩比斯作為唯一股東就有相當(dāng)大的權(quán)力。對(duì)于谷歌來(lái)說(shuō),通過(guò)代理讓DeepMind AI人才為其工作,總比這些人去Facebook或Apple工作要好。
DeepMind還有另一個(gè)需要持續(xù)不斷進(jìn)行的任務(wù):擴(kuò)大公眾影響力。該公司擅長(zhǎng)這一點(diǎn)。AlphaGo就是一場(chǎng)很棒的公關(guān)。自谷歌收購(gòu)以來(lái),該公司不停的做出引起全球關(guān)注的事情。一個(gè)軟件可以在眼睛掃描中發(fā)現(xiàn)作為黃斑變性指標(biāo)的圖像。另一個(gè)程序?qū)W會(huì)了使用與AlphaGo相似的架構(gòu),從頭開始學(xué)下棋,通過(guò)和自己下棋,僅用了9個(gè)小時(shí)就成為有史以來(lái)最偉大的國(guó)際象棋選手。
2018年12月,一項(xiàng)名為AlphaFold的計(jì)劃比其他競(jìng)爭(zhēng)對(duì)手更準(zhǔn)確地預(yù)測(cè)了復(fù)合材料清單中蛋白質(zhì)的三維結(jié)構(gòu),可能為治療帕金森氏癥和阿爾茨海默氏癥等疾病鋪平了道路。
DeepMind對(duì)其開發(fā)的算法感到特別自豪,該算法可以計(jì)算出最有效的方法來(lái)給谷歌的數(shù)據(jù)交換中心制冷,該中心包含大約250萬(wàn)臺(tái)計(jì)算機(jī)服務(wù)器。DeepMind在2016年表示,他們將谷歌的能源費(fèi)用減少了40%。但一些內(nèi)部人士表示,這種吹噓行為過(guò)于夸張。
早在DeepMind存在之前,Google一直在使用算法來(lái)優(yōu)化其數(shù)據(jù)中心。 “他們只是想要一些公關(guān),這樣他們就可以在Alphabet心中增加一些價(jià)值,”一名谷歌員工表示。Google的母公司Alphabet給DeepMind支付相當(dāng)可觀的費(fèi)用。
2017年,DeepMind從Alphabet公司拿走了5400萬(wàn)英鎊。與DeepMind的日常開支相比,這個(gè)數(shù)字相形見絀。那一年,僅在員工身上,它就花費(fèi)了2億英鎊??偟脕?lái)說(shuō),2017年DeepMind損失了2.82億英鎊。
這對(duì)現(xiàn)金充裕的巨人來(lái)說(shuō)微不足道,但這引起了Alphabet子公司首席財(cái)務(wù)官Ruth Porat的注意?;ヂ?lián)網(wǎng)服務(wù)提供商的谷歌光纖(Google Fibre)在明確表示需要數(shù)十年時(shí)間才能獲得投資回報(bào)后,就陷入了困境。人工智能研究人員私下也嘀咕,DeepMind是否會(huì)成為“Porated”。
DeepMind謹(jǐn)慎發(fā)布人工智能的進(jìn)展是其管理戰(zhàn)略的一部分,標(biāo)志著其嚴(yán)控權(quán)力的聲譽(yù)價(jià)值。在谷歌被指控侵犯用戶隱私和傳播假新聞時(shí),這一點(diǎn)特別有價(jià)值。
DeepMind也很幸運(yùn)能夠獲得最高級(jí)別的認(rèn)可:Larry Page,Google的兩位創(chuàng)始人之一,現(xiàn)在是Alphabet的首席執(zhí)行官。Page和哈薩比斯唯一的交集可能是,Page的父親Carl在20世紀(jì)60年代研究過(guò)神經(jīng)網(wǎng)絡(luò)。在他的職業(yè)生涯早期,Page表示他建立谷歌他只是為了建立一家人工智能公司。
DeepMind對(duì)發(fā)刊管理的嚴(yán)格控制并不符合公司普遍存在的學(xué)術(shù)精神。一些研究人員抱怨說(shuō),發(fā)表他們的作品很困難:他們必須先進(jìn)行內(nèi)部審批,然后才能將工作提交給會(huì)議和期刊。DeepMind認(rèn)為,它需要謹(jǐn)慎行事,以避免嚇跑公眾,破壞AGI的前景。但過(guò)于緊張可能會(huì)開始惡化學(xué)術(shù)氛圍并削弱員工的忠誠(chéng)度。
在被Google收購(gòu)五年之后,DeepMind的控制權(quán)問(wèn)題被擺到了臺(tái)面上。該公司的創(chuàng)始人和早期員工即將獲利,而此時(shí)他們可以離開并拿到通過(guò)收購(gòu)獲得的經(jīng)濟(jì)補(bǔ)償(哈薩比斯的股票價(jià)值約為1億英鎊)。但一位與該公司關(guān)系密切的消息人士表示,Alphabet已將創(chuàng)始人的收益推遲了兩年。
哈薩比斯對(duì)此并不關(guān)注,所以不太可能跳槽。他金錢感興趣,只是因?yàn)榻疱X能助他實(shí)現(xiàn)自己的人生,但有些同事卻已經(jīng)離開了。自2019年初以來(lái),已有三名工程師離開,其中世界最著名的安全工程師之一Ben Laurie現(xiàn)已重返其前任雇主谷歌。DeepMind提供了這樣一個(gè)令人振奮的使命并且給員工的薪酬非常豐厚,按理來(lái)說(shuō)任何人都不該離開。
DeepMind的獨(dú)立性還能維持多久?
到目前為止,谷歌并沒有過(guò)多干涉DeepMind。但最近的一次事件引發(fā)了人們對(duì)該公司的擔(dān)憂:它還能維持多久的獨(dú)立性?
DeepMind一直計(jì)劃使用AI來(lái)改善醫(yī)療保健。 2016年2月,它成立了一個(gè)新部門:DeepMind Health。該部門由公司的聯(lián)合創(chuàng)始人之一Mustafa Suleyman領(lǐng)導(dǎo),而Suleyman的母親是NHS護(hù)士。他希望創(chuàng)建一個(gè)名為Streams的程序,當(dāng)患者的健康狀況惡化時(shí),該程序會(huì)通報(bào)給醫(yī)生。 DeepMind將獲得基于績(jī)效的費(fèi)用。由于這項(xiàng)工作需要訪問(wèn)有關(guān)患者的敏感信息,Suleyman建立了一個(gè)獨(dú)立審查小組(IRP),其中包括優(yōu)秀的英國(guó)醫(yī)療保健和技術(shù)人員。
DeepMind在護(hù)理上很智能。英國(guó)信息專員隨后發(fā)現(xiàn)其中一家合作醫(yī)院違反了關(guān)于處理患者數(shù)據(jù)的相關(guān)法律。盡管如此,到2017年底,Suleyman已經(jīng)與四家大型NHS醫(yī)院簽署了協(xié)議。
2018年11月8日,谷歌宣布創(chuàng)建了自己的醫(yī)療保健部門Google Health;五天后,又公布了將DeepMind Health納入其母公司的計(jì)劃。 而DeepMind在此之前似乎沒給相關(guān)醫(yī)療機(jī)構(gòu)提供任何預(yù)警。根據(jù)“信息自由”請(qǐng)求處理的原則,它僅提前三天向合作醫(yī)院提供了關(guān)于此次變更的通知。
DeepMind拒絕透露有關(guān)合并討論的開始時(shí)間,但它表示通知與公告之間的短暫時(shí)間差符合規(guī)定。
Suleyman在2016年寫道:“在任何情況下,患者數(shù)據(jù)都不會(huì)與谷歌的賬戶,產(chǎn)品或服務(wù)相關(guān)聯(lián)?!辈贿^(guò)他的承諾似乎已被打破。(針對(duì)1843年的問(wèn)題,DeepMind說(shuō):“在這個(gè)階段,我們的合同依然沒有被移至谷歌;而只有得到我們這邊的合作伙伴的同意,他們只能這樣做。Streams成為谷歌服務(wù)并不意味著患者數(shù)據(jù)......可被提供給其他Google產(chǎn)品或服務(wù)?!保?/p>
谷歌的吞并已激怒了DeepMind Health的員工。據(jù)知情人員說(shuō),一旦吞并完成,會(huì)有更多員工計(jì)劃離開公司。 IRP的一名成員Mike Bracken已經(jīng)離開了Suleyman。另外,據(jù)多位知情人士透露,Bracken于2017年12月已經(jīng)辭職,因?yàn)閾?dān)心該獨(dú)立審核小組更多的只是為了裝飾門面而非真正為了應(yīng)對(duì)隱私方面的漏洞。
當(dāng)Bracken問(wèn)Suleyman是否會(huì)給小組成員賦予非執(zhí)行董事的問(wèn)責(zé)制和治理權(quán)時(shí),Suleyman只是輕蔑一笑。 (DeepMind的發(fā)言人表示,他們對(duì)這一事件“沒有印象”。)IRP負(fù)責(zé)人Julian Huppert認(rèn)為,該小組提出的“更激進(jìn)的治理”比Bracken預(yù)期的要好,因?yàn)槌蓡T能夠公開發(fā)言而不受保密義務(wù)的約束。
這一插曲表明DeepMind操作的外圍運(yùn)營(yíng)易受谷歌影響。 DeepMind在一份聲明中表示,“我們都同意,通過(guò)增加資源,同心協(xié)力將這些努力結(jié)合在一起是有意義的。”這就引出了一個(gè)問(wèn)題,即Google是否會(huì)將相同的邏輯應(yīng)用于DeepMind的AGI工作上。
長(zhǎng)遠(yuǎn)來(lái)看,DeepMind已經(jīng)取得了很大的進(jìn)步。它已經(jīng)構(gòu)建了可以學(xué)習(xí)超人級(jí)別執(zhí)行任務(wù)的軟件。哈薩比斯經(jīng)常引用Breakout(Atari游戲機(jī)的視頻游戲)。一個(gè)Breakout玩家控制一個(gè)球拍,她可以在屏幕底部水平移動(dòng)該球拍,用它將一個(gè)球反彈到懸停在它上面的擋塊,在撞擊時(shí)摧毀它們。當(dāng)所有擋塊都被刪除時(shí),玩家獲勝。如果她用球拍錯(cuò)過(guò)了球,她就輸了。在沒有人工指導(dǎo)的情況下,DeepMind的程序不僅學(xué)會(huì)了玩游戲,而且還研究了如何將球加入到擋塊后面的空間中,利用籃板來(lái)打破更多的擋塊。哈薩比斯說(shuō),這證明了強(qiáng)化學(xué)習(xí)的力量和DeepMind計(jì)算機(jī)程序的超能力。
這是一個(gè)令人印象深刻的演示。但哈薩比斯漏掉了一些東西。如果虛擬球拍移動(dòng)得再高一點(diǎn),程序就將失敗。 DeepMind的程序?qū)W習(xí)的技能如此有限,以至于它甚至無(wú)法對(duì)環(huán)境中的微小變化做出反應(yīng),至少在沒有數(shù)千輪強(qiáng)化學(xué)習(xí)的情況下是這樣的。但是這個(gè)程序本身已經(jīng)內(nèi)置了這樣的訓(xùn)練。對(duì)智能診斷來(lái)說(shuō),沒有兩個(gè)身體器官是完全相同的。對(duì)智能機(jī)械來(lái)說(shuō),沒有任何兩個(gè)引擎可以以相同的方式進(jìn)行調(diào)整。因此,把在虛擬空間中完善的程序移植到外部現(xiàn)實(shí)世界的過(guò)程充滿了困難。
DeepMind很少談到的第二個(gè)警告是,虛擬環(huán)境中的成功取決于獎(jiǎng)勵(lì)功能的存在:允許軟件確認(rèn)其進(jìn)度的信號(hào)。程序知道從后墻上反彈能讓它的得分上升。 DeepMind與AlphaGo合作的大部分工作在于構(gòu)建一個(gè)能和這種復(fù)雜游戲相兼容的獎(jiǎng)勵(lì)功能。不幸的是,現(xiàn)實(shí)世界并不提供簡(jiǎn)單的獎(jiǎng)勵(lì)。進(jìn)展很少能純靠分?jǐn)?shù)來(lái)衡量。在存在此類措施的情況下,政治上的挑戰(zhàn)會(huì)使問(wèn)題復(fù)雜化。協(xié)調(diào)環(huán)境衛(wèi)生的獎(jiǎng)勵(lì)信號(hào)(大氣中每百萬(wàn)的二氧化碳顆粒數(shù)),或是協(xié)調(diào)石油公司的獎(jiǎng)勵(lì)信號(hào)(股價(jià)),都需要同時(shí)滿足許多動(dòng)機(jī)相互沖突的人。獎(jiǎng)勵(lì)信號(hào)往往非常微弱。人類大腦很少會(huì)在完成任務(wù)的過(guò)程中收到關(guān)于任務(wù)成功的明確反饋。
DeepMind與強(qiáng)化學(xué)習(xí)
DeepMind在消耗了大量計(jì)算機(jī)算力后,已經(jīng)找到了解決這個(gè)問(wèn)題的方法。 AlphaGo需要數(shù)千年的人類游戲時(shí)間來(lái)學(xué)習(xí)任何東西,許多AI思想家懷疑,對(duì)于報(bào)酬較低的任務(wù),這種解決方案是不可持續(xù)的。
DeepMind承認(rèn)存在這樣的含糊之處。它最近專注于星際爭(zhēng)霸2,一款電腦策略類游戲。在游戲早期所做的決定會(huì)在之后產(chǎn)生影響,這更接近于現(xiàn)實(shí)世界中許多任務(wù)所特有的那種復(fù)雜且延遲的反饋。今年1月,DeepMind軟件在一次演示中擊敗了一些全球頂尖的人類玩家,盡管演示受到了嚴(yán)格限制,但仍然令人印象深刻。它的程序也開始通過(guò)遵循人工任務(wù)主管的反饋來(lái)學(xué)習(xí)獎(jiǎng)勵(lì)功能,但將人工指令置于循環(huán)之中,可能會(huì)失去純計(jì)算機(jī)處理所能提供的規(guī)模和速度。
DeepMind和谷歌的現(xiàn)任和前任研究人員由于嚴(yán)格的保密協(xié)議被要求匿名,他們也對(duì)DeepMind能否通過(guò)這種方法達(dá)到AGI表示懷疑。對(duì)于這些人來(lái)說(shuō),專注于在模擬環(huán)境中獲得高性能使得獎(jiǎng)勵(lì)信號(hào)問(wèn)題難以解決。然而,這種方法是DeepMind的核心,它有一個(gè)內(nèi)部排行榜,在這個(gè)排行榜上,來(lái)自相互競(jìng)爭(zhēng)的程序員團(tuán)隊(duì)的程序在爭(zhēng)奪虛擬領(lǐng)域的控制權(quán)。
哈薩比斯一直將生活視為一種游戲。他職業(yè)生涯的很大一部分時(shí)間都致力于制作這些游戲,而大部分休閑時(shí)間則花在玩游戲上。DeepMind是他選擇用來(lái)開發(fā)AGI的工具,就像他的軟件一樣,哈薩比斯只能從自己的經(jīng)驗(yàn)中學(xué)習(xí)。
對(duì)AGI的追求可能最終會(huì)迷失方向,因?yàn)樗呀?jīng)發(fā)明了一些有用的技術(shù),并超越了世界上最偉大的棋盤游戲玩家。這些確實(shí)都是重大的成就,但并非他所渴望的。他仍然可以將AGI引入現(xiàn)實(shí)應(yīng)用,就在谷歌眼皮子底下卻不在其掌控內(nèi)。如果他這樣做,哈薩比斯將贏得的是最艱難的比賽。
-
谷歌
+關(guān)注
關(guān)注
27文章
6179瀏覽量
105744 -
人工智能
+關(guān)注
關(guān)注
1793文章
47567瀏覽量
239426 -
DeepMind
+關(guān)注
關(guān)注
0文章
131瀏覽量
10901
原文標(biāo)題:谷歌與DeepMind的控制權(quán)之戰(zhàn),剛剛開始
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論