劉慈欣在《三體》中提到,即使北宋床弩的射程和機(jī)關(guān)槍差不多,但兩者在基本原理上的差距決定了它們之間的不同。蓋瑞·馬庫(kù)斯指出,只有建立一個(gè)全新的航道,才可能達(dá)到“可信的AI”這一目標(biāo)。馬庫(kù)斯系統(tǒng)性地闡述了對(duì)當(dāng)前AI研究界的批判,從認(rèn)識(shí)科學(xué)領(lǐng)域中針對(duì)性地給出了11條可執(zhí)行的建議。
第一,沒有銀彈——破除對(duì)“終極算法”的迷信
深度學(xué)習(xí)落入了“尋找銀彈”(銀彈在歐洲民間傳說中是吸血鬼和狼人克星,引申義為致命武器、殺手锏)的陷阱,用充滿“殘差項(xiàng)”和“損失函數(shù)”等術(shù)語的全新數(shù)學(xué)方法來分析世界,依然局限于“獎(jiǎng)勵(lì)最大化”的角度,而不去思考,若想獲得對(duì)世界的“深度理解”,整個(gè)體系中還需要引入哪些東西。
神經(jīng)科學(xué)告訴我們大腦是極為復(fù)雜的。真正擁有智慧和復(fù)雜性的系統(tǒng),很有可能像大腦一樣充滿復(fù)雜性。任何一個(gè)提出將智慧凝練成為單一原則的理論,或是簡(jiǎn)化成為單一“終極算法”的理論,都將誤入歧途。
第二,認(rèn)知大量利用內(nèi)部表征——人類的認(rèn)知不是從出生后的學(xué)習(xí)才開始,而是依賴于進(jìn)化留下的先天表征
從嚴(yán)格的技術(shù)意義上講,神經(jīng)網(wǎng)絡(luò)也具有表征,比如表示輸入、輸出和隱藏單元的向量,但幾乎完全不具備更加豐富的內(nèi)容。在經(jīng)典人工智能中,知識(shí)完全是由這類表征的積累所組成的,而推理則是建立在此基礎(chǔ)之上的。如果事實(shí)本身模糊不清,得到正確的推理就會(huì)難于上青天。外顯表征的缺失,也在DeepMind的雅達(dá)利游戲系統(tǒng)中造成了類似的問題。DeepMind的雅達(dá)利游戲系統(tǒng)之所以在《打磚塊》這類游戲的場(chǎng)景發(fā)生稍許變化時(shí)便會(huì)崩潰,原因就在于它實(shí)際上根本不表征擋板、球和墻壁等抽象概念。
沒有這樣的表征,就不可能有認(rèn)知模型。沒有豐富的認(rèn)知模型,就不可能有魯棒性。你所能擁有的只是大量的數(shù)據(jù),然后指望著新事物不會(huì)與之前的事物有太大的出入。當(dāng)這個(gè)希望破滅時(shí),整個(gè)體系便崩潰了。
在為復(fù)雜問題構(gòu)建有效系統(tǒng)時(shí),豐富的表征通常是必不可少的。DeepMind在開發(fā)以人類(或超人)水平下圍棋的AlphaGo系統(tǒng)時(shí),就放棄了先前雅達(dá)利游戲系統(tǒng)所采用的“僅從像素學(xué)習(xí)”的方法,以圍棋棋盤和圍棋規(guī)則的詳細(xì)表征為起步,一直用手工的機(jī)制來尋找走棋策略的樹形圖和各種對(duì)抗手段。
第三,抽象和概括在認(rèn)知中發(fā)揮著至關(guān)重要的作用
我們的認(rèn)知大部分是相當(dāng)抽象的。例如,“X是Y的姐妹”可用來形容許多不同的人之間的關(guān)系:瑪利亞·奧巴馬是薩沙·奧巴馬的姐妹,安妮公主是查爾斯王子的姐妹,等等。我們不僅知道哪些具體的人是姐妹,還知道姐妹的一般意義,并能把這種知識(shí)用在個(gè)體身上。比如,我們知道,如果兩個(gè)人有相同的父母,他們就是兄弟姐妹的關(guān)系。如果我們知道勞拉·英格斯·懷德是查爾斯·英格斯和卡羅琳·英格斯的女兒,還發(fā)現(xiàn)瑪麗·英格斯也是他們的女兒,那么我們就可以推斷,瑪麗和勞拉是姐妹,我們也可以推斷:瑪麗和勞拉很可能非常熟識(shí),因?yàn)榻^大多數(shù)人都和他們的兄弟姐妹一起生活過;兩人之間還可能有些相像,還有一些共同的基因特征;等等。
認(rèn)知模型和常識(shí)的基礎(chǔ)表征都建立在這些抽象關(guān)系的豐富集合之上,以復(fù)雜的結(jié)構(gòu)組合在一起。人類可以對(duì)任何東西進(jìn)行抽象,時(shí)間(“晚上10:35”)、空間(“北極”)、特殊事件(“亞伯拉罕·林肯被暗殺”)、社會(huì)政治組織(“美國(guó)國(guó)務(wù)院”“暗網(wǎng)”)、特征(“美”“疲勞”)、關(guān)系(“姐妹”“棋局上擊敗”)、理論(“馬克思主義”)、理論構(gòu)造(“重力”“語法”)等,并將這些東西用在句子、解釋、比較或故事敘述之中,對(duì)極其復(fù)雜的情況剝絲抽繭,得到最基礎(chǔ)的要素,從而令人類心智獲得對(duì)世界進(jìn)行一般性推理的能力。
第四,認(rèn)知系統(tǒng)是高度結(jié)構(gòu)化的
我們可以預(yù)期,真正的人工智能很可能也是高度結(jié)構(gòu)化的,在應(yīng)對(duì)給定的認(rèn)知挑戰(zhàn)時(shí),其大部分能力也將源自在正確的時(shí)間以正確的方式對(duì)這種結(jié)構(gòu)進(jìn)行利用。具有諷刺意味的是,當(dāng)前的趨勢(shì)與這樣的愿景幾乎完全相反?,F(xiàn)在的機(jī)器學(xué)習(xí)界偏向于利用盡可能少的內(nèi)部結(jié)構(gòu)形成單一同質(zhì)機(jī)制的端到端模型。
在某種程度上,這樣的系統(tǒng)從概念上來看更簡(jiǎn)單,用不著為感知、預(yù)測(cè)等分別設(shè)計(jì)單獨(dú)的算法。而且,初看起來,該模型大體上效果還算理想,有一部令人印象深刻的視頻似乎也證明了這一點(diǎn)。那么,既然用一個(gè)龐大的網(wǎng)絡(luò)和正確的訓(xùn)練集就能簡(jiǎn)單易行地達(dá)到目標(biāo),為什么還要將感知、決策和預(yù)測(cè)視為其中的獨(dú)立模塊,然后費(fèi)心費(fèi)力地建立混合系統(tǒng)呢?
問題就在于,這樣的系統(tǒng)幾乎不具備所需的靈活性。
在關(guān)鍵的應(yīng)用場(chǎng)景中,最優(yōu)秀的AI研究人員致力于解決復(fù)雜問題時(shí),常常會(huì)使用混合系統(tǒng),我們預(yù)期,這樣的情況在未來會(huì)越來越多。AI和大腦一樣,必須要有結(jié)構(gòu),利用不同的工具來解決復(fù)雜問題的不同方面。
第五,即便是看似簡(jiǎn)單的認(rèn)知,有時(shí)也需要多種工具
大腦也利用幾種不同的模式來處理概念,利用定義,利用典型特征,或利用關(guān)鍵示例。我們經(jīng)常會(huì)同時(shí)關(guān)注某個(gè)類別的特征是什么,以及為了令其滿足某種形式的標(biāo)準(zhǔn),必須符合什么條件。
AI面臨的一個(gè)關(guān)鍵挑戰(zhàn),就是在捕捉抽象事實(shí)的機(jī)制(絕大多數(shù)哺乳動(dòng)物是胎生)和處理這個(gè)世界不可避免的異常情況的機(jī)制(鴨嘴獸這種哺乳動(dòng)物會(huì)產(chǎn)卵)之間,尋求相對(duì)的平衡。通用人工智能既需要能識(shí)別圖像的深度學(xué)習(xí)機(jī)制,也需要能進(jìn)行推理和概括的機(jī)制,這種機(jī)制更接近于經(jīng)典人工智能的機(jī)制以及規(guī)則和抽象的世界。
要獲得適用范圍更廣的AI,我們必須將許多不同的工具組織在一起,有些是老舊的,有些是嶄新的,還有一些是我們尚未發(fā)現(xiàn)的。
第六,人類思想和語言是由成分組成的
在喬姆斯基看來,語言的本質(zhì),用更早期的一位語言學(xué)家威廉·馮·洪堡(Wilhelm von Humboldt)的話來說,就是“有限方法的無限使用”。借有限的大腦和有限的語言數(shù)據(jù),我們創(chuàng)造出了一種語法,能讓我們說出并理解無限的句子,在許多情況下,我們可以用更小的成分構(gòu)造出更大的句子,比如用單詞和短語組成上面這句話。如果我們說,“水手愛上了那個(gè)女孩”,那么我們就可以將這句話作為組成要素,用在更大的句子之中,“瑪麗亞想象水手愛上了那個(gè)女孩”,而這個(gè)更大的句子還可以作為組成要素,用在還要大的句子之中“克里斯寫了一篇關(guān)于瑪麗亞想象水手愛上了那個(gè)女孩的文章”,以這樣的方式接著類推,每一句話我們都可以輕松理解。
神經(jīng)網(wǎng)絡(luò)先驅(qū)學(xué)者杰弗里·欣頓一直在為他提出的“思維向量”而發(fā)聲。在深度學(xué)習(xí)中,每個(gè)輸入和輸出都可以被描述為一個(gè)向量,網(wǎng)絡(luò)中的每個(gè)“神經(jīng)元”都為相關(guān)向量貢獻(xiàn)一個(gè)數(shù)字。由此,許多年以來,機(jī)器學(xué)習(xí)領(lǐng)域的研究人員一直試圖將單詞以向量的形式進(jìn)行編碼,認(rèn)為任何兩個(gè)在意義上相似的單詞都應(yīng)該使用相似的向量編碼。
類似的技術(shù)被谷歌所采用,并體現(xiàn)在了谷歌最近在機(jī)器翻譯方面取得的進(jìn)展之中。那么,為什么不以這種方式來表征所有的思想呢?
因?yàn)榫渥雍蛦卧~不同。我們不能通過單詞在各類情況下的用法來推測(cè)其意思。例如貓的意思,至少與我們聽說過的所有“貓”的用法的平均情況有些許相似,或(從技術(shù)角度講)像是深度學(xué)習(xí)系統(tǒng)用于表征的矢量空間中的一堆點(diǎn)。但每一個(gè)句子都是不同的:John is easy to please(約翰很好哄)和John is eager to please(約翰迫不及待的想要取悅別人)并不是完全相似的,雖然兩句話中的字母乍看去并沒有多大區(qū)別。John is easy to please和John is not easy to please的意思則完全不同。在句子中多加一個(gè)單詞,就能將句子的整個(gè)意思全部改變。深度學(xué)習(xí)在沒有高度結(jié)構(gòu)化句子表征的情況下工作,往往會(huì)在處理細(xì)微差別時(shí)遇到問題。
這個(gè)例子告訴我們:統(tǒng)計(jì)數(shù)字經(jīng)常能近似地表示意義,但永遠(yuǎn)不可能抓住真正的意思。如果不能精準(zhǔn)地捕捉單個(gè)單詞的意義,就更不能準(zhǔn)確地捕捉復(fù)雜的思想或描述它們的句子。
第七,對(duì)世界的魯棒理解,既需要自上向下的知識(shí),也需要自下而上的信息
看一看這幅圖片。這是個(gè)字母,還是個(gè)數(shù)字?
很明顯,這幅圖片既可以是字母,也可以是數(shù)字,具體取決于它所在的上下文。
認(rèn)知心理學(xué)家將知識(shí)分為兩類:自下而上的信息,是直接來自我們感官的信息;還有自上而下的知識(shí),是我們對(duì)世界的先驗(yàn)知識(shí),例如,字母和數(shù)字是兩個(gè)不同的類別,單詞和數(shù)字是由來自這些類別之中的元素所組成的,等等。這種模棱兩可的B/13圖像,在不同的上下文中會(huì)呈現(xiàn)出不同的面貌,因?yàn)槲覀儠?huì)嘗試著將落在視網(wǎng)膜上的光線與合乎邏輯的世界相結(jié)合。
找到一種方法將自下而上和自上而下兩者整合為一體,是人工智能的當(dāng)務(wù)之急,卻常常被人忽視。
人類對(duì)任何一個(gè)概念的認(rèn)知,都取決于概念出現(xiàn)的上下文和其所屬的理論框架。識(shí)別出不同的應(yīng)用場(chǎng)景,不僅可以顯著減少所需數(shù)據(jù),還能夠讓AI變得更加可信任。如果AI可以區(qū)分畫中的一把刀和真實(shí)場(chǎng)景下的刀,就可以做出不同的反應(yīng)。
同時(shí),人類會(huì)對(duì)每個(gè)事物和人的個(gè)體分別進(jìn)行持續(xù)的觀察和跟蹤,以此來將不同時(shí)間點(diǎn)的數(shù)據(jù)進(jìn)行統(tǒng)一的分析。這也是AI需要向人類學(xué)習(xí)的方式。
第八,概念嵌于理論之中
嵌入在理論中的概念對(duì)有效學(xué)習(xí)至關(guān)重要。假設(shè)一位學(xué)齡前兒童第一次看到鬣蜥的照片。從此之后,孩子們就能認(rèn)出其他照片上的、視頻中的和現(xiàn)實(shí)生活中的鬣蜥,而且準(zhǔn)確率相當(dāng)高,很容易就能將鬣蜥與袋鼠甚至其他蜥蜴區(qū)分開來。同樣,孩子能夠從關(guān)于動(dòng)物的一般知識(shí)中推斷出,鬣蜥會(huì)吃東西,會(huì)呼吸,它們生下來很小,會(huì)長(zhǎng)大,繁殖,然后死去,并意識(shí)到可能有一群鬣蜥,它們看起來或多或少都有些相似,行為方式也相似。
沒有哪個(gè)事實(shí)是一座孤島。通用人工智能若想獲得成功,就需要將獲取到的事實(shí)嵌入到更加豐富的、能幫助將這些事實(shí)組織起來的高層級(jí)理論之中。
第九,因果關(guān)系是理解世界的基礎(chǔ)
深度學(xué)習(xí)能否成功,在嘗試之前是無法確證的,AlphaGo的設(shè)計(jì)者在設(shè)計(jì)之初也不確定能否取得如今的成績(jī),畢竟深度學(xué)習(xí)能夠找到的規(guī)律只是相關(guān)性,而非因果性。
圍棋的棋盤形式和游戲規(guī)則構(gòu)成了一個(gè)相對(duì)簡(jiǎn)單的因果模型,只有勝負(fù)的結(jié)果和單一的時(shí)間顆粒度,影響勝負(fù)的因素只有自己如何下棋。因此,和贏棋相關(guān)的走法,就等同于導(dǎo)致AI更強(qiáng)的算法改進(jìn)。
但現(xiàn)實(shí)中,尤其是在2B的應(yīng)用場(chǎng)景下,AI需要在多維度和長(zhǎng)時(shí)間尺度下,做出同時(shí)滿足多種評(píng)價(jià)標(biāo)準(zhǔn)的決策,此時(shí)相關(guān)性就不等同于因果性。
第十,我們針對(duì)逐個(gè)的人和事件進(jìn)行跟進(jìn)
你的另一半以前當(dāng)過記者,喜歡喝白蘭地,不那么喜歡威士忌。你的女兒以前特別害怕暴風(fēng)雨,喜歡吃冰激凌,沒那么喜歡吃曲奇餅。你車子的右后門被撞了個(gè)小坑,一年前你更換了車子的變速器。街角那家小商店,以前賣的東西質(zhì)量特別好,后來轉(zhuǎn)手給新老板之后,東西的質(zhì)量就一天不如一天。我們對(duì)世界的體驗(yàn),是由許多持續(xù)存在、不斷變化的個(gè)體組成的,而我們的許多知識(shí),也是圍繞著這些個(gè)體事物而建立起來的。不僅包括汽車、人物和商店,還包括特定的實(shí)體,及其特定的歷史和特征。
奇怪的是,這并非深度學(xué)習(xí)與生俱來的觀點(diǎn)。深度學(xué)習(xí)以類別為重點(diǎn),而不以個(gè)體為重點(diǎn)。通常情況下,深度學(xué)習(xí)善于歸納和概括:孩子都喜歡吃甜食,不那么喜歡吃蔬菜,汽車有四個(gè)輪子。這些事實(shí),是深度學(xué)習(xí)系統(tǒng)善于發(fā)現(xiàn)和總結(jié)的,而對(duì)關(guān)于你的女兒和你的車子的特定事實(shí),則沒什么感覺。
第十一,復(fù)雜的認(rèn)知生物體并非白板一塊
人工智能要獲得真正的進(jìn)步,首先要搞清楚應(yīng)該內(nèi)置何種知識(shí)和表征,并以此為起點(diǎn)來啟動(dòng)其他的能力。
我們整個(gè)行業(yè),都需要學(xué)習(xí)如何利用對(duì)實(shí)體對(duì)象的核心理解來進(jìn)一步了解世界,在此基礎(chǔ)之上構(gòu)建起系統(tǒng),而不是單純憑借像素和行為之間的相關(guān)性來學(xué)習(xí)一切,以此為系統(tǒng)的核心。我們所謂的“常識(shí)”,大部分是后天習(xí)得的,比如錢包是用來裝錢的、奶酪可以打成碎屑,但幾乎所有這些常識(shí),都始于對(duì)時(shí)間、空間和因果關(guān)系的確定感知。所有這一切的基礎(chǔ),可能就是表征抽象、組合性,以及持續(xù)存在一段時(shí)間(可以是幾分鐘,也可以是數(shù)十年)的對(duì)象和人等個(gè)體實(shí)體的屬性的內(nèi)在機(jī)制。如果機(jī)器想要學(xué)習(xí)尚無法掌握的東西,那么從一開始就需要擁有這樣的基礎(chǔ)。
-
算法
+關(guān)注
關(guān)注
23文章
4623瀏覽量
93110 -
AI
+關(guān)注
關(guān)注
87文章
31269瀏覽量
269632
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論