機(jī)器學(xué)習(xí)和互聯(lián)網(wǎng)意味著海量數(shù)據(jù)和復(fù)雜的聯(lián)系,同時(shí)也意味著人類無(wú)法理解的運(yùn)行過(guò)程——人工智能的“黑箱”是近期學(xué)界熱議的一個(gè)話題,當(dāng)我們無(wú)法理解算法和它生產(chǎn)出的內(nèi)容,它會(huì)怎樣改變?nèi)祟惖乃枷牒驼麄€(gè)世界的運(yùn)行?與此同時(shí),完全無(wú)法理解這些數(shù)據(jù)意味著什么的人工智能,真的是在分析世界嗎?技術(shù)發(fā)展伴隨而來(lái)的是人類對(duì)自身的懷疑,也許在未來(lái),關(guān)于世界的知識(shí)和對(duì)世界的理解之間的鴻溝會(huì)日漸加深。原文標(biāo)題為Machine Learning Widens the Gap Between Knowledge and Understanding,摘自David Weinberger的新書《日?;靵y:技術(shù)、復(fù)雜性以及我們?nèi)绾卧谝粋€(gè)充滿可能性的新世界中發(fā)展》(EVERYDAY CHAOS: Technology, Complexity, and How We’re Thriving in a New World of Possibility)。
Deep Patient的程序不知道被敲頭會(huì)讓人類感到頭暈,也不知道糖尿病人不應(yīng)該一次吃5磅的三角巧克力,它甚至不知道肱骨和腕骨相連。它只知道研究人員在2015年給它提供的東西:70萬(wàn)名患者的醫(yī)療記錄。這是一堆完全沒(méi)有可理解框架的混亂數(shù)據(jù)。
然而,在分析了這些數(shù)據(jù)之間的關(guān)系之后,Deep Patient不僅能夠診斷出個(gè)別患者罹患特定疾病的可能性(在某些情況下,它甚至比人類醫(yī)生更準(zhǔn)確),包括一些迄今為止完全無(wú)法預(yù)測(cè)的疾病。
如果你問(wèn)你的醫(yī)生,為什么Deep Patient認(rèn)為現(xiàn)在就開(kāi)始服用他汀類藥物或做個(gè)預(yù)防性手術(shù)可能比較明智,你的醫(yī)生可能沒(méi)法告訴你原因,但這不是因?yàn)樗?她不夠聰明,也不是因?yàn)樗?她醫(yī)術(shù)不高。Deep Patient是一種深度學(xué)習(xí)的人工智能(它本身就是機(jī)器學(xué)習(xí)的一種),盡管它不知道這些數(shù)據(jù)代表什么,但它可以發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系。
基于此,它組裝了一個(gè)信息點(diǎn)網(wǎng)絡(luò)——每個(gè)信息點(diǎn)都有權(quán)重,能夠決定它所連接的點(diǎn)有多大可能會(huì)“觸發(fā)”(該觸發(fā)會(huì)影響它們所連接的點(diǎn),就像觸發(fā)大腦中的神經(jīng)元一樣)。舉個(gè)例子,Deep Patient認(rèn)為,某個(gè)病人有72%的幾率患上精神分裂癥,想要理解它為什么會(huì)作出這樣的診斷,醫(yī)生就必須進(jìn)入這數(shù)百萬(wàn)個(gè)信息點(diǎn)以及它們之間的聯(lián)系和權(quán)重網(wǎng)絡(luò)之中——這實(shí)在是太多了,他們之間的關(guān)系也太復(fù)雜了。
當(dāng)然,作為一名患者,你可以選擇拒絕接受Deep Patient的概率性結(jié)論,但這樣做是有風(fēng)險(xiǎn)的。現(xiàn)實(shí)情況是,在某些情況下,Deep Patient比人類醫(yī)生的預(yù)測(cè)準(zhǔn)確得多,但是它完全無(wú)法解釋它的預(yù)測(cè),這是一種人工智能“黑箱”。
這也是未來(lái),遠(yuǎn)超醫(yī)學(xué)這一個(gè)領(lǐng)域。
你手機(jī)的導(dǎo)航系統(tǒng)、輸入預(yù)測(cè)、語(yǔ)言翻譯、音樂(lè)推薦等等功能都依賴于機(jī)器學(xué)習(xí)。
隨著人工智能變得越來(lái)越先進(jìn),它會(huì)越來(lái)越神秘。谷歌的AlphaGo對(duì)圍棋一無(wú)所知,“只是”從13萬(wàn)場(chǎng)有記錄棋局中分析出6000萬(wàn)步棋,但它依然擊敗了全世界排名最高的人類棋手。如果你研究AlphaGo的原理,想弄明白它為什么會(huì)下這一步棋而不是那一步棋,你可能只會(huì)看到數(shù)據(jù)之間一組復(fù)雜得難以形容的加權(quán)關(guān)系。AlphaGo可能無(wú)法用人類能夠理解的方式告訴你,為什么它會(huì)下這樣一步棋。
然而,AlphaGo的一步棋讓一些評(píng)論者啞口無(wú)言,圍棋大師樊麾說(shuō):“這不是人類的一步棋。我從來(lái)沒(méi)見(jiàn)過(guò)人類這么走?!比缓笏p輕地感嘆:“太美了,太美了?!?/p>
深度學(xué)習(xí)的算法之所以有效,是因?yàn)樗鼈儽热魏稳祟惗寄芨玫夭蹲降接钪娴膹?fù)雜性、流動(dòng)性,甚至是宇宙之美——每件事都在影響著其他事物,世界是普遍聯(lián)系的。
諸如機(jī)器學(xué)習(xí)這樣的工具和策略正越來(lái)越多地讓我們直面我們?nèi)粘I钪须y以理解的錯(cuò)綜復(fù)雜。但這種好處是有代價(jià)的:我們需要放棄我們對(duì)于理解世界和世界上發(fā)生的事情的堅(jiān)持。
膚淺理解
我們?nèi)祟愰L(zhǎng)期以來(lái)都有這樣的印象:如果我們能夠理解事物發(fā)生背后那不可改變的規(guī)律,我們就能夠完美地預(yù)測(cè)、計(jì)劃和管理未來(lái)。例如,如果我們知道天氣變化的原理,天氣預(yù)報(bào)就能告訴我們上班時(shí)是否要帶把傘;如果我們知道是什么讓人們?cè)贔acebook信息流中點(diǎn)擊這個(gè)帖子而不是另一個(gè)帖子,我們就能策劃出完美的廣告方案;如果我們知道流行病背后的發(fā)生機(jī)制,我們就能阻止它的傳播……通過(guò)發(fā)現(xiàn)支配我們世界的規(guī)律和模式,我們了解了事情是如何發(fā)生的,我們對(duì)理解世界感到義不容辭。
考慮到我們的知識(shí)總是不完善的,這個(gè)假設(shè)建立在一個(gè)更深?yuàn)W的假設(shè)之上:可知論。似乎我們與宇宙之間有一個(gè)不成文的約定,那就是如果我們足夠努力、足夠清晰地思考,宇宙就會(huì)交出它的秘密,因?yàn)橛钪媸强芍模辽僭谀撤N程度上是順從我們意志的。
但是現(xiàn)在,我們的新工具(特別是機(jī)器學(xué)習(xí)和互聯(lián)網(wǎng))讓我們認(rèn)識(shí)到我們周圍數(shù)據(jù)和信息的廣泛性,我們開(kāi)始接受世界的復(fù)雜性遠(yuǎn)遠(yuǎn)超過(guò)我們以往用來(lái)解釋它的法則和模型。我們創(chuàng)造的這些新的、容量大的機(jī)器比我們更接近于“理解世界”的層次。
而它們,作為機(jī)器,什么都不理解。
David Weinberger的《日?;靵y:技術(shù)、復(fù)雜性以及我們?nèi)绾卧谝粋€(gè)充滿可能性的新世界中發(fā)展》(EVERYDAY CHAOS: Technology, Complexity, and How We’re Thriving in a New World of Possibility)封面
這反過(guò)來(lái)又挑戰(zhàn)了我們?cè)诟顚哟紊铣钟械牧硪环N假設(shè):宇宙可知,是因?yàn)椋ㄎ覀兗僭O(shè))我們?nèi)祟愖銐颡?dú)特,能夠理解宇宙的運(yùn)行。至少?gòu)墓畔2畞?lái)人開(kāi)始,我們就認(rèn)為自己是上帝創(chuàng)造的獨(dú)一無(wú)二的生物,有能力接受上帝對(duì)真理的啟示。自古希臘以來(lái),我們就把自己定義為理性的生物,能夠看到世界表面混亂之下的邏輯和秩序。我們最基本的戰(zhàn)略依賴于我們和世界之間的這種特殊關(guān)系。
放棄人類這個(gè)物種的傳統(tǒng)自我認(rèn)知是無(wú)比痛苦的。感覺(jué)被信息過(guò)載壓碎,緊張地等待接下來(lái)的發(fā)生在商業(yè)、政府、文化中的混亂……這些情緒只是深層問(wèn)題的局部痛感:我們并不像我們認(rèn)為的那樣能很好地適應(yīng)我們的宇宙。我們的大腦無(wú)法像人工智能那樣準(zhǔn)確、快速地分析或預(yù)測(cè)事件。進(jìn)化給了我們適應(yīng)生存的思維,但這種思維只是順便發(fā)現(xiàn)了真相。我們的物種與眾不同,我們有情感、直覺(jué)、創(chuàng)造力,這種主張開(kāi)始變得過(guò)于一廂情愿,甚至有點(diǎn)絕望。
這種幻滅是我們應(yīng)該接受的——不僅僅是因?yàn)椴还芪覀兘邮芘c否,它都在發(fā)生。我們理解和管理未來(lái)的能力正開(kāi)始經(jīng)歷偉大飛躍:我們開(kāi)始制定相關(guān)策略,開(kāi)始考慮世界的復(fù)雜性,而不是總要把世界縮小到一個(gè)我們可以預(yù)測(cè)、控制、感到舒適的大小。
我們正在經(jīng)歷這一飛躍,因?yàn)樗呀?jīng)使我們能夠更高效、更有成效地與更多人、更多想法接觸,更有創(chuàng)意,更快樂(lè)。它已經(jīng)使我們?cè)谏虡I(yè)和個(gè)人生活中的許多最基本的想法和最習(xí)慣的做法重新語(yǔ)境化。它正在我們文化的每一個(gè)角落產(chǎn)生回響。
這些跡象在我們周圍隨處可見(jiàn),但在許多情況下,它們隱藏在看似正常且顯而易見(jiàn)的實(shí)踐和想法中。例如,在機(jī)器學(xué)習(xí)出現(xiàn)之前,互聯(lián)網(wǎng)已經(jīng)讓我們習(xí)慣了這些變化。
A/B測(cè)試之謎
當(dāng)巴拉克·奧巴馬(Barack Obama)第一次參加總統(tǒng)競(jìng)選時(shí),他在自己的網(wǎng)站上試用了兩個(gè)版本的注冊(cè)按鈕,結(jié)果發(fā)現(xiàn),與“現(xiàn)在加入我們(Join Us Now)”或“現(xiàn)在注冊(cè)(Sign Up Now)”此類按鈕名稱相比,標(biāo)有“了解更多(Learn more)”的按鈕吸引了更多的點(diǎn)擊。
另一項(xiàng)測(cè)試顯示,奧巴馬一家的一張黑白照片獲得的點(diǎn)擊量,出人意料地遠(yuǎn)超此前使用的彩色照片。
然后,他們?cè)谕豁?yè)面放入“了解更多”按鈕和黑白照片,結(jié)果是:注冊(cè)人數(shù)增加了40%。
總的來(lái)說(shuō),在競(jìng)選中,1300萬(wàn)郵件列表名單中將近三分之一的名單、大約7500萬(wàn)美元的捐款都是由于這樣的A/B測(cè)試提高了網(wǎng)站的表現(xiàn)。A/B測(cè)試即網(wǎng)站把一個(gè)廣告或內(nèi)容的不同版本分發(fā)給一定量的幾組隨機(jī)用戶,然后用測(cè)試結(jié)果來(lái)決定用戶最終將會(huì)看到哪個(gè)版本的內(nèi)容。
更令人驚訝的是,奧巴馬團(tuán)隊(duì)發(fā)現(xiàn),與純文本信息相比,奧巴馬在集會(huì)上煽動(dòng)群眾的視頻點(diǎn)擊率要低得多??紤]到奧巴馬作為演說(shuō)家的才能著實(shí)不一般,這種差異該怎么解釋啊?團(tuán)隊(duì)并不知道,他們也并不需要知道。數(shù)據(jù)告訴他們應(yīng)該在競(jìng)選網(wǎng)站上發(fā)布哪些內(nèi)容,即使沒(méi)有告訴他們?cè)?,他們也照做不誤。結(jié)果很好:更多的點(diǎn)擊、更多的捐款、可能更多的選票。
A/B測(cè)試已經(jīng)成為一種常見(jiàn)的實(shí)踐:谷歌的搜索結(jié)果是A/B測(cè)試的結(jié)果;Netflix上電影的布局來(lái)自A/B測(cè)試;甚至《紐約時(shí)報(bào)》使用的一些標(biāo)題也是A/B測(cè)試的結(jié)果……2014年至2016年,必應(yīng)的軟件工程師進(jìn)行了2.12萬(wàn)次A/B測(cè)試,其中三分之一的測(cè)試給服務(wù)帶來(lái)變化。
A/B測(cè)試有效果,甚至不需要懂它為什么有效。為什么在亞馬遜上,如果笑容燦爛的女性圖片在網(wǎng)頁(yè)左邊的話,該廣告會(huì)提高銷量呢?我們可以制造一個(gè)理論,但我們?nèi)匀唤ㄗh針對(duì)下一個(gè)廣告的位置進(jìn)行A/B測(cè)試。奧巴馬的黑白照片吸引了更多點(diǎn)擊,并不意味著他的對(duì)手約翰·麥凱恩(John McCain)也應(yīng)該棄用他的彩色照片。亞馬遜為戶外燒烤架進(jìn)行推廣活動(dòng)時(shí),使用藍(lán)色背景而不是綠色背景,這讓我們沒(méi)有理由認(rèn)為它有可能會(huì)適用于室內(nèi)燒烤。
事實(shí)上,影響人們偏好的因素完全有可能是微觀的、短暫的。也許50歲以上的男性更喜歡模特在左邊的廣告,但前提是廣告的標(biāo)題很有趣,而來(lái)自底特律的女性在兩天陰沉沉的天氣之后終于呼吸到燦爛的陽(yáng)光,她們這會(huì)兒更喜歡模特在右邊的廣告。也許有些人剛看完對(duì)比度強(qiáng)烈的視頻,他們現(xiàn)在更喜歡黑白照片,而其他人則可能因?yàn)檠蠡?duì)剛輸?shù)粢粓?chǎng)比賽而更喜歡彩色的版本。也許會(huì)出現(xiàn)一些能夠歸納的理論,也許不能,我們不知道。原因可能和世界本身一樣千差萬(wàn)別。
我們從小就相信,世界的真相和現(xiàn)實(shí)是由一些不可改變的規(guī)律來(lái)表達(dá)的。學(xué)習(xí)規(guī)律,你就能做出預(yù)測(cè)。發(fā)現(xiàn)新的規(guī)律,你就能預(yù)測(cè)更多的事情。如果有人想知道你是如何做出預(yù)測(cè)的,你可以向他們展示你所掌握的規(guī)律和數(shù)據(jù)。但是在A/B測(cè)試中,我們通常沒(méi)有心理框架來(lái)解釋為什么一個(gè)版本的廣告比另一個(gè)版本更好。
想想扔沙灘球。你認(rèn)為球?qū)⑾蚰闳拥姆较虺蕭佄锞€運(yùn)動(dòng),因?yàn)槲覀兊男睦砟P汀覀兯伎际挛锵嗷プ饔玫囊惶滓?guī)則——考慮了重力和動(dòng)能。如果球向另一個(gè)方向運(yùn)動(dòng)了,你也不會(huì)認(rèn)為模型錯(cuò)了,相反,你會(huì)認(rèn)為你沒(méi)有考慮到一些因素:也許你手滑了一下。
這正是我們?cè)贏/B測(cè)試中不需要做的事情。我們不需要知道為什么一張黑白照片和一個(gè)“了解更多”按鈕會(huì)增加競(jìng)選捐款。如果我們發(fā)現(xiàn)民主黨人的競(jìng)選廣告經(jīng)驗(yàn)對(duì)他/她的共和黨對(duì)手不起作用——他們很可能確實(shí)不會(huì)起作用——那也沒(méi)關(guān)系,因?yàn)樵僮鲆淮蜛/B測(cè)試就好,A/B很便宜。
A/B測(cè)試只是一個(gè)例子,它在不知不覺(jué)中向我們表明:原理、規(guī)律和歸納并不像我們想象的那么重要。也許,只是也許,當(dāng)我們無(wú)法處理現(xiàn)實(shí)的細(xì)枝末節(jié)時(shí),我們才會(huì)用到原理。
復(fù)雜性的有效性
我們剛剛看了兩個(gè)基于計(jì)算機(jī)的技術(shù)案例,它們完全不同:一個(gè)是編程技術(shù)(機(jī)器學(xué)習(xí)),另一個(gè)是全球性的空間(互聯(lián)網(wǎng)),我們?cè)诨ヂ?lián)網(wǎng)遇到更多的人,欣賞他們對(duì)意義和創(chuàng)造力的表達(dá)。當(dāng)然,這些技術(shù)通常是相互交織的:機(jī)器學(xué)習(xí)需要使用互聯(lián)網(wǎng)大規(guī)模收集信息,越來(lái)越多基于互聯(lián)網(wǎng)的服務(wù)同時(shí)使用、喂養(yǎng)機(jī)器學(xué)習(xí)。
這兩種技術(shù)至少有三個(gè)共同點(diǎn):巨大性、聯(lián)系性、復(fù)雜性,這三個(gè)共同點(diǎn)一直在教導(dǎo)我們世界是如何運(yùn)行的。
巨大性——即它們的規(guī)?!c我們參觀世界上最大的麻繩球故鄉(xiāng)或想象把世界上所有的土豆都堆在一起時(shí)完全不同。巨大性的重要性在于機(jī)器學(xué)習(xí)和互聯(lián)網(wǎng)能達(dá)到的細(xì)節(jié)水平。這兩種技術(shù)都依賴于細(xì)節(jié)和獨(dú)特性,而不是通過(guò)歸納或壓制“邊緣”信息和思想來(lái)擺脫細(xì)節(jié)。
聯(lián)系性意味著,這兩種技術(shù)所包含的各個(gè)部分可以相互影響,而無(wú)需顧慮物理距離造成的障礙。聯(lián)系性對(duì)這兩種技術(shù)至關(guān)重要:只能連接兩個(gè)部分、一次只能連接一對(duì)的網(wǎng)絡(luò)可不能叫做互聯(lián)網(wǎng),只能叫做舊的電話系統(tǒng)。我們新技術(shù)的聯(lián)系性是規(guī)模巨大的、多途徑的、無(wú)距離的,也是必不可少的。
機(jī)器學(xué)習(xí)和互聯(lián)網(wǎng)的巨大性和聯(lián)系性導(dǎo)致了它們的復(fù)雜性。規(guī)模巨大的碎片之間的聯(lián)系有時(shí)會(huì)導(dǎo)致一連串的事件,而這些事件的結(jié)局可能與它們開(kāi)始的地方相去甚遠(yuǎn)。微小的差異可能導(dǎo)致這些系統(tǒng)出現(xiàn)意想不到的巨大轉(zhuǎn)折。
我們不是因?yàn)檫@些技術(shù)的巨大性、聯(lián)系性、復(fù)雜性而使用這些技術(shù),我們使用它們是因?yàn)樗鼈冇行?。我們利用這些技術(shù)的成功——而不是技術(shù)本身——向我們展示了世界比我們想象的更加復(fù)雜和混亂,這反過(guò)來(lái)鼓勵(lì)我們探索新的方法和策略,挑戰(zhàn)我們對(duì)理解和解釋的本質(zhì)和重要性的假設(shè),并最終引導(dǎo)我們對(duì)世界有一個(gè)新的認(rèn)識(shí)。
-
人工智能
+關(guān)注
關(guān)注
1792文章
47514瀏覽量
239247 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8428瀏覽量
132845
原文標(biāo)題:機(jī)器學(xué)習(xí)加深了“知識(shí)”和“理解”之間的鴻溝
文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論