預(yù)測對經(jīng)濟(jì)和社會極其重要。金融、醫(yī)療、政治以及反恐、自然災(zāi)害預(yù)防等等領(lǐng)域,預(yù)測都有著不可替代的作用。然而,此前的研究表明,即便是最頂級的專家,在預(yù)測能力上也不一定比隨機(jī)概率更好。德勤7月26日發(fā)表最新報(bào)告,認(rèn)為大數(shù)據(jù)和AI會從根本上改變?nèi)祟惖念A(yù)測規(guī)則,帶來更好的預(yù)測能力,從而為企業(yè)帶來豐厚的利潤。文章也強(qiáng)調(diào),人工智能時代下的預(yù)測呼喚新的人機(jī)合作方式,也更需要“群體智能”。
智能機(jī)器時代,人類的判斷力
時下,商業(yè)和知識體系中的兩大主要趨勢為在復(fù)雜且快速變化的世界中進(jìn)行預(yù)測提供了互補(bǔ)性的洞見。一個是,過去40年間,心理學(xué)概率推理領(lǐng)域行為科學(xué)的研究揭示了一個驚人的發(fā)現(xiàn): 人們?nèi)粘5呐袛嗪皖A(yù)測很大程度上都是基于系統(tǒng)性的、帶有偏見的心理暗示,而不是根據(jù)證據(jù)進(jìn)行謹(jǐn)慎的評估。這些發(fā)現(xiàn)為決策研究帶來了根本性的啟示,從日常活動(物色棒球手和簽訂保險合同)到戰(zhàn)略(預(yù)測時間、價格和項(xiàng)目或商業(yè)創(chuàng)意的成功概率),再到生存(評估安全系數(shù)和恐怖襲擊風(fēng)險)。
其基本要義是:單獨(dú)的判斷對行動的指導(dǎo)是不可依賴的。心理學(xué)家Philip Tetlock曾花費(fèi)多年時間做過一個著名的實(shí)驗(yàn),其中頂級的記者、歷史學(xué)家和政治專家在預(yù)測政治事件,比如革命和政變上,并沒有比隨機(jī)選擇的普通人擁有更高的準(zhǔn)確率。
第二個趨勢是數(shù)據(jù)驅(qū)動的決策和人工智能應(yīng)用變得越來越無所不在。同樣的,這一次重要的經(jīng)驗(yàn)也是來自行為科學(xué)研究。早在20世紀(jì)50年代,一個研究小組就已經(jīng)證明:即使一個簡單的預(yù)測模型,在預(yù)測和決策方面的表現(xiàn)都比人類專家要更好。這帶來的啟示是,合理建造的預(yù)測模型通過幫助人類避開常見的認(rèn)知陷阱能增強(qiáng)人類智能。當(dāng)下,在招募棒球隊(duì)員(以及其他類型職業(yè))、簽訂銀行貸款和保險合同、對搶救室的病人進(jìn)行分類、安排事業(yè)單位工作人員、確定安全系數(shù)和評估電影劇本等方面,預(yù)測模型已經(jīng)得到了常規(guī)的應(yīng)用。“點(diǎn)石成金”(Moneyball for X)的例子正在變得越來越多。
最近,大數(shù)據(jù)的興起和人工智能的復(fù)興讓人類與機(jī)器能力的對比更加突出,也引起了更多的擔(dān)憂。網(wǎng)絡(luò)上規(guī)模數(shù)據(jù)庫可用性提高,讓工程師和數(shù)據(jù)科學(xué)家得以訓(xùn)練能夠完成文本翻譯、贏得游戲競賽、分辨照片中的人臉、識別語音、操作無人機(jī)和無人車的機(jī)器學(xué)習(xí)算法。由此產(chǎn)生的經(jīng)濟(jì)和社會影響是深刻而普遍的。最近,世界經(jīng)濟(jì)論壇(WEF)的一份報(bào)告預(yù)測,接下來的4年中,AI驅(qū)動的自動化和機(jī)器人將會減少超過500萬個工作崗位。
那么,預(yù)測本身會怎么樣?會有一天,計(jì)算機(jī)算法會代替做預(yù)測的這些專家嗎?研究這一問題要聚焦于預(yù)測的兩個本質(zhì)——數(shù)據(jù)科學(xué)和人類判斷,并且,二者是相互作用的,此外,還要關(guān)注機(jī)器智能的局限。
這里有好消息也有壞消息(取決于你的觀點(diǎn))。壞消息是:算法的預(yù)測有自身的局限,基于機(jī)器學(xué)習(xí)的AI方法不會完勝;人類的判斷在短期內(nèi)不會被自動地拋棄。好消息是,心理學(xué)領(lǐng)域和群體智慧現(xiàn)在提供了新的方法來對人類的判斷進(jìn)行改善和去偏見化。算法可以增強(qiáng)人類的判斷,但是不會全盤替代。同時,訓(xùn)練人們?nèi)绾胃玫刈黝A(yù)測以及把所有的判斷、匯集專家團(tuán)隊(duì)的零散信息進(jìn)行綜合,現(xiàn)在仍能達(dá)到更好的準(zhǔn)確率。
比如,我們預(yù)測你不會讀到這就停下來。
當(dāng)算法優(yōu)于專家
雖然這一話題最近才變得火熱,但是,早在20世紀(jì)50年代,心理學(xué)學(xué)術(shù)專家的研究已經(jīng)發(fā)現(xiàn),計(jì)算機(jī)算法在判斷上是強(qiáng)過主觀的人類的?!芭R床預(yù)測 VS 統(tǒng)計(jì)預(yù)測”領(lǐng)域由心理學(xué)家Paul Meehl開創(chuàng),他出版了一本“令人不安的小書”(他自己對書的稱呼)。記錄了20個研究案例,這些案例對著名人類專家和簡單的預(yù)測算法在預(yù)測上的對比,其中包括預(yù)測精神分裂患者會對電擊療法作何反應(yīng)、一名學(xué)生在大學(xué)里成功的可能性等等。Meehl的研究發(fā)現(xiàn),20個案例中,人類專家預(yù)測的準(zhǔn)確率被基于觀測數(shù)據(jù)的簡單算法全面超越。后續(xù)的研究更加壓倒性地證明了Meehl的發(fā)現(xiàn):有超過200個案例對專家和算法的預(yù)測進(jìn)行了對比,數(shù)據(jù)算法幾乎一直都比單獨(dú)的人類判斷要好。有少數(shù)幾個例子中,機(jī)器比人類表現(xiàn)得差,但是二者的準(zhǔn)確度非常接近。
認(rèn)知科學(xué)家Richard Nisbett 和 Lee Ross在評價中直言:“人類的判斷可不僅是比不上優(yōu)秀的回歸方程式,甚至是比不上所有的回歸方程式”。
Daniel Kahneman 在 《Think,F(xiàn)ast and Slow》中進(jìn)行了深入的總結(jié),對這些令人驚訝的發(fā)現(xiàn)進(jìn)行解釋。Kahneman的書提到了人類推理理論“雙重認(rèn)知過程”(dual process),在這兒,優(yōu)秀的認(rèn)知系統(tǒng)支撐起人類的判斷。系統(tǒng) 1 (Thinking fast)是自動化的和不用太多努力的,傾向于支持狹義的連貫故事,而不是基于證據(jù)的謹(jǐn)慎評價。系統(tǒng)2 (Think slow)是精細(xì)的、費(fèi)力的,專注邏輯和統(tǒng)計(jì)學(xué)的連續(xù)證據(jù)分析。我們?nèi)祟惖乃季S本質(zhì)上大多數(shù)時間都是在系統(tǒng)1中運(yùn)行的,從整體上看,這已經(jīng)足夠了,因?yàn)槲覀兠刻於家鰩装賯€決策。完全依賴于時間和能量消耗的系統(tǒng)2類的深思熟慮會讓人產(chǎn)生決策癱瘓。但是,這只是Kahneman、Amos Tversky 和其他后續(xù)者研究工作中發(fā)現(xiàn)幾點(diǎn)之一。從統(tǒng)計(jì)學(xué)上看,系統(tǒng)1的思維模式是非常糟糕的。
他們的主要的發(fā)現(xiàn)是,許多加入到系統(tǒng)1思維中的心理“經(jīng)驗(yàn)法則”(啟發(fā)式)是帶有系統(tǒng)性偏見的,其方式也是常常令人驚訝的。我們對于個人經(jīng)驗(yàn)太一概而論了,好像之前的經(jīng)驗(yàn)是我們解決眼前的難題唯一可用的信息一樣:把可能性的評估基于自己對相關(guān)場景進(jìn)行想象的難度、不重視選擇的風(fēng)險,選擇那些我們情感上已經(jīng)做出預(yù)先判斷的,并且,從整體上高估了我們的能力和判斷的精準(zhǔn)度。
很難評估這些研究在實(shí)際的商業(yè)上帶來的影響。所有的商業(yè)、醫(yī)療和公共服務(wù)中,決策都是核心環(huán)節(jié)。天然上存在偏見的系統(tǒng)1類型的決策占據(jù)主導(dǎo)地位,導(dǎo)致了長期的無效市場(即便有時候股價會很高),這也帶來了啟示:即便是不完美的預(yù)測模型和其他類型的數(shù)據(jù)產(chǎn)品,都能在利潤、安全和效率上帶來實(shí)質(zhì)的提升。
一個非常實(shí)際的提醒是,對于高利潤的商業(yè)分析創(chuàng)意來說, 完美數(shù)據(jù)或大數(shù)據(jù)并不是一個先決條件。這一邏輯幾乎被運(yùn)用到了所有的領(lǐng)域,在那些地方,人類專家通過主觀地權(quán)衡本可以量化和數(shù)據(jù)化的分析證據(jù),在穩(wěn)定的環(huán)境中反復(fù)做決策。這在《點(diǎn)石成金》這本書及電影中都有體現(xiàn)。由于系統(tǒng)1類的決策是統(tǒng)計(jì)學(xué)上是如此弱,通常,使用即便是受限的或者不完美的數(shù)據(jù),來對決策進(jìn)行去偏見化,就能獲得巨大的經(jīng)濟(jì)利益。
雖然這一邏輯在心理學(xué)學(xué)術(shù)研究中已經(jīng)擁有超過半世紀(jì)的基礎(chǔ),在商業(yè)世界中也變得非常常見,特別是《點(diǎn)石成金》出現(xiàn)以后,不過,它至今還沒有獲得全世界的擁護(hù)。比如,考慮到Michael Lewis的書從本質(zhì)上看是關(guān)于數(shù)據(jù)驅(qū)動的雇傭決策,可能有點(diǎn)諷刺的是,在大多數(shù)的機(jī)構(gòu)中,雇傭決策仍然普遍地受到主觀印象的影響,這些印象來自非正式的求職面試,雖然有大量的研究已經(jīng)證明了這些面試的局限性。
雖然即便簡單的算法在大體上都要好過單個專家的判斷,但處于以下幾個原因,它們不會“讓人類被代替”:第一,領(lǐng)域內(nèi)的專家(人事經(jīng)理、銀行貸款或者保險承銷人、物理學(xué)家、詐騙調(diào)查員、公共事業(yè)工作人員等等)是最好的信息來源。而且,數(shù)據(jù)特征一般不會自發(fā)地出現(xiàn)在數(shù)據(jù)庫中。數(shù)據(jù)科學(xué)家必須把它們進(jìn)行編碼,用于分析,這一過程一般需要聽取領(lǐng)域?qū)<液徒K端用戶的建議。第二,專家的判斷必須對于決定哪一個歷史數(shù)據(jù)對未來的數(shù)據(jù)分析會更有用,是必須的。
統(tǒng)計(jì)學(xué)家 Rob Hyndman擴(kuò)展了這幾點(diǎn),提出了要建立一個成功的預(yù)測模型必須要滿足的四個關(guān)鍵的預(yù)測要素:
我們理解并能衡量原因
有大量可用的歷史數(shù)據(jù)
預(yù)測本身不會影響要預(yù)測的事
從某種程度上看,未來于過去有一定的相似度
例如,標(biāo)準(zhǔn)的電力需求和天氣的預(yù)測就滿足了上面四個標(biāo)準(zhǔn),但是,要預(yù)測股價時,我們就沒有達(dá)到第二條。對這四個原則的評估,要求人類的判斷,而這是任何技術(shù)都不能自動化的。
最后,即使建立了模型并進(jìn)行了部署,不同情況下,模型的預(yù)測的可用性上,人類的判斷也還是有必要的。畢竟,模型并不是萬能的,除了把得到的信息組合以外,它們干不了其它的事。想象Meehl提出的“斷腿問題”:假設(shè)數(shù)據(jù)模型預(yù)測,Jim有90%的可能性會在明天晚上去看電影。雖然模型在總體上比人類準(zhǔn)確度更高,但是人類預(yù)測專家Nikhil知道Jim周末發(fā)生意外,腿折了。在這樣的情況下,Nikhil 就不會被采用模型的預(yù)測,然后建議電影院經(jīng)理最好不要給Jim保留位置。
這種情況在實(shí)際生活中用得很多,也是為什么模型能夠引導(dǎo)而不是替代人類專家的主要原因??偟恼f來,等式應(yīng)該是專家+算法》專家,而不是算法》專家。
當(dāng)然,這幾個規(guī)則都是大數(shù)據(jù)和時下的人工智能出現(xiàn)之前指定的。它們會很快過時嗎?
計(jì)算機(jī)還不能做什么
物聯(lián)網(wǎng)傳感器源源不斷產(chǎn)生的數(shù)據(jù)、云計(jì)算以及機(jī)器學(xué)習(xí)的發(fā)展,引起了人工智能的復(fù)興。而人工智能將有可能重塑人與計(jì)算機(jī)的關(guān)系。有句話說得好——數(shù)據(jù)是新的石油。計(jì)算機(jī)科學(xué)家Jon Kleinberg對此評論說,“這個詞本身是含糊的,但是它指代的事情是真的……大數(shù)據(jù)指的是將會改變一切事物的過程?!?/p>
一個基于大數(shù)據(jù)和機(jī)器學(xué)習(xí)的典型AI應(yīng)用就是谷歌翻譯。谷歌翻譯工具的開發(fā),不是將語言的基本規(guī)則編碼為計(jì)算機(jī)算法,而是從無數(shù)先前翻譯的文檔中提取詞語的關(guān)聯(lián)。隨著訓(xùn)練該算法的文本語料庫的增長,該算法也得到不斷的改進(jìn)。在他們的影響力的文章“數(shù)據(jù)的有效性不合理,”谷歌的研究員Alon Halevy、Peter Norvig和Fernando Pereira在他們頗具影響力的論文“The unreasonable effectiveness of data”中評論道:
簡單的模型和大量的數(shù)據(jù)總是勝過基于較少數(shù)據(jù)的復(fù)雜的模型……目前,統(tǒng)計(jì)翻譯模型主要包括大量的記憶短語表,這些短語表給出具體的源語言和目標(biāo)語言短語之間的可能映射。
他們的評論也與近年來公布的在AI取得的突破相關(guān)。計(jì)算機(jī)科學(xué)家 Kris Hammond說:“AI的核心技術(shù)并沒有發(fā)生重大改變,現(xiàn)在的核心技術(shù)幾乎與多年前的一樣。昔日的技術(shù)達(dá)不到要求,不是因?yàn)樵O(shè)計(jì)不足,而是因?yàn)樯形淳邆渌璧幕A(chǔ)和環(huán)境。”總之,AI過去與現(xiàn)在的最大區(qū)別是,必須的計(jì)算能力、原始數(shù)據(jù)和處理速度現(xiàn)在都有了,因此AI技術(shù)現(xiàn)在能大放異彩。
過去與現(xiàn)在共同的一個主題是,將模式識別技術(shù)應(yīng)用于用戶生成內(nèi)容的海量數(shù)據(jù)庫。拼寫檢查工具是在用戶自我更正的海量數(shù)據(jù)庫中訓(xùn)練的;能識別照片中人臉的深度學(xué)習(xí)算法是在數(shù)以百萬計(jì)的數(shù)字化存儲照片中訓(xùn)練的;擊敗了《危險邊緣》游戲節(jié)目的冠軍Ken Jennings和 Brad Rutter的計(jì)算機(jī)系統(tǒng)整合了大量適用于數(shù)字存儲文本的信息檢索算法。認(rèn)知科學(xué)家Gary Marcus指出,最后一個應(yīng)用之所以是可行的,那是因?yàn)榛卮稹段kU邊緣》出的題目的大多數(shù)知識都被電子存儲于其中。維基百科上說:“這主要是在數(shù)據(jù)檢索上的運(yùn)用,而大數(shù)據(jù)非常適合這一用途?!?/p>
這些發(fā)展數(shù)量之多、速度之快已經(jīng)引起一些人的推測——我們即將進(jìn)入一個新時代,那時機(jī)器的智能將超過人類的智能。雖然這個話題很大,但是我們需要弄清楚“智能”的本質(zhì)。如今的大數(shù)據(jù)和機(jī)器學(xué)習(xí)使得“智能”成為可能。AI的標(biāo)準(zhǔn)定義是“能夠完成通常由人類完成的任務(wù)的機(jī)器”。注意,這個定義適用于較為熟悉的數(shù)據(jù)科學(xué)應(yīng)用(比如,能夠自動承保貸款或簽立簡單的保險合同的評分模型)、能夠進(jìn)行語音翻譯和標(biāo)記照片的算法,以及自動駕駛汽車。
還有一件事也很突出:所有已經(jīng)發(fā)明的AI技術(shù),以及預(yù)計(jì)在未來有可能出現(xiàn)的,都是狹義的AI。例如,旨在翻譯文件的算法將無法標(biāo)記照片,反之亦然。而二者都不能用于駕駛汽車。這與Marvin Minsky、HerbertSimon等AI界先驅(qū)的最初目標(biāo)不同。他們想要制造通用AI:能像人類一樣理解的計(jì)算機(jī)系統(tǒng)。令人印象深刻的是,如今的AI技術(shù)在概念上更接近于信用評分算法,而非《2001太空漫游》中的超級電腦HAL9000或是由《機(jī)械姬》里有自我意識的機(jī)器人Ava。我們現(xiàn)在見到的都是狹隘AI。
回到本文的問題:預(yù)測一下,大數(shù)據(jù)和AI會從根本上改變規(guī)則還是會使人類的判斷過時?預(yù)測非常重要,它曾在2014年促使人們重新評估大數(shù)據(jù)的價值。一些分析家將谷歌流感趨勢(GFT)作為大數(shù)據(jù)取代傳統(tǒng)科學(xué)方法和數(shù)據(jù)分析的一個絕佳例子。當(dāng)時的想法是,谷歌可以利用人們與流感有關(guān)的搜索,實(shí)時追蹤流感爆發(fā)。這似乎能支持Chris Anderson,、Kenneth Cukier、 Viktor Mayer-Sch?nberger等專家的觀點(diǎn)。他們聲稱,當(dāng)獲得的數(shù)據(jù)足夠多時,“相關(guān)性就足夠了”,從而傳統(tǒng)的分析形式可以被尋找相關(guān)性的計(jì)算機(jī)算法取代。然而,在2013年流感季節(jié)時,GFT的預(yù)言被證明極其不準(zhǔn)確,大約有140%的誤差。分析家們開始質(zhì)疑他們的模型。計(jì)算社會科學(xué)家David Lazer及其聯(lián)合作者發(fā)表了一篇被廣泛引用的分析文章,從兩方面分析該算法最終失敗的原因。
算法動力學(xué)
谷歌一直在調(diào)整搜索引擎以提高搜索結(jié)果和用戶體驗(yàn)。然而,GFT假設(shè),搜索詞條與外部事件之間的關(guān)系是靜態(tài)的。在Rob Hyndman的話來說,這違反了“未來很大程度上重復(fù)過去這一假設(shè)”。
大數(shù)據(jù)的傲慢
通過在疾病控制和預(yù)防中心(CDC)的數(shù)據(jù)與數(shù)百萬計(jì)的搜索詞條之間建立相關(guān)性,GFT違反了Hyndman的四個可預(yù)測性關(guān)鍵因素中的第一個也是最重要的一個因素:了解數(shù)據(jù)關(guān)系背后的偶然因素。由于存在隨機(jī)可能性,結(jié)果出現(xiàn)過多的虛假相關(guān)性。雖然這是在數(shù)據(jù)科學(xué)所有分支中的一個關(guān)注焦點(diǎn),這一事件說明隱性假設(shè)的本質(zhì)是不可靠的,它使大數(shù)據(jù)忽視了傳統(tǒng)數(shù)據(jù)分析的形式的必要。
Lazer團(tuán)隊(duì)從此次失敗中得到的教訓(xùn)不是說社交媒體的數(shù)據(jù)對于預(yù)測疾病爆發(fā)是無用的。教訓(xùn)是,大數(shù)據(jù)和機(jī)器學(xué)習(xí)算法應(yīng)該被視為對人類判斷和傳統(tǒng)分析形式的補(bǔ)充,而非替代。
Philip Tetlock與Dan Gardner共同撰寫了In Superforecasting: The Art and Science of Prediction,討論以大數(shù)據(jù)為基礎(chǔ)的AI技術(shù)無法取代人的判斷。Tetlock報(bào)告了他與David Ferrucci的談話,F(xiàn)errucci領(lǐng)導(dǎo)工程團(tuán)隊(duì)開發(fā)了在《危險邊緣》游戲中獲勝的Watson系統(tǒng)。Tetlock提出了2個問題:
1. 哪兩位俄羅斯領(lǐng)導(dǎo)人在過去十年交換了工作?
2. 兩位俄羅斯最高領(lǐng)導(dǎo)人會在10年后交換工作嗎?
Tetlock指出,第一個問題考的是歷史事實(shí),許多在線文檔都有電子記,計(jì)算機(jī)算法可以使用模式識別技術(shù)找出答案。第二個問題需要猜測普京的意圖和俄羅斯政治的動態(tài)。Ferrucci對于計(jì)算機(jī)算法能在不確定的條件自動化這種判斷形式表示懷疑。隨著數(shù)據(jù)量的增加和機(jī)器學(xué)習(xí)方法的不斷改進(jìn),模式識別應(yīng)用將更好地模仿人類的推理過程,但Ferrucci說,模仿和表達(dá)意義、產(chǎn)生意義是不同的。Tetlock說,二者之間的差距有待人類判斷來補(bǔ)充。
數(shù)據(jù)越來越多,統(tǒng)計(jì)方法也在進(jìn)化,但是最終的結(jié)果也不會讓Paul Meehl感到驚訝。的確,計(jì)算機(jī)可以自動化某些傳統(tǒng)上只能由人類完成的任務(wù)。比如,信用評分在很大程度上替代了銀行信貸員的角色。但更普遍的是,計(jì)算機(jī)只能協(xié)助而不是取代人類在不確定的條件下做出
這就是說,人類與計(jì)算機(jī)合作的性質(zhì)很有可能發(fā)生變化。Tetlock引用“自由國際象棋”作為人機(jī)合作的典型例子,我們在未來可能會看到更多這樣的例子。Garry Kasparov(被IBM深藍(lán)計(jì)算機(jī)在在1996年擊?。?005年的自由國際象棋的討論就很好地說明了這種合作的可能性。Kasparov說:
比賽結(jié)束時出現(xiàn)了驚喜。獲勝者不是使用一臺最先進(jìn)計(jì)算機(jī)的大師,而是同時使用三臺計(jì)算機(jī)的一對美國業(yè)余棋手。他們操縱和“訓(xùn)練”計(jì)算機(jī)的技能能夠抗衡大師級別的對手具備的高超棋藝,以及其他參賽者更加強(qiáng)大的計(jì)算能力。能力弱的人+機(jī)器+較好的過程要勝過一臺強(qiáng)大的計(jì)算機(jī),而且,更勝過能力強(qiáng)的人+機(jī)器+較差的過程。
群體智能
因而,人機(jī)結(jié)合是提高我們在不確定性環(huán)境下做預(yù)測和判斷的能力的主要方式。另一種方法 是,改善判斷過程本身。這是群體智能(collective intelligence)的一個越發(fā)突出的研究主題。簡而言之,群體在搜集零散信息,以做出更好的判斷和決策上,比群體內(nèi)的任何個人都要好。
預(yù)測市場是混合式預(yù)測的一個例子。預(yù)測市場的邏輯反映了經(jīng)濟(jì)學(xué)家哈耶克的觀點(diǎn):市場機(jī)制的主要功能不在于促進(jìn)買賣,而是從個體搜集和綜合信息。
比如, Hollywood Stock Exchange是一個線上預(yù)測市場,人們使用虛擬貨幣來購買和銷售與電影相關(guān)的股票,它能以92%的準(zhǔn)確率預(yù)測出每年的奧斯卡獎。Information Aggregation Mechanism (IAM)是一個更加商業(yè)化的例子,由Caltech和惠普研究團(tuán)隊(duì)聯(lián)合開發(fā),其目標(biāo)是通過搜集“已有的個人的意見或者直覺類的細(xì)碎信息”來預(yù)測銷售量。在惠普幾個商業(yè)團(tuán)隊(duì)采用了IAM后,其預(yù)測準(zhǔn)確率超過了惠普官方的預(yù)測。
當(dāng)然,和金融市場一樣,預(yù)測市場也是不穩(wěn)定的。比如,經(jīng)濟(jì)學(xué)家Justin Wolfers 紀(jì)錄了谷歌預(yù)測市場的偏見,發(fā)現(xiàn)“在谷歌的股價上漲的時候,樂觀的預(yù)測會更加突出”,并且,員工間的預(yù)測有高度相關(guān),他們平時都坐得很近。
總之,利用高度組織化的智慧,能帶來判斷和預(yù)測力的提升。
由RAND公司在冷戰(zhàn)期間發(fā)展的Delphi方法,被用于預(yù)測軍事場景。Delphi是一個反復(fù)的思考過程,促使群體成員達(dá)成一個單一的預(yù)測。第一輪由各組員匿名提交自己個人的預(yù)測。第二輪,在第一輪預(yù)測的兩個四分點(diǎn)內(nèi)的結(jié)果中,由各組員再次選擇并作修正,這個過程一直進(jìn)行,直到得出一個統(tǒng)一的預(yù)測?,F(xiàn)在,產(chǎn)業(yè)、政治和醫(yī)療領(lǐng)域都已經(jīng)證明了這種預(yù)測方法的價值。
總之,利用高度組織化的智慧,能帶來判斷和預(yù)測力的提升。2011年,著名管理學(xué)家Philip Tetlock與人共同發(fā)起了Good Judgement Project(GJP),該項(xiàng)目受 Intelligence Advanced Research Projects Activity(IARPA)資助,IARPA 專門投資高回報(bào)、高風(fēng)險的研究項(xiàng)目。GJP專門預(yù)測中級緊急的事件,比如,希臘會退出歐元區(qū)嗎?
Tetlock和他的團(tuán)隊(duì)發(fā)現(xiàn):a) 一些人在預(yù)測水平上一直都好于平均水平;b)這些人都有突出的心理特征;c)教育和實(shí)踐能提高人們的預(yù)測能力。Tetlock稱,僅通過GJP的小冊子的訓(xùn)練,就能將個人的預(yù)測能力提升10%左右。
GJP每年都會選出前2%的超級預(yù)測者,這些人有一些共同的特點(diǎn),就是從“外部視角”而非“內(nèi)部視角作預(yù)測”。除了建立在堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)上這一特質(zhì)外,Tetlock還總結(jié)了超級預(yù)測家的一些共性:
不迷信,更相信概率論
開放,對新的證據(jù)保持歡迎
知識水平高
謙虛,愿意承認(rèn)錯誤并修改
對數(shù)字敏感
群體的預(yù)測水平可以在人事、并購、戰(zhàn)略評估、風(fēng)險管理、保險等方面等得到應(yīng)用。而提高群體預(yù)測能力,帶來的好處也是顯而易見的。
人類仍將是“決策過程中的一部分”
雖然預(yù)測模型和其他AI應(yīng)用能使一些任務(wù)變得自動化,但人類判斷全部交由算法負(fù)責(zé)這種情況幾乎不可能發(fā)生。更現(xiàn)實(shí)的方法是,使用數(shù)據(jù)科學(xué)和心理學(xué)不斷完善并提升人類的判斷質(zhì)量。當(dāng)數(shù)據(jù)十分充足,而世界的有關(guān)方面變化也相對較慢時,依靠統(tǒng)計(jì)學(xué)的方法進(jìn)行決策是恰當(dāng)且合理的。當(dāng)沒有數(shù)據(jù)或擁有的數(shù)據(jù)十分有限時,采用群體智慧和其他心理學(xué)方法能夠更好地進(jìn)行決策。
舉例來說,谷歌——一家建立在大數(shù)據(jù)和AI之上的公司——使用“群體智慧”和其他統(tǒng)計(jì)方法提升招聘員工的決策,其蘊(yùn)含的道理也是“輔助人類決策者,而非取代他們”。
在愈發(fā)涉及海量數(shù)據(jù)的情況下,“智能”AI應(yīng)用將把日程工作自動化,從而空出更多時間讓人類專家專注于需要他們專業(yè)判斷的工作,以及從事社會認(rèn)知(social perception)和共情等非認(rèn)識能力的行動。深度學(xué)習(xí)模型有可能讓醫(yī)療成像的某些過程自動化,這將使醫(yī)護(hù)人員有更多時間集中精力完成抽象的醫(yī)療問題,圍繞診療方案進(jìn)行策略規(guī)劃,以及提供共情服務(wù)。類似的,保險公司也可以使用深度學(xué)習(xí)系統(tǒng)將估算受損汽車的成本修理費(fèi)用變得自動化,讓人類保險雇員有更多時間完成更加復(fù)雜和需要更多經(jīng)驗(yàn)的客服。
未來我們還將借助心理學(xué)方法,以及數(shù)據(jù)科學(xué)、人工智能產(chǎn)品,繼續(xù)使用、依靠并且發(fā)揚(yáng)人類決策系統(tǒng)。但在可以預(yù)見的未來,人類仍將是“決策過程中的一部分”。至少我們是這樣預(yù)測的。
評論
查看更多