來(lái)源:《中國(guó)人工智能學(xué)會(huì)通訊》
作者:雷濤
轉(zhuǎn)自:中國(guó)人工智能學(xué)會(huì)?
一、什么是人工智能
(一)圖靈測(cè)試
圖靈測(cè)試在 20 世紀(jì) 50 年代已經(jīng)提出,那時(shí)沒(méi)有計(jì)算機(jī)。圖靈測(cè)試指測(cè)試者與被測(cè)試者(一個(gè)人或一臺(tái)機(jī)器)隔開(kāi)的情況下,通過(guò)一些裝置(如鍵盤(pán))向被測(cè)試者隨意提問(wèn)。進(jìn)行多次測(cè)試后,如果機(jī)器讓平均每個(gè)參與者做出超過(guò) 30% 的誤判,那么這臺(tái)機(jī)器就通過(guò)了測(cè)試,并被認(rèn)為具有人類智能。以前有一些人可能不理解,但到今天就很明白,像小度音箱如果你連問(wèn)三次今天溫度怎樣,它的回答是一樣的;但你問(wèn)家人同一個(gè)問(wèn)題三遍,他的回答可能是“你是否有毛病 ? 一個(gè)問(wèn)題問(wèn)三遍”,這就是人和機(jī)器的區(qū)別。圖靈曾經(jīng)預(yù)測(cè),人類用 50 年左右的時(shí)間可能完成圖靈測(cè)試, 但是實(shí)際結(jié)果不太理想,人類用了 60 多年的時(shí)間才完成了圖靈測(cè)試。
(二)人工智能的應(yīng)用
人工智能的應(yīng)用領(lǐng)域非常廣泛,如人臉識(shí)別和跟蹤、遙感影像中的目標(biāo)檢測(cè)、醫(yī)學(xué)領(lǐng)域中的病灶識(shí)別和分類、材料領(lǐng)域的新材料發(fā)現(xiàn)。除此之外,人工智能在機(jī)器人領(lǐng)域的應(yīng)用更為廣泛 , 對(duì)機(jī)器人的發(fā)展而言 , 從機(jī)械角度來(lái)講,目前的機(jī)器人靈活度和穩(wěn)定度已經(jīng)做的非常好,比在機(jī)器人腦部方面的進(jìn)展要快 , 然而決定機(jī)器人水平的主要依據(jù)是其智能水平。這和人一樣,醫(yī)院神經(jīng)科的醫(yī)生地位通常更高,因?yàn)樯窠?jīng)科的病人特別多;且這些病相對(duì)來(lái)講比較難治療,因?yàn)槿四X結(jié)構(gòu)非常復(fù)雜。所以從人工智能類腦計(jì)算出發(fā),實(shí)現(xiàn)仿人機(jī)器人還有漫長(zhǎng)的路要走。
人工智能也是影視娛樂(lè)領(lǐng)域的一個(gè)重要話題,典型代表是 2004 年的好萊塢電影《我,機(jī)器人》,影片中對(duì)人工智能有超前認(rèn)識(shí),講的是機(jī)器和人最終的區(qū)別是情感區(qū)別。如果有一天機(jī)器也有情感會(huì)怎樣?顯然 , 推進(jìn)人工智能發(fā)展 , 預(yù)測(cè)人工智能的未來(lái)需要工科與人文社科研究人員共同努力和協(xié)調(diào)發(fā)展。
二、人工智能背后的技術(shù)原理
今天人工智能發(fā)展的如火如荼,核心原因是機(jī)器學(xué)習(xí)理論。我們要研究人工智能無(wú)非就是做一個(gè)仿人機(jī)器人,讓機(jī)器達(dá)到和人幾乎一樣的功能。人之所以聰明,最根本的原因是會(huì)學(xué)習(xí)。怎么教會(huì)機(jī)器學(xué)習(xí)?從我們小時(shí)候教育的過(guò)程就可以理解機(jī)器和人學(xué)習(xí)的過(guò)程。小學(xué)一年級(jí)學(xué)習(xí)加法時(shí),老師課后會(huì)布置大量作業(yè),做錯(cuò)了很正常 , 繼續(xù)修改就行;通過(guò)大量訓(xùn)練和糾錯(cuò) , 到小學(xué)三年級(jí)大家就掌握了加法的本質(zhì)原理 , 基本不會(huì)犯錯(cuò)了 , 那么學(xué)習(xí)的目的就達(dá)到了。
人對(duì)世界的認(rèn)知就是一個(gè)學(xué)習(xí)過(guò)程,這個(gè)學(xué)習(xí)有一個(gè)特點(diǎn)是小樣本學(xué)習(xí),需要較少的例子就可以學(xué)會(huì) ( 當(dāng)然存在特殊情況 , 智力有問(wèn)題的人通常難以有效學(xué)習(xí) )。比如人對(duì)貓和狗的識(shí)別,通??磶讖垐D片就認(rèn)識(shí)了。機(jī)器怎么學(xué)習(xí)?例如利用機(jī)器學(xué)習(xí)的方法可以對(duì)圖像進(jìn)行分類,然而當(dāng)模型過(guò)于簡(jiǎn)單(智力水平低)時(shí),訓(xùn)練好的模型只能識(shí)別常規(guī)的貓和狗,如果對(duì)圖像進(jìn)行各種退化處理或者尺度放縮及形變,模型往往會(huì)出錯(cuò),而人通??梢詰?yīng)對(duì)各種外界環(huán)境的干擾做出正確識(shí)別。這就說(shuō)明一個(gè)問(wèn)題,人的大腦學(xué)習(xí)是很聰明的過(guò)程,看兩三張照片就掌握了規(guī)律,是小樣本學(xué)習(xí)。機(jī)器要完成對(duì)貓和狗的正確識(shí)別,需要海量訓(xùn)練樣本(圖片),同一張圖在訓(xùn)練前需要做各種尺度、旋轉(zhuǎn)、仿射變換等(數(shù)據(jù)增強(qiáng)策略),只有輸入大量圖片機(jī)器才能有效掌握識(shí)別貓和狗的規(guī)律。如同班上聰明的學(xué)生通常只需做兩三道題就能掌握這種類型題,而智力水平低的學(xué)生需要做幾百道同類型的題才能掌握規(guī)律,當(dāng)前的機(jī)器學(xué)習(xí)好比智力水平較低的學(xué)生。
第二個(gè)區(qū)別,魯棒性。比如給機(jī)器一個(gè)辨別色盲的照片,機(jī)器大概率會(huì)出錯(cuò),因?yàn)樗鼞?yīng)對(duì)各種新情況能力較弱,而人應(yīng)對(duì)外界環(huán)境變化的能力遠(yuǎn)高于機(jī)器。目前的深度學(xué)習(xí)技術(shù)在魯棒性方面已經(jīng)有了明顯改進(jìn),比如人臉識(shí)別,回顧 10 年前的人臉識(shí)別系統(tǒng),戴口罩根本無(wú)法識(shí)別,而現(xiàn)在可以正確識(shí)別,說(shuō)明當(dāng)前的機(jī)器學(xué)習(xí)水平已經(jīng)比過(guò)去提高很多。機(jī)器學(xué)習(xí)還有一個(gè)重要概念是泛化能力,比如我現(xiàn)在認(rèn)識(shí)你,你帶了一個(gè)小伙子來(lái)了,我說(shuō)這是你兒子,因?yàn)楹湍汩L(zhǎng)的像;而機(jī)器通常對(duì)它沒(méi)有見(jiàn)過(guò)的東西,出錯(cuò)概率比人要高的多。如果我們訓(xùn)練好一個(gè)模型,機(jī)器可以對(duì)這張圖片進(jìn)行一個(gè)正確識(shí)別;而像漫畫(huà)形式的,機(jī)器出錯(cuò)的概率就非常高。
學(xué)習(xí)的過(guò)程就是總結(jié)規(guī)律、反復(fù)糾錯(cuò)的過(guò)程。小學(xué)生如果錯(cuò)一個(gè)字老師可能會(huì)讓他寫(xiě)幾十遍,說(shuō)明大腦可以被認(rèn)為是一個(gè)模型,這個(gè)模型本來(lái)不健全,通過(guò)不斷學(xué)習(xí),模型穩(wěn)定后就不再出錯(cuò),這是一個(gè)反復(fù)糾錯(cuò)的過(guò)程。機(jī)器也一樣,現(xiàn)在的人臉識(shí)別模型就是一個(gè)復(fù)雜函數(shù),里面有很多參數(shù),只要調(diào)整參數(shù)值整個(gè)判別函數(shù)就變了。所以,我們要學(xué)習(xí)模型里不同參數(shù)值,參數(shù)初始值是隨意給的,而機(jī)器學(xué)習(xí)在第一次的學(xué)習(xí)過(guò)程中(例如 1+1=3),錯(cuò)了就對(duì)參數(shù)進(jìn)行修改;第二次學(xué)習(xí)過(guò)程中又一個(gè)樣本學(xué)習(xí)錯(cuò)了(例如 2+5=9),繼續(xù)再修正參數(shù);一直下去,直到發(fā)現(xiàn)它能連續(xù)多次正確就不再修改模型里的參數(shù),這是學(xué)習(xí)的最基本過(guò)程。
圖 1 誤差函數(shù)的變化
機(jī)器學(xué)習(xí)涉及到的三要素是數(shù)據(jù)、模型和算法。比如要對(duì)一些圖片進(jìn)行識(shí)別,把貓識(shí)別出來(lái),就需要大量樣本,就好比學(xué)生學(xué)習(xí)需要大量題庫(kù),如果題庫(kù)都沒(méi)有做過(guò),怎么可能掌握基本知識(shí),所以樣本可以認(rèn)為是最基本的素材。進(jìn)入大數(shù)據(jù)時(shí)代,由于計(jì)算機(jī)成像技術(shù)的快速發(fā)展,獲取圖像、語(yǔ)音、文本的方式越來(lái)越簡(jiǎn)單,因此各種媒體數(shù)據(jù)量不斷增加。其次是模型。模型很簡(jiǎn)單,就是一個(gè)函數(shù)。例如,我們可以看到一個(gè)簡(jiǎn)單函數(shù)、一個(gè)復(fù)雜函數(shù),簡(jiǎn)單函數(shù)是線性的;復(fù)雜函數(shù)是非線性的。簡(jiǎn)單函數(shù)可以認(rèn)為是一個(gè)智力水平低的小孩,辨別能力差表現(xiàn)在這個(gè)分類的模型很簡(jiǎn)單;復(fù)雜模型類似于一個(gè)智力水平很高的科學(xué)家,對(duì)各種各樣的事都可以做出正確判斷和處理,這就是簡(jiǎn)單模型和復(fù)雜模型的區(qū)別。深度學(xué)習(xí)的過(guò)程就是要把簡(jiǎn)單模型變成復(fù)雜模型,這樣就不容易出錯(cuò)。機(jī)器學(xué)習(xí)最后一個(gè)要素是學(xué)習(xí)算法,例如同樣一個(gè)班的學(xué)生,為什么有的學(xué)生成績(jī)好,有的學(xué)生成績(jī)不好,就是因?yàn)閷W(xué)習(xí)方法不同,這是有差異的。在實(shí)際過(guò)程中也是一樣的,我們?cè)谟?xùn)練模型時(shí)用不同算法去做,效率不同,有時(shí)訓(xùn)練機(jī)器 2 小時(shí)就可以收斂,有時(shí)訓(xùn)練 10~20 個(gè)小時(shí)還不能收斂。所以,選擇一個(gè)很好的算法很重要。
(二)機(jī)器學(xué)習(xí)系統(tǒng)
以人臉識(shí)別為例,首先進(jìn)行數(shù)據(jù)收集,需要收集大量的人臉數(shù)據(jù),被稱為歷史數(shù)據(jù)。歷史數(shù)據(jù)包括訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù),訓(xùn)練數(shù)據(jù)相當(dāng)于我們平時(shí)做的題庫(kù);驗(yàn)證數(shù)據(jù)相當(dāng)于模擬考試。對(duì)模型學(xué)習(xí)的過(guò)程中就是對(duì)它的參數(shù)不斷進(jìn)行調(diào)整。調(diào)整的方法是,對(duì)錯(cuò)的東西進(jìn)行懲罰,不斷把錯(cuò)的東西變成正確的。等題庫(kù)里的題做完了就開(kāi)始驗(yàn)證,通過(guò)驗(yàn)證發(fā)現(xiàn)成績(jī)還是不行,說(shuō)明老師有問(wèn)題,或者說(shuō)家長(zhǎng)有問(wèn)題,或者學(xué)習(xí)的環(huán)境有問(wèn)題,這些外界因素就如同模型的超參數(shù)。通過(guò)調(diào)整這些超參數(shù)后再進(jìn)行學(xué)習(xí),直到成績(jī)可以了,就能夠參加最終測(cè)試。
機(jī)器學(xué)習(xí)里有很多種方法和工具,其中最核心的就是神經(jīng)網(wǎng)絡(luò)。生物學(xué)家發(fā)現(xiàn),人腦本身就是一個(gè)復(fù)雜網(wǎng)絡(luò),如何模擬人腦的網(wǎng)絡(luò)去工作,這是科學(xué)家一直奮斗的目標(biāo)。這方面的工作可以追溯到上世紀(jì)三四十年代,模擬人腦的功能網(wǎng)絡(luò)。從最早的感知器,到今天的深度學(xué)習(xí),其原理都是在模擬人的大腦工作機(jī)理。人的大腦大約有 860 億個(gè)神經(jīng)元?;谏窠?jīng)元的工作機(jī)理,數(shù)學(xué)家們將其抽象為人工神經(jīng)元數(shù)學(xué)模型,這是人腦工作最基本的機(jī)理,這個(gè)工作機(jī)理就是加權(quán)求和的過(guò)程。比如開(kāi)會(huì)投票,六個(gè)評(píng)委每個(gè)人打分,最后的打分結(jié)果不是直接求平均值,而是帶有權(quán)重的平均。由于線性運(yùn)算難以表達(dá)復(fù)雜模型,因此神經(jīng)元還涉及到是否激活的問(wèn)題,這個(gè)激活是個(gè)非線性運(yùn)算。因此一個(gè)神經(jīng)元首先通過(guò)加權(quán)求和的線性運(yùn)算;其次通過(guò)一個(gè)非線性運(yùn)算;最終輸出結(jié)果,這就是神經(jīng)元的最終工作流程。
神經(jīng)網(wǎng)絡(luò)經(jīng)歷了三次熱潮,同時(shí)也經(jīng)歷了二次寒冬。圖靈在 1936 年提出圖靈機(jī),人工智能從此開(kāi)始進(jìn)入第一次熱潮。隨著計(jì)算機(jī)技術(shù)的發(fā)展,人工智能也在不斷向前發(fā)展。到 1974 年經(jīng)歷了一次寒冬,因?yàn)樽钤绲纳窠?jīng)網(wǎng)絡(luò)只能對(duì)線性可分的數(shù)據(jù)進(jìn)行分類,學(xué)者們就認(rèn)為神經(jīng)網(wǎng)絡(luò)應(yīng)用具有較大的局限性,而專家系統(tǒng)可以解決更為復(fù)雜的問(wèn)題。直到 BP 神經(jīng)網(wǎng)絡(luò)出現(xiàn)后,其成功地解決了線性不可分?jǐn)?shù)據(jù)的正確分類,神經(jīng)網(wǎng)絡(luò)迎來(lái)了第二次熱潮。1987 年,由于神經(jīng)網(wǎng)絡(luò)需要更多的訓(xùn)練數(shù)據(jù),且識(shí)別精度有限,而支持向量機(jī)(SVM)是小樣本學(xué)習(xí)方法,且表現(xiàn)出更好的分類性能,因此神經(jīng)網(wǎng)絡(luò)一度被質(zhì)疑,進(jìn)入了第二次寒冬。直到 2006 年,因?yàn)樯窠?jīng)網(wǎng)絡(luò)層的設(shè)計(jì)不能太深,而人腦的工作機(jī)理是深層網(wǎng)絡(luò),中間的參數(shù)是指數(shù)級(jí)增長(zhǎng),計(jì)算量和模型的復(fù)雜性也都是指數(shù)級(jí)增長(zhǎng);以往的神經(jīng)網(wǎng)絡(luò)很難進(jìn)行深層設(shè)計(jì),原因在于無(wú)法進(jìn)行有效訓(xùn)練,而 Hinton 提出深度學(xué)習(xí)的概念,通過(guò)逐層訓(xùn)練結(jié)合微調(diào)的方式實(shí)現(xiàn)了深層網(wǎng)絡(luò)的訓(xùn)練,由此人工智能進(jìn)入了第三次黃金時(shí)代。
進(jìn)入深度學(xué)習(xí)時(shí)代后,人工智能迎來(lái)快速發(fā)展,在傳統(tǒng)的 BP 神經(jīng)網(wǎng)絡(luò)中,我們通常需要人工進(jìn)行特征提取,然后設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)分類或回歸。比如做人臉識(shí)別,實(shí)際上是想辦法把一個(gè)人臉的照片轉(zhuǎn)換成一個(gè)向量,在非深度學(xué)習(xí)的時(shí)代這個(gè)過(guò)程被稱為手工提取特征。提取人臉特征后,要對(duì)這些特征進(jìn)行分類,因此需要訓(xùn)練一個(gè)分類器,整個(gè)提取特征和特征分類分開(kāi)執(zhí)行,而深度學(xué)習(xí)可以把這兩個(gè)任務(wù)融為一體,讓機(jī)器全部自動(dòng)學(xué)習(xí)。尤其是怎么把人臉變成一個(gè)向量讓機(jī)器自己學(xué)習(xí),而不需要人幫助,這就是深度學(xué)習(xí)和傳統(tǒng)機(jī)器學(xué)習(xí)最本質(zhì)的區(qū)別,因?yàn)樗軌蜃詣?dòng)學(xué)習(xí),所以學(xué)習(xí)出來(lái)的特征往往比人工設(shè)計(jì)的特征要好很多。
深度學(xué)習(xí)是信息時(shí)代的必然產(chǎn)物。21 世紀(jì)是大數(shù)據(jù)時(shí)代,隨著成像技術(shù)的發(fā)展,我們對(duì)圖像數(shù)據(jù)、視頻數(shù)據(jù)和文本數(shù)據(jù)的獲取很容易,數(shù)據(jù)獲取方式更為簡(jiǎn)單,獲取大數(shù)據(jù)集變得越來(lái)越容易。有了數(shù)據(jù),還要有算力。所謂訓(xùn)練過(guò)程就是計(jì)算過(guò)程,以前訓(xùn)練一個(gè)模型要兩天,到現(xiàn)在 2 個(gè)小時(shí)就可以結(jié)束。有了數(shù)據(jù)和算力,還要有算法進(jìn)行支撐。進(jìn)入深度學(xué)習(xí)后,可以設(shè)計(jì)深度學(xué)習(xí)模型,尤其是各種學(xué)習(xí)理論做支撐。三者同時(shí)發(fā)展,就有了今天人工智能高速發(fā)展的結(jié)果。
深度學(xué)習(xí)的代表性方法是深度神經(jīng)網(wǎng)絡(luò)。深度神經(jīng)網(wǎng)絡(luò)最大的成功在于分層表達(dá),當(dāng)前的深度神經(jīng)網(wǎng)絡(luò)可以做到幾千層。層的作用就是認(rèn)知的過(guò)程,層越多模型就越復(fù)雜,表達(dá)能力就越強(qiáng)。比如進(jìn)行數(shù)字識(shí)別,第一層里對(duì)這個(gè)數(shù)字的認(rèn)識(shí)就是不同顏色塊,說(shuō)它有什么特征我不知道;第二層就有一種高級(jí)信息,有形狀和紋理;第三層就是高級(jí)語(yǔ)義信息。深度學(xué)習(xí)繁榮發(fā)展的歷程。李飛飛的主要貢獻(xiàn)是整理了一個(gè)圖像庫(kù) ImageNet,里面大概有1500萬(wàn)張圖像,而且對(duì)很多圖像做了標(biāo)注(共標(biāo)注了大約 120 萬(wàn)張圖像)。有了這個(gè)超級(jí)大庫(kù)后,學(xué)者們就可以驗(yàn)證深度學(xué)習(xí)的有效性。沒(méi)有大數(shù)據(jù)作支撐,無(wú)法驗(yàn)證各種深度模型的好壞。因此自 2010 年后,學(xué)者們相繼參加 ImageNet 比賽,直到 2017 年圖像分類錯(cuò)誤率已降到了非常低的量級(jí),比賽停止。
三、人工智能技術(shù)現(xiàn)狀
首先是數(shù)據(jù)的現(xiàn)狀,GPT 的訓(xùn)練數(shù)據(jù)大約 80萬(wàn)張網(wǎng)頁(yè),GPT-2 的訓(xùn)練數(shù)據(jù)大概 800 萬(wàn)張網(wǎng)頁(yè),GPT-3 的訓(xùn)練數(shù)據(jù)達(dá)到 45TB。大數(shù)據(jù)一旦到來(lái)后,只有大公司高投入才能做這樣的事情?,F(xiàn)在的機(jī)器學(xué)習(xí)方法有監(jiān)督式學(xué)習(xí)和非監(jiān)督式學(xué)習(xí)兩大類。所謂監(jiān)督式學(xué)習(xí)分為分類和回歸兩個(gè)問(wèn)題。回歸問(wèn)題預(yù)測(cè)的是一個(gè)數(shù)值,比如天氣預(yù)報(bào)、股票開(kāi)盤(pán)價(jià)預(yù)測(cè)。機(jī)器學(xué)習(xí)里的兩大任務(wù),無(wú)非就是分類問(wèn)題和回歸問(wèn)題。監(jiān)督學(xué)習(xí)類似于我們的課堂教育,由老師教給你,錯(cuò)了馬上指出,不斷讓你糾錯(cuò)。這樣的學(xué)習(xí)方式成本高,要交學(xué)費(fèi),還需要很多老師;非監(jiān)督學(xué)習(xí)相反,不需要老師、課堂,自學(xué)成才。通常非監(jiān)督學(xué)習(xí)不如監(jiān)督學(xué)習(xí),因?yàn)樽詫W(xué)成才的人較少,而且難度大。但是非監(jiān)督學(xué)習(xí)是我們奮斗的目標(biāo),讓機(jī)器能自動(dòng)學(xué)習(xí),而不是不斷教它。
介于監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)中間的是弱監(jiān)督學(xué)習(xí),其分為三種,第一種是不完整的監(jiān)督,做標(biāo)記時(shí)只有一部分進(jìn)行標(biāo)記。比如一套題庫(kù)中,10 套有答案,10 套沒(méi)有答案,這是不完整監(jiān)督。第二種是不確切監(jiān)督。給一個(gè)大概的答案,可以很具體地標(biāo)貓和狗,但也可以籠統(tǒng)地標(biāo)為動(dòng)物;類似于老師不教步驟,只講方法。第三種是不正確監(jiān)督,即老師也有講錯(cuò)題的時(shí)候。
深度學(xué)習(xí)繁榮發(fā)展。谷歌是全球最大的互聯(lián)網(wǎng)公司,一直走在人工智能領(lǐng)域的最前端,近年來(lái)先后提出了 Transformer、Bert 等。除了谷歌,2017 年微軟投入 10 億美金給 OpenAI 做研發(fā),從而促進(jìn)了該公司在人工智能領(lǐng)域的崛起,尤其是 GPT-3 的提出,實(shí)現(xiàn)了人工智能大踏步前進(jìn)。除了 OpenAI 公司,還有很多公司也做的非常好,例如蘋(píng)果、華為的諾亞方舟、京東的探索研究院等。
人工智能的發(fā)展可以分為弱人工智能、強(qiáng)人工智能和超人工智能三個(gè)層次。個(gè)人粗略認(rèn)為,2020年以前人工智能一直處于弱人工智能。所謂弱人工智能就是下棋、人臉識(shí)別這種單項(xiàng)任務(wù)。強(qiáng)人工智能就是類人的活動(dòng),尤其是多任務(wù)執(zhí)行,例如機(jī)器人可以實(shí)現(xiàn)自己編程序、語(yǔ)音聊天、自動(dòng)駕駛等?,F(xiàn)在已經(jīng)步入了強(qiáng)人工智能時(shí)代。未來(lái)的人工智能應(yīng)該步入的是超人工智能。所謂超人工智能就是在各領(lǐng)域全面超越人類,或者超過(guò)我們的大腦。
人工智能現(xiàn)在存在的問(wèn)題主要表現(xiàn)在三個(gè)方面,一是模型很大,參數(shù)量多,內(nèi)存消耗高;二是數(shù)據(jù)標(biāo)注成本較高;三是多任務(wù)執(zhí)行比較難。現(xiàn)在能見(jiàn)到的機(jī)器人有送菜機(jī)器人、巡警機(jī)器人、撿垃圾機(jī)器人,一個(gè)機(jī)器人能不能完成所有的功能?所以多任務(wù)執(zhí)行比較困難。最大問(wèn)題是它的計(jì)算量太大,耗能方面目前是一個(gè)嚴(yán)重問(wèn)題。AlphaGO 下一盤(pán)棋的電費(fèi)大約 3 000 美元。拋開(kāi) AlphaGO 我們看GPT-3,它的參數(shù)量是 1 750 億,人類只有大約 860億神經(jīng)元。這個(gè)模型訓(xùn)練一次成本很高,用電需要19 萬(wàn)度,碳排放是 8.5 萬(wàn)公斤,相當(dāng)于一輛車從月球開(kāi)到地球一個(gè)來(lái)回的碳排放。在碳中和的年代,如何發(fā)展人工智能?顯然未來(lái)我們需要有新的技術(shù)作支撐。
四、工智能技術(shù)的應(yīng)用
人工智能如果可以全面用于無(wú)人駕駛,會(huì)產(chǎn)生非常大的經(jīng)濟(jì)效益,但也可能存在很多問(wèn)題?,F(xiàn)在百度、小米都在造汽車,考慮的是未來(lái)的新能源及自動(dòng)駕駛,成本很低。人工智能在醫(yī)療領(lǐng)域,從商業(yè)價(jià)值來(lái)講是最有意義的一個(gè)應(yīng)用。在疾病預(yù)測(cè)和影像分析領(lǐng)域,人工智能已經(jīng)表現(xiàn)出明顯的優(yōu)勢(shì),尤其某些診斷已全面超過(guò)人類,如青光眼的篩查比人類專家水平還高。考慮到責(zé)任問(wèn)題,人工智能在醫(yī)學(xué)里只能作為輔助手段,為醫(yī)生提供各種參考,最終診斷由醫(yī)生確定。
成果應(yīng)用 1:智慧醫(yī)療
在智慧醫(yī)療方面,我們開(kāi)發(fā)了一套面向肝功能輔助評(píng)估的在線分析系統(tǒng),輸入病人肝臟影像后,直接可以打出結(jié)構(gòu)化報(bào)告,如果依賴人工去做,傳統(tǒng)方法需要 1~2 天才能完成。因此這套影像分析系統(tǒng)可以極大提高醫(yī)生的工作效率。
成果應(yīng)用 2:金屬及泡沫材料屬性分析
根據(jù)金屬材料掃描電鏡圖像,研究金屬材料單物理屬性,需要分析其中的孔洞分布,手動(dòng)去量通常非常困難,通過(guò)人工智能的方法可以做一個(gè)有統(tǒng)計(jì)意義的分析結(jié)果。我們利用計(jì)算機(jī)視覺(jué)技術(shù)成功幫助材料研究人員自動(dòng)分析金屬材料屬性,為他們提供非常客觀的測(cè)量數(shù)據(jù),誤差率降低了一個(gè)數(shù)量級(jí)。此外,對(duì)網(wǎng)狀結(jié)構(gòu)的泡沫材料(中間的孔洞更多)也可進(jìn)行智能分析。
成果應(yīng)用 3:智能地層驅(qū)油分析
通過(guò)給地層注入水(紅色是油的分布,藍(lán)色是水,背景是地層)后可以把油驅(qū)出,這就是采油的原理。實(shí)際中,研究人員把地層結(jié)構(gòu)做成芯片放到實(shí)驗(yàn)室,用照相機(jī)進(jìn)行拍照分析地層中水驅(qū)油的變化。我們做了一個(gè)智能系統(tǒng)可以分析油路走向,通過(guò)之前和之后的圖像對(duì)比,利用人工智能技術(shù)找出前后的變化趨勢(shì),找到油路的走向,幫助工作人員找到最佳取油路徑。
五、人工智能的未來(lái)
人工智能的未來(lái)是可信人工智能、超級(jí)深度學(xué)習(xí)和量子機(jī)器學(xué)習(xí)。
京東探索研究院聯(lián)合中國(guó)信通院在 2021 年發(fā)布了可信人工智能白皮書(shū)。為什么是可信人工智能?比如無(wú)人駕駛必須要識(shí)別街區(qū)場(chǎng)景,如果各種標(biāo)識(shí)牌上貼了小廣告,這種情況下智能車通常就會(huì)識(shí)別錯(cuò)誤,發(fā)生的后果可能會(huì)很嚴(yán)重。這個(gè)責(zé)任怎么去劃分?所以這方面有很多問(wèn)題,比如可信可視、多元包容等。
當(dāng)前,數(shù)據(jù)不斷在增長(zhǎng),模型參數(shù)也在增長(zhǎng),計(jì)算機(jī)的計(jì)算性能也在增長(zhǎng)。因?yàn)橛杏?jì)算性能做支撐,所以不害怕數(shù)據(jù)增長(zhǎng)和模型提升,未來(lái)的深度學(xué)習(xí)可以執(zhí)行的任務(wù)非常多,學(xué)習(xí)能力也很強(qiáng),能夠達(dá)到接近人的學(xué)習(xí)能力,最終實(shí)現(xiàn)整體人工智能產(chǎn)業(yè)鏈的布局。
量子機(jī)器學(xué)習(xí)。中國(guó)科技大學(xué)潘建偉教授開(kāi)發(fā)出國(guó)內(nèi)第一臺(tái)量子計(jì)算機(jī),其計(jì)算性能是現(xiàn)有計(jì)算機(jī)的 1 億倍。發(fā)展量子計(jì)算機(jī)是人工智能未來(lái)的方向,因?yàn)橛?jì)算效率高、功耗低。
六、結(jié)束語(yǔ)
“破山中賊易,破心中賊難”。發(fā)展科學(xué)技術(shù)比較容易,但人想戰(zhàn)勝內(nèi)心深處邪惡的想法比較困難,從技術(shù)角度的發(fā)展,人工智能技術(shù)一旦掌握在一些少數(shù)的有邪惡想法人的手里,人類就會(huì)面臨災(zāi)難。所以人工智能技術(shù)未來(lái)的發(fā)展,尤其是在倫理道德方面的發(fā)展,是我們要重點(diǎn)關(guān)注的方面。
審核編輯:湯梓紅
評(píng)論
查看更多