近日,人工智能領(lǐng)域傳來(lái)好消息——美國(guó)計(jì)算機(jī)學(xué)會(huì)宣布將2018年圖靈獎(jiǎng)?lì)C發(fā)給深度學(xué)習(xí)領(lǐng)域三位先驅(qū)——約書亞·本吉奧、杰弗里·辛頓和雅恩·勒昆,以褒獎(jiǎng)他們推動(dòng)深度神經(jīng)網(wǎng)絡(luò)成為計(jì)算機(jī)技術(shù)的重要組成部分。感謝他們拯救了AI、改變了世界。
之前,業(yè)內(nèi)有人提出“深度學(xué)習(xí)已死”的基調(diào),讓深度學(xué)習(xí)的熱度大大下降,而此消息一出,猶如按下重啟鍵,人們?cè)俅螌⒛抗怄i定深度學(xué)習(xí)。那么,作為人工智能的一種形式,目前深度學(xué)習(xí)如何突破瓶頸,迎接新一代人工智能的到來(lái)?讓我們聽聽國(guó)內(nèi)外專家如何說(shuō)。
已然改變?nèi)藗兩?/h2>
事實(shí)上,用深度學(xué)習(xí)進(jìn)行分析的目的在于識(shí)別真實(shí)數(shù)據(jù)中的真實(shí)模式。如果這種建設(shè)性能力可應(yīng)用于總結(jié)經(jīng)驗(yàn)、設(shè)計(jì)方案以及記錄歷史,甚至能夠以驚人的逼真性反饋于人們的身體,那么現(xiàn)實(shí)與幻想之間的界線將變得非常模糊。
“深度學(xué)習(xí)雖然有種種局限,但在很多領(lǐng)域已然切切實(shí)實(shí)發(fā)揮作用,比如在語(yǔ)音識(shí)別、機(jī)器翻譯等,這是一些可算作‘無(wú)限但可枚舉’(Infinite but enumerable)的數(shù)據(jù)對(duì)象。在這些領(lǐng)域中,訓(xùn)練數(shù)據(jù)集及其變種可以包括大部分我們可能遇到的實(shí)際數(shù)據(jù),深度學(xué)習(xí)可以解決。”新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟聯(lián)合秘書長(zhǎng)、科大訊飛副總裁兼AI研究院聯(lián)席院長(zhǎng)李世鵬在接受科技日?qǐng)?bào)記者采訪時(shí)指出。
他說(shuō):“而另外一些領(lǐng)域則屬于‘無(wú)限也不可枚舉’的數(shù)據(jù)對(duì)象,比如說(shuō)自動(dòng)駕駛場(chǎng)景下的各種環(huán)境圖像和視頻,計(jì)算機(jī)視覺中通用識(shí)別問題的數(shù)據(jù)對(duì)象等。這些問題,深度學(xué)習(xí)可能會(huì)解決其中某些子問題,但整體來(lái)看,會(huì)出現(xiàn)不久前全球人工智能計(jì)算機(jī)視覺領(lǐng)域奠基人之一艾倫·尤爾教授所提及‘深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域已至瓶頸’的問題?!?/p>
“實(shí)際上,深度學(xué)習(xí)主要依賴于大量的數(shù)據(jù)和數(shù)據(jù)標(biāo)注。在醫(yī)療領(lǐng)域,可對(duì)采集到上萬(wàn)個(gè)病例數(shù)據(jù)庫(kù)的醫(yī)學(xué)影像進(jìn)行分析,供放射學(xué)和病理學(xué)方面訓(xùn)練,幫助醫(yī)生做出更為精準(zhǔn)高效的診斷,實(shí)現(xiàn)大規(guī)模應(yīng)用。不過,對(duì)于應(yīng)用本身其是受限的,因?yàn)楹芏囝I(lǐng)域并無(wú)那么多數(shù)據(jù),也沒太多真正意義上的訓(xùn)練。如在自動(dòng)駕駛領(lǐng)域,正常駕駛很多的數(shù)據(jù)可以采集到,但有些非正常數(shù)據(jù)像事故方面卻很難采集?!?遠(yuǎn)望智庫(kù)人工智能事業(yè)部部長(zhǎng)、圖靈機(jī)器人首席戰(zhàn)略官譚茗洲認(rèn)為。
法國(guó)泰雷茲集團(tuán)首席技術(shù)官馬克·厄曼表示:“在眾多的人工智能技術(shù)中,深度學(xué)習(xí)是為我們所熟知的一種。當(dāng)你擁有大量的數(shù)據(jù)和少量知識(shí)的時(shí)候,它是一種非常強(qiáng)大的技術(shù)。例如,人臉識(shí)別,但是這需要采集大量的圖像來(lái)訓(xùn)練。在許多情況下,用于學(xué)習(xí)的數(shù)據(jù)庫(kù)極為龐大,有時(shí)候需要千萬(wàn)甚至幾億數(shù)據(jù)。學(xué)習(xí)方法也有快慢之別,但是本質(zhì)上來(lái)說(shuō),它不及人類大腦聰明?!?/p>
可行方法揚(yáng)長(zhǎng)避短
“深度學(xué)習(xí)肯定不是解決通用人工智能問題的全部,但是人類探索機(jī)器智能的必經(jīng)之路。我們應(yīng)該意識(shí)到現(xiàn)在深度學(xué)習(xí)的一些限制,要做的是揚(yáng)長(zhǎng)避短——用可行的方法解決現(xiàn)在可以解決的問題?!崩钍砾i指出。
如何解決數(shù)據(jù)短缺問題?李世鵬說(shuō),目前很多科學(xué)家在對(duì)此研究。一類是從數(shù)據(jù)源方面解決,比如,借助更高效的數(shù)據(jù)標(biāo)注工具幫助人快速獲取更多標(biāo)注數(shù)據(jù)、用對(duì)抗網(wǎng)絡(luò)生成數(shù)據(jù)等;一類是從深度學(xué)習(xí)算法本身改進(jìn),比如遷移學(xué)習(xí)、少樣本學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和弱監(jiān)督學(xué)習(xí)等。
我們看到,AI在自動(dòng)駕駛領(lǐng)域若達(dá)到99.9%的準(zhǔn)確率,也意味著很多次駕駛活動(dòng)中可能出現(xiàn)一次機(jī)器不能處理或者不能處理得很好的例子。這是否說(shuō)明自動(dòng)駕駛就不能做了?“當(dāng)然不是。解決方法是通過人機(jī)耦合來(lái)實(shí)現(xiàn)穩(wěn)定可靠的人工智能?!崩钍砾i答道。
李世鵬解釋道,今天的人工智能即使在可以發(fā)揮得很好的領(lǐng)域,也不是百分之百可靠。在一些不是很關(guān)鍵的領(lǐng)域,某些AI技術(shù)也許是可用甚至好用,但在某些關(guān)鍵領(lǐng)域卻遠(yuǎn)遠(yuǎn)不能符合要求。因此,不要把人工智能當(dāng)作萬(wàn)全技術(shù),在設(shè)計(jì)一個(gè)產(chǎn)品或者系統(tǒng)時(shí),要充分考慮機(jī)器失敗的時(shí)候,人類怎么能很好地接手。
具體而言涉及兩個(gè)問題:一是系統(tǒng)如何識(shí)別什么情況下它處理不好,就是說(shuō)在AI給出某種決定的同時(shí),也給出做此決定的可信度。在可信度很低的情況下,是否可以喚醒人類接應(yīng)?
另一個(gè)是人機(jī)如何和諧地在一起工作,這涉及到用戶體驗(yàn)設(shè)計(jì)和AI的結(jié)合。至少AI在現(xiàn)階段還只是作為提高人類效率的工具,所以在用戶體驗(yàn)設(shè)計(jì)中應(yīng)該做到不需要人時(shí)刻盯著,但在有狀況時(shí)應(yīng)及時(shí)提醒反饋給人類無(wú)縫接手。
探索未來(lái)突破之路
國(guó)內(nèi)外專家表示,盡管人工智能的發(fā)展水平令人矚目,但目前的人工智能系統(tǒng)有一定智商沒情商、會(huì)計(jì)算不會(huì)“算計(jì)”、有專才無(wú)通才。就目前既有的解決方法,還不夠具有革命性,要讓未來(lái)的AI更“智慧”,需要加強(qiáng)對(duì)人類大腦等方面的研究,探索突破深度學(xué)習(xí)瓶頸之路。
“尤爾等指出的組合模型訓(xùn)練及用組合數(shù)據(jù)測(cè)試,實(shí)質(zhì)上應(yīng)該認(rèn)為是個(gè)分解過程,但難點(diǎn)就在于分解。就像計(jì)算機(jī)視覺里最難的問題是圖像或物體分割一樣,這本身可能需要更多高層次上的語(yǔ)義理解。更具顛覆性的方法是賦予AI引擎一些推理功能,即使沒有見過的數(shù)據(jù),也能通過推理進(jìn)行解決。”李世鵬指出。
李世鵬進(jìn)一步說(shuō),腦科學(xué)和認(rèn)知科學(xué)的發(fā)展給我們很多啟示,MIT等一些大學(xué)院所的科學(xué)家正沿著這條路徑探索。其實(shí),上世紀(jì)90年代盛行的專家系統(tǒng)很多時(shí)候就是給機(jī)器一些規(guī)則(推理法制),讓機(jī)器按規(guī)則去推理從而解決一些問題。但專家系統(tǒng)的問題是規(guī)則制定本身是件很麻煩的事,遠(yuǎn)不及今天數(shù)據(jù)標(biāo)注來(lái)得簡(jiǎn)單。將來(lái)的思路可能是需要深度學(xué)習(xí)從大數(shù)據(jù)中歸納出一些可以解釋的規(guī)則,然后,將它們應(yīng)用到新的數(shù)據(jù)中去解決問題。知識(shí)圖譜和深度學(xué)習(xí)的結(jié)合也許是這條路線的一個(gè)實(shí)用分支。
在某些方面,我們發(fā)現(xiàn)深度學(xué)習(xí)如同挖掘機(jī)一樣,能夠采集相當(dāng)多的數(shù)據(jù),然而,卻不像小孩子那樣,不需要千萬(wàn)次的學(xué)習(xí)即會(huì)認(rèn)出自己的母親。
厄曼說(shuō),這是因?yàn)閷?shí)際上孩子認(rèn)媽媽是將多種信息混合在一起判定,其中包括形象、氣味、身體接觸、出生記憶以及許多復(fù)雜因素。盡管深度學(xué)習(xí)是受到生物啟發(fā),基于我們所說(shuō)的神經(jīng)元,但是,當(dāng)你與神經(jīng)科學(xué)家交談時(shí),會(huì)覺得深度學(xué)習(xí)僅是一種對(duì)人腦的過于簡(jiǎn)單的再現(xiàn),人腦可比這復(fù)雜得多。所以深度學(xué)習(xí)只是AI使用的眾多技術(shù)中的一種,希望其他技術(shù)可以對(duì)其加以補(bǔ)充。
“正如現(xiàn)在的自動(dòng)駕駛,只能說(shuō)是試水階段,其技術(shù)本身肯定不是主要依賴深度學(xué)習(xí),而是多模態(tài)感知,運(yùn)算也不是簡(jiǎn)單依賴于視覺,而是與人類認(rèn)識(shí)這個(gè)世界一樣,通過眼、耳、鼻、舌、身、意多個(gè)感知來(lái)綜合認(rèn)知,而人腦本身在大多數(shù)情況下不依賴于大量數(shù)據(jù),而是借助‘觸類旁通’等能力。因此,人腦科學(xué)、計(jì)算機(jī)科學(xué)、生理學(xué)和認(rèn)知科學(xué)等跨界交融應(yīng)用才是未來(lái)AI的發(fā)展方向?!弊T茗洲指出。
他認(rèn)為,深度學(xué)習(xí)是一個(gè)好的開始,但是不能解決一切問題,需要和更高維度的方式疊加。而跨學(xué)科的研究會(huì)在語(yǔ)義、知識(shí)圖譜、機(jī)器記憶、想像、邏輯推理等類人腦的領(lǐng)域,彌補(bǔ)深度學(xué)習(xí)的一些短板。
評(píng)論
查看更多