世事浮云,白云蒼狗,轉眼間關于人工智能的研究已歷經兩個世紀。
在研究者和踐行者的不懈努力之下,如今人工智能應用已遍地可見,無論是繁華都市還是偏遠小鎮(zhèn),街頭巷尾偶遇可稱為人工智能的應用并不算稀奇。
然而,人們并不滿足于碎片式的點狀應用,更想要早日實現(xiàn)先驅們最初設定的宏愿——通用人工智能。但攀上這座高峰還遙遙無期。
要如何攀上通用人工智能的頂峰,專家們指出了不算很多的道路,但每條道路目前來說都不好走。
比如,最為人們青睞且最有前途的,當屬深度學習這條“康莊大道”無疑。許多人以為,深度學習能夠解決一切問題,放之所有領域皆為準,但事實證明,深度神經網(wǎng)絡的確能夠被訓練下圍棋,也能流水線上做釘鉚,但同一個網(wǎng)絡不能同時做這兩件事,時至今日,尚沒有一個用深度學習實現(xiàn)通用人工智能的完整路線圖。不僅如此,深度學習與生俱來的弱點也日益暴露出來,如不可解釋性、大量依賴數(shù)據(jù)、成本高昂等,所以,這條路能否通向通用人工智能要被打上一個大大的問號。
又有人提出,可以整合各種專用“模塊”于一個“構架”之中,讓它們分工協(xié)作,這樣就能拼成一個通用系統(tǒng)。但這個思路理論上可行,但實施起來卻難如登天,比如算法或設計本身的功能可能就是復雜且矛盾的,要協(xié)調好不計其數(shù)的“模塊”,就是一個浩繁的工程。
除此之外,還有人試圖通過構造更像人腦的模型,來模仿人類各認知功能的統(tǒng)一再現(xiàn),這就是所謂的“全腦模擬”。
“全腦模擬”的概念基于一個原理,即生命的主題是大腦,于是,20 世紀初,谷歌的科學家們提出一個大膽的想法——將人腦原封不動地移植到以神經網(wǎng)絡為架構的 AI 上,這樣人腦就可以永生,人也就能永生。然而,這個想法雖然讓人興奮,但實行起來難度更大,因為人的大腦共有約860 億個神經細胞,如果用神經回路來模擬大腦,即使用當代速度最快內存最大的超級計算機,也只能模擬大腦的百分之一。這讓大腦移植似乎變得不可能。
但是,這阻擋不了科學家的研究熱情。2018 年,日本理化學研究所和德國的 Jurich 研究所聯(lián)手,通過對網(wǎng)絡算法進行改善,使得神經網(wǎng)絡的性能提高到了原來的將近 100 倍,新的算法通過概率預測,刪除了很多不必要的信號通信。改善后的算法在性能上完全有可能對全腦進行模擬。
全球還有無數(shù)人在進行著類似的研究,美國的腦計劃、歐洲的腦計劃和中國的腦計劃就是這一理論的積極倡導者,為項目投資也逐年提高。2018年,美國對腦計劃的支持總額超過 4 億美元,同比增長 50%;經過近 3 年的醞釀,中國的腦計劃也于 2018 年正式掛牌,作為重大科技項目被列入國家“十三五”規(guī)劃,僅招聘頂級專家就投入 1.8 億元人民幣真金白銀。
然而,這些本來被視為“人類之光”的計劃似乎并沒有預期進行得那么順利。2013 年,歐盟大手一揮撥了 13 億歐元(目前匯率約合 99 億元人民幣)成立了歐盟“人類腦計劃”,但如今實施周期已過半,距離模擬出人腦卻還很遙遠,至今沒能拿出像樣的成果出來。于是這一計劃開始遭到科學界的質疑,歐盟也已經決定不再“將所有的雞蛋放在一個籃子里”,減小對歐盟“人類腦計劃”的投資,這讓后者的前途未卜。
既然此路難走,那就再想其他辦法。
科大訊飛在人工智能領域可算得上是先行者之一,因為早年預判語音技術將成為人工智能技術應用突破口的獨到眼光,開辟出一條語音之路,如今已躋身這一領域的第一方陣。
這家科技公司對于通用人工智能的實現(xiàn)途徑也有自己的看法,并提出了一個概念——智能動力學,并將之視為實現(xiàn)通用人工智能的三條途徑之一。
機緣巧合,筆者有幸采訪到科大訊飛聯(lián)合創(chuàng)始人、輪值總裁胡郁,探討了“智能動力學”究竟是何解。
智能動力學:實現(xiàn)AI的第三條途徑
在胡郁的解釋下,筆者大致明白了“智能動力學”其實是一個相對“空氣動力學”而來的概念,通俗來講,就是像人類研究鳥類飛行一樣,最后研究出“空氣動力學”,造出了比鳥更好的飛機,它不用像鳥一樣吃喝拉撒,但比鳥還快,因為飛機遵循鳥類羽毛空氣動力學的基礎理論。相應地,隨著我們對人類大腦理解越來越深入,對人類大腦拓撲結構和學習機制理解更深,我們完全有可能發(fā)明一種“智能動力學”的東西,它可以在學習人腦的學習機理、人腦結構后,與計算機的速度快、存得多的特點完美結合在一起,產生強人工智能甚至超人工智能。
這是胡郁認為的實現(xiàn)人工智能的三條途徑之一,而其他兩條是英雄所見略同,就是上文提到的深度神經網(wǎng)絡和全腦模擬。
關于人工智能的實現(xiàn)路徑,相信很多人和筆者一樣,了解更多的是深度神經網(wǎng)絡。為什么全腦模擬和智能動力學少被提及呢?后兩者和深度神經網(wǎng)絡相比有何異同點?為什么深度神經網(wǎng)絡比后兩者的概念更火?
胡郁回答了筆者這個疑問。他說道,“現(xiàn)在利用大數(shù)據(jù)加上深度學習的方式是主流的方法。但是從研究的角度來講,我認為深度學習只是研究中的一種路徑而已,而從工業(yè)化的角度來說,深度學習的可操作性、穩(wěn)定性和目前跨過實用門檻的能力目前還是最強的。但是它也有一些問題,比如需要的數(shù)據(jù)量巨大,而且對于人類的某些智能,例如認知智能,用現(xiàn)在深度神經網(wǎng)絡的方法來做,就會面臨一些挑戰(zhàn),因為沒有足夠的大數(shù)據(jù)來支撐。人類在學習過程中其實不依賴大數(shù)據(jù),而是小樣本,它依賴少量的案例或數(shù)據(jù)就能夠學習,這導致現(xiàn)在的大數(shù)據(jù)系統(tǒng)其實有一些不足?!?/p>
所以,這也是訊飛提出“智能動力學”的一個主要原因,訊飛要學習人腦的學習機理,神經元的連接方式和神經元類型,希望得到更好的基于類似于人類學習方式的組合。
所以,他認為,當前正在使用的還是大數(shù)據(jù)、人工智能,即基于大數(shù)據(jù)的機器學習的人工智能。但是將來,訊飛想要發(fā)展智能動力學,這是他們的目標之一。
用一兩句話概括,后兩者相比于深度神經網(wǎng)絡最大的不同點和優(yōu)勢在于,采用智能動力學的方法能夠更好地將人腦的思維方式和學習方法與電子計算機進行結合,從而實現(xiàn)小樣本學習和遷移學習,后兩者在這些方面會比較強一點。
既然全腦模擬和智能動力學有這么多優(yōu)點,它們是否有望克服深度神經網(wǎng)絡的缺點,實現(xiàn)通用人工智能呢?
胡郁給出的答案在預料之中,但仍不免讓筆者感到一絲惋惜。
他說道:“全腦模擬是從現(xiàn)代腦科學研究的一個分支,我并不認為腦科學就是全腦模擬,并在將來能帶來一個好的人工智能的前景,我更相信的是智能動力學可能會給我們帶來智能動力學研究腦工作的原理,并把這種原理放到人工智能系統(tǒng)中,比如與深度神經網(wǎng)絡相結合。所以,它的優(yōu)勢是能夠真正地探索人腦的奧秘,并在我們現(xiàn)在還不太擅長的領域取得突破性的進展。特別是我在報告中(鏈接)提到的在認知智能方面,我認為會產生非常好的作用。”
現(xiàn)在,智能動力學還是一個訊飛提出的設想,想要將人工智能和腦科學研究的最新成果結合在一起,但還沒有得到應用。
但胡郁說道,將來智能動力學的應用方向和領域與人工智能、大數(shù)據(jù)一樣廣闊,并有望在認知智能,比如更好地理解人的意圖,學習專家系統(tǒng)知識這些方面發(fā)揮更大的作用。
既然本文想要探索的那條通向通用人工智能的正確道路還沒有絕對答案,那不妨來看一看,在當下的相關研究中有哪些最新的研究動向和趨勢吧。
知識圖譜將是大戶數(shù)據(jù)平臺的核心技術
大數(shù)據(jù)中臺的概念近來很受關注,科大訊飛也有自己的大數(shù)據(jù)平臺 Odeon。Odeon大數(shù)據(jù)平臺與訊飛的人工智能算法和應用緊密結合在一起,通過底層硬件、大數(shù)據(jù)存儲和管理平臺和人工智能學習和運算算法這三層,Odeon 大數(shù)據(jù)平臺將訊飛正在做的感知智能,即語音和圖像技術和認知智能(語言理解、知識表達、邏輯推理和最終決策等)緊密地結合在一起,達到更好的處理效果。
有人認為,因為知識圖譜具有探索式分析的能力,將成為下一代大數(shù)據(jù)平臺的核心技術。知識圖譜真的具有如此大的潛力嗎?它的作用是否被夸了?
對此,胡郁認為,知識圖譜是認知智能取得突破的一個非常重要的方面,因為人的大腦就是按照知識圖譜的方式來組織知識的,但是人與計算機相比的存儲能力較小,圖譜確實作為數(shù)據(jù)的中臺,是人工智能感知、認知智能方面的一個必不可少的突破方向。它其實是將原來的知識全部結構化,并在它們之間生成邏輯的關聯(lián)結構。
“我認為,知識圖譜在很多領域,特別是專家系統(tǒng)領域會有非常廣泛的應用,比如現(xiàn)在講的專家系統(tǒng)主要用于教育、醫(yī)療、司法和智慧城市等方面。在醫(yī)療方面,訊飛做了智能助理,它能夠根據(jù)建立的病癥和表現(xiàn)之間的知識圖譜。通過知識圖譜推理預測用戶可能得病的概率,更好地幫助醫(yī)生進行病情判斷。另外,知識圖譜在推理上具有優(yōu)勢,在邏輯推理方面非常實用,因此,知識圖譜在自然語言理解,知識表達和邏輯推理方面都將有非常重要的作用?!?/p>
機器翻譯要“達”、“雅”,需要理解和常識
下一個疑問轉移到訊飛憑之起家,同時非常擅長的機器翻譯上。
有專家認為,近兩年來機器翻譯有了很大的進展,但實際上都是靠大數(shù)據(jù)驅動的,大數(shù)據(jù)驅動的帶來的好處是機器翻譯性能得到飛速提升。然而問題是,因為大數(shù)據(jù)驅動深度學習是典型的“黑盒子”,雖然翻譯效果不錯,但其實機器對句子沒有任何理解。這樣的系統(tǒng)在處理復雜語義時非常脆弱,即使是非常簡單的日常詞匯,目前最先進的機器翻譯系統(tǒng)也無法做到準確翻譯。
面對這個略尖銳的問題,胡郁給出了自己的看法,“我認為這應該從兩個方面來看,我們都知道AlphaGo 戰(zhàn)勝李世石 9 段柯杰 9 段,憑的是算得快、存得多的優(yōu)勢,但這并不妨礙它打敗李世石和柯杰。所以,一方面我認為在大部分翻譯領域,機器翻譯已經做得不錯了?,F(xiàn)在,機器翻譯做得不好的地方,可能是占比非常小的俚語,機器翻譯的特點是沒看到過就不會翻,對于一些非常復雜的特殊情況,翻譯的效果可能會打折扣。所以,從另外一個角度來看,翻譯要求“信達雅”,人類在“達”和“雅”這兩個方面還具有一定的優(yōu)勢。我不認為機器翻譯將來就要完全取代人類,它只是幫大家解決大部分的比較簡單的工作,而不是讓人類最后都沒飯吃?!?/p>
歸根結底,機器翻譯效果有時差強人意,也有一個重要的原因——機器不懂人的常識。問題存在就要想辦法解決,機器難以具備常識已經不是個新鮮問題,從機器翻譯概念提出伊始這個問題就糾纏了研究者很久,卻至今未得到解決。打造常識知識庫是解決這個問題的基礎。
清華大學計算機科學與技術系教授孫茂松曾說過,打造好的知識庫,有兩個可行的辦法,一個是把現(xiàn)有世界各方面的知識庫都拿來先做整合,從中汲取養(yǎng)分。另一個辦法是從文本中挖掘知識庫,從文本中找到知識并進行形式化。為此,清華大學正在聯(lián)合各方研究機構打造這樣一個知識庫。
胡郁認為,常識知識庫非常重要,但它有一個特點是很難通過大數(shù)據(jù)獲得,因為人類的常識不是以文字形式被記錄的。但是科大訊飛有嘗試構建這樣的常識知識庫,但是卻沒有一個好的系統(tǒng)構建的方法。他提到在 Winograd 的常識比賽測評中,科大訊飛獲得了第 1 名,但分數(shù)僅有 60分,相比之下,一個人類的小孩卻可以很容易地達到 90 分,所以,胡郁并不認為現(xiàn)在的常識技術已經達到了應用的門檻。
然而,他對于為機器翻譯的未來充滿希望,相信隨著數(shù)據(jù)量越來越大,機器犯錯誤的可能性會變得越來越小。機器翻譯要想達到“信達雅”,它不僅要翻譯,還要理解句子的內容?!艾F(xiàn)在機器翻譯不用理解句子的內容,只需要考慮兩種語言之間的詞對和句對之間的關系,要做到“達”和”雅”,就必須理解句子內容,所以就必須要做知識圖譜。所以,我認為人和機器是各有所長的。”
AI+教育,實現(xiàn)幾千年“因材施教”的教育夢
在教育領域,人工智能的應用近年來已經很常見,做 AI+教育的企業(yè)遍地開花,但很多企業(yè)推出的產品都有同質化的傾向,真正推動教育發(fā)生革命性變化的產品似乎很少。
胡郁并不認同這個觀點,他解釋道,很多產品其實表面上看起來差不多,但“里子”還是有差別的。比如訊飛正在做的所有教學內容的知識圖譜,全國沒有幾家能做出來。
而對于 AI+教育的未來,胡郁認為應該圍繞學校、老師、家長這三點,滿足這三類人的需求。與傳統(tǒng)教育相比,AI+教育能夠實現(xiàn)因材施教的個性化教學,實現(xiàn)教育界幾千年來的追求。
最后,總結起來,實現(xiàn)通用人工智能的道路還不甚明朗。在浩瀚宇宙中,人類不過是滄海一粟,如果把宇宙的歷史比作一條線,人類歷史充其量算得上是組成這條線的一個小點,而人工智能技術發(fā)展史,在這小點上又是一個小到甚至肉眼都看不到的存在。但和世間萬物一樣,人工智能每時每刻都在發(fā)生著微不可查的變化,孕育著一場將要改變人類命運的革命。
實現(xiàn)通用人工智能也許只是人類邁向更高文明的一道門檻,而找到通向峰頂?shù)牡缆?,還需要更多像訊飛一樣的先行者,推動 AI 技術不斷實現(xiàn)突破。
責任編輯:ct
評論
查看更多