近年來,人工智能(AI)依靠深度學習、計算機視覺、自然語言處理等技術突破與落地應用,不斷顛覆著人類的既有認知——AlphaGo 通過自我強化學習擊敗了人類的頂尖圍棋選手;而近日 Alphafold 更是破解了一項過去 50 年生物學領域的重大挑戰(zhàn)——蛋白質分子折疊問題。
自 1956 年 AI 的概念首次被提出后,AI 至今已有 60 多年的發(fā)展史。如今,隨著相關理論和技術的不斷革新,AI 在數據、算力和算法“三要素”的支撐下越來越多地走進我們的日常生活,比如我們常見的語音識別、人臉識別和機器翻譯等,都已經在手機、電腦等智能設備上有所應用。
但是,這一系列驚喜的背后,卻是大多數 AI 在語言理解、視覺場景理解、決策分析等方面的舉步維艱:這些技術依然主要集中在感知層面,即用 AI 模擬人類的聽覺、視覺等感知能力,卻無法解決推理、規(guī)劃、聯想、創(chuàng)作等復雜的認知智能化任務。當前的 AI 缺少信息進入“大腦”后的加工、理解和思考等,做的只是相對簡單的比對和識別,僅僅停留在“感知”階段,而非“認知”,以感知智能技術為主的 AI 還與人類智能相差甚遠。
究其原因在于,AI 正面臨著制約其向前發(fā)展的瓶頸問題:大規(guī)模常識知識庫與基于認知的邏輯推理。而基于知識圖譜、認知推理、邏輯表達的認知圖譜,則被越來越多的國內外學者和產業(yè)領袖認為是“目前可以突破這一技術瓶頸的可行解決方案之一”。
目前,人工智能的發(fā)展經歷了從表示、計算到感知兩個階段,下一個階段的核心是認知。早在 2016 年,中國科學院院士、清華大學人工智能研究院院長張鈸就提出了第三代 AI 體系的雛形,并于 2018 年底正式公開第三代 AI 的理論框架體系,其核心思想為:建立可解釋、魯棒性的 AI 理論和方法;發(fā)展安全、可靠、可信及可擴展的 AI 技術;推動 AI 創(chuàng)新應用。
2019 年,圖靈獎得主約書亞·本吉奧(Yoshua Bengio)在 NeurIPS 大會上也指出,深度學習應該以感知為主向,向基于認知的邏輯推理和知識表達的方向發(fā)展,這個思想和張鈸院士提出的第三代 AI 的思路不謀而合。
圖 | AI 的發(fā)展階段
如今,第三代 AI 的理念在國內外獲得廣泛影響力。業(yè)內普遍認為,認知智能將是進一步釋放人工智能產能的關鍵。而認知圖譜是實現認知智能技術突破的關鍵,不僅可以讓機器理解數據本質,還可以讓機器解釋現象本質。
認知圖譜:實現認知智能的關鍵
機器認知智能的發(fā)展過程本質上是人類腦力不斷解放的過程,是人工智能的最高階段。但是,讓機器具備認知智能,其核心就是讓機器具備理解和解釋能力。這種能力的實現與大規(guī)模、結構化的背景知識是密不可分的。
盡管目前的智能系統(tǒng)在感知方面已經達到甚至超越人類水平,但在魯棒性、可解釋性、安全可靠等方面還存在很多不足。比如,模型魯棒性差,難以與準確性共生;模型可解釋性差,對于可靠性要求高的任務很難勝任;缺乏積累知識的能力,也沒能和人類已有的知識體系進行很好的關聯,缺乏可靠的推理方法。
認知圖譜旨在結合認知心理學、腦科學和人類知識等,研發(fā)融合知識圖譜、認知推理、邏輯表達的新一代認知引擎,支持大規(guī)模知識的表示、獲取、推理與計算的基礎理論和方法,實現人工智能從感知智能向認知智能的演進,建立可解釋、魯棒性的認知智能。
作為一種實現機器認知智能的底層支撐手段,認知圖譜在電商平臺、智慧城市、司法行業(yè)、金融行業(yè)、安防行業(yè)、大數據的精準與精細分析、智慧搜索、智能推薦、智能解釋、自然人機交互等方面具有極為重要的作用。
認知圖譜的歷程發(fā)展可以追溯到語義網絡(Semantic Network)。1968 年,M. Ross Quillian 在研究人類長期記憶模型時,描述了人類長期記憶的一般結構模型,認為記憶由概念之間的聯系來實現,并存儲在復雜的網絡中,并基于此提出了語義網絡的概念。
同年,專家系統(tǒng)之父、圖靈獎得主愛德華·費根鮑姆(Edward Feigenbaum)等人研發(fā)出了世界首個專家系統(tǒng) DENDRAL。專家系統(tǒng)是早期 AI 的一個重要分支,它可以看作是一類具有專門知識和經驗的計算機智能程序系統(tǒng),一般采用 AI 中的知識表示和知識推理技術來模擬通常由領域專家才能解決的復雜問題。
1998 年,萬維網之父、ACM 圖靈獎獲得者蒂姆·伯納斯-李(Tim Berners-Lee)爵士也提出了語義網的概念,其核心理念是通過給萬維網上的文檔(如:HTML 文檔、XML 文檔)添加能被計算機理解的語義“元數據”(Meta Data),使整個互聯網成為一個通用的信息交換媒介,即用知識表示互聯網,建立常識知識庫。
2006 年,蒂姆·伯納斯-李提出鏈接數據(Linked Data)的概念,表示數據不僅僅發(fā)布于語義網中,還要建立起數據之間的鏈接,從而形成一張巨大的鏈接數據網,其目的是構建一張計算機能理解的語義數據網絡,而不僅僅是人能讀懂的文檔網絡,從而在此之上構建更智能的應用。
2012 年,Google 的阿米特·辛格爾(Amit Singhal)等人介紹了知識圖譜(Knowledge Graph)的概念。知識圖譜以語義網絡的結構化方式描述客觀世界中概念、實體、事件以及它們之間的關系,相對于傳統(tǒng)的本體和語義網絡而言,實體覆蓋率更高,語義關系也更加復雜而全面。
圖 | 認知圖譜的演化歷程(來源:報告《人工智能之認知圖譜》)
但是,要讓機器具備認知智能,其核心就是讓機器具備理解和解釋能力,這種能力的實現與大規(guī)模、結構化的背景知識是密不可分的。2020 年,清華大學計算機系教授、系副主任唐杰在“人工智能下一個十年”報告中,結合認知科學和計算機理論,提出了一個實現認知智能的可行思路,即“認知圖譜 = 知識圖譜 + 認知推理 + 邏輯表達”,并希望利用知識表示、推理和決策,以及人的認知來解決復雜問題。
這個思路的基本思想是結合認知科學中的雙通道理論:人腦的認知系統(tǒng)中存在兩個系統(tǒng),即 System 1 和 System 2。System 1 是一個直覺系統(tǒng),它可以通過人對相關信息的直覺匹配尋找答案,非常快速、簡單;而 System 2 是一個分析系統(tǒng),它通過一定的推理、邏輯找到答案。比如,回答一個具體問題:2003 年在洛杉磯 Quality 咖啡館拍過電影的導演是誰?
要回答這一問題,首先需要 System 1 找到相關的影片,然后 System 2 做出決策,如果是標準答案,就結束整個推理過程;如果不是,而相應的信息又有用,就把它作為一個有用信息提供給 System 1,System 1 繼續(xù)做知識擴展,System 2 則再次做出決策,直到找到最終答案。
由此可見,認知圖譜的核心是以實現融合知識驅動和數據驅動相結合的知識表示和推理的認知引擎為目標,研究支持魯棒可解釋人工智能的大規(guī)模知識的表示、獲取、推理與計算的基礎理論和方法;建設包含語言知識、常識知識、世界知識、認知知識的大規(guī)模知識圖譜以及典型行業(yè)知識庫,建成知識計算服務平臺。
機遇與挑戰(zhàn)并存
近年來,雖然 AI 已經取得了快速發(fā)展,但如何將深度學習與大規(guī)模常識知識結合起來,實現認知推理與邏輯表達,還面臨著很大挑戰(zhàn)。
研發(fā)融合常識知識圖譜、認知推理和邏輯表達等核心技術的認知圖譜將成為實現下一代 AI 技術突破的關鍵,實現以認知圖譜作為底層數據支撐,具有推理、具有可解釋性、具有認知的新一代 AI,是 AI 領域下一個 10 年重要的發(fā)展方向,也是一個機遇與挑戰(zhàn)并存的發(fā)展方向。
眾所周知,技術的突破與發(fā)展離不開來自人才的持續(xù)創(chuàng)新,科技競爭歸根結底也是人才的競爭。那么,放眼中國乃至全世界,認知圖譜領域的人才在哪里?
近日,清華大學人工智能研究院、北京智源人工智能研究院、清華-中國工程院知識智能聯合研究中心、阿里集團-新零售智能引擎事業(yè)群聯合發(fā)布了《人工智能之認知圖譜》(Research Report of Cognitive Graph)報告(文末福利,免費下載完整版報告)。該報告依托 AMiner 平臺,對技術領先的國家、機構和學者,以及認知圖譜相關領域的技術發(fā)展趨勢、技術創(chuàng)新熱點等進行了詳細分析。
數據顯示,全球范圍內認知圖譜相關領域的學者主要集中在北美、歐洲和亞洲。美國的高水平學者數量在全球位居首位,其次是中國,第三是英國。
其中,中美兩國的高水平學者數量遠高于其他國家,在認知圖譜相關領域具有較強的發(fā)展?jié)摿ΑV袊m然僅次于美國,但是高水平學者數量約是美國的一半,相差較大。
圖 | h-index TOP 5000 全球學者的國家統(tǒng)計前 10 名
而國內認知圖譜相關領域學者主要分布在中國的經濟和政治發(fā)達地區(qū),包括京津冀、長江三角洲、珠江三角洲、香港、臺灣等地區(qū),中部、西部和東北地區(qū)的學者則相對較少。
具體而言,北京、上海和江蘇的認知圖譜相關領域學者數排名前三位,分別為 129、45 和 36。(參考 h-index 作為篩選條件,選擇 TOP 5000 全球學者以地圖形式展示和分析學者的地區(qū)分布,其中顏色越紅、圓圈越大,表示人才越集中。)
圖 | h-index TOP 5000 中國學者的省市統(tǒng)計前 10 名
而且,美國在認知圖譜相關領域的論文發(fā)表量和總被引頻次、高水平學者數量均位居世界前列。中國雖然在論文發(fā)表量和高水平學者數量方面僅次于美國,但與美國差距較大,并且論文總被引頻次要低于英國和德國,在全球排名第四。
圖 | 論文總被引頻次排名前 10 的國家
此外,報告還基于 AMiner 平臺將學者流入和流出數量之和作為篩選條件,統(tǒng)計了認知圖譜相關領域的全球學者在2009年—2020年間的流動數量排名前 10 的國家。
數據顯示,美國、加拿大、法國的學者流入數量大于流出數量,而中國、英國、德國、意大利、印度、日本、西班牙的學者流出數量大于流入數量。
圖 | 全球認知圖譜領域學者的流動情況(來源:報告《人工智能之認知圖譜》)
由此看出,中國近 10 年來的學者流動較為頻繁,這與中國制定的出國培養(yǎng)、人才引進等相關人才政策不無關系。隨著經濟全球化深入發(fā)展,科技人才的跨國流動更加頻繁,各國對科技人才的爭奪更加激烈。
那么,國內認知圖譜相關領域的學者分布情況又如何呢?
數據顯示,北京是學者流入和流出數量都很高的城市,比其他城市高出較多,這可能與北京的高校和科研院所數量較多有一定關系。此外,北京、香港、上海、哈爾濱的學者流出數量高于流入數量,而武漢、南京、西安、杭州、廣州、合肥的學者流入數量高于流出數量。北京、香港、上海的學者流失與這三個城市的高校數量較多、供求關系不平衡、人才競爭力和生活壓力較大不無關聯,而哈爾濱的地域環(huán)境造成了一定的學者流失。針對學者凈流入數量為正值的這幾個城市,通過調研相關資料,可以發(fā)現這些地方在積極推行人才引進政策,包括落戶、房補、薪酬等方面均制定了相應的優(yōu)惠措施。
圖 | 中國認知圖譜領域學者的流動情況(來源:報告《人工智能之認知圖譜》)
以上分析表明,在下一代 AI 的機遇與挑戰(zhàn)下,中國相關部門需要重視并采取相關措施,讓中國學者在重視論文數量的同時,也要提升論文質量,同時也要加快高水平科技人才隊伍的建設,一方
針對國際新局勢從政策、資金、資源等多個方面加快本土培養(yǎng),另一方面加大力度引進國外重要機構的杰出學者,改善人才結構,加速認知圖譜領域的技術發(fā)展。
未來 10 年,具有推理、具有可解釋性、具有認知的新一代 AI,是 AI 領域的下一個重要發(fā)展方向,而研發(fā)融合常識知識圖譜、認知推理和邏輯表達等核心技術的認知圖譜將成為實現下一代 AI 技術突破的關鍵,但歸根結底還要依靠相關人才基于不懈努力做出的創(chuàng)新。
責任編輯:xj
-
AI
+關注
關注
87文章
31294瀏覽量
269647 -
計算機視覺
+關注
關注
8文章
1699瀏覽量
46051 -
深度學習
+關注
關注
73文章
5510瀏覽量
121345
發(fā)布評論請先 登錄
相關推薦
評論