0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

科技云報道:ChatGPT的勝利,宣告知識圖譜的消亡?

科技云報到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2023-05-24 14:30 ? 次閱讀

科技云報道原創(chuàng)

過去10年,知識圖譜可謂是最接近“人工智能”的概念。業(yè)內普遍認為,知識圖譜的概念最先是由谷歌于2012年正式提出,主要用來支撐下一代搜索和在線廣告業(yè)務。

此后,這項技術迅速火爆,被國內外多家搜索引公司所采用,如:美國的微軟必應,中國的百度、搜狗等,都在短短的一年內紛紛宣布了各自的“知識圖譜”產品,足以看出這項革新對整個搜索引擎界的整體影響。

但這項技術的應用并不僅拘泥于搜索引擎領域范圍。由于讓人工智能具備了認知能力和邏輯能力,知識圖譜進而實現(xiàn)了智能分析、智能搜索、人機交互、個性化推薦等場景應用,成為互聯(lián)網知識驅動的智能應用的基礎設施。

可以說知識圖譜與大數(shù)據和深度學習一起,成為推動互聯(lián)網和人工智能發(fā)展的核心驅動力之一。

然而,ChatGPT的橫空出世讓整個AI界都沸騰了。

pYYBAGRtrqGAdQUVAAVaSdmmGNE688.png

ChatGPT帶來的震撼在于,它不用借助知識圖譜就可以很好地解決用戶對話知識問答相關的任務,具有非常強大的理解能力、流暢的對話能力和上下文的刻畫能力。

更重要的是,它將原來基于特定任務的模型變成了一個統(tǒng)一的、基于提示的、任務無關的模型,可以去嘗試解決非常復雜或困難的、人類參與很多的任務。

這也讓AI界認知產生了分化,有觀點認為有了ChatGPT這種大語言模型后,知識圖譜完全沒有存在的意義,甚至有的公司已經徹底拋棄了知識圖譜路線。

那么,在大模型時代,知識圖譜真的要消亡了嗎?

知識圖譜vs大語言模型

在討論這個問題之前,先來了解一下知識圖譜和大語言模型的異同。

知識圖譜從字面上看,可以拆分為知識+圖譜,這樣就可以理解:將需要的知識數(shù)據(結構化或非結構化數(shù)據)以圖譜的形式進行展示,這種簡單的過程也是知識圖譜的構建過程。

知識圖譜通常包含實體、關系和屬性三個要素,例如人名、國家、語言等實體,以及人口、首都、官方語言等關系和屬性。它可以根據圖譜中定義的關系提供精確且邏輯一致的答案,因此對于信息檢索、問答和結構化數(shù)據推理等任務特別有用。

大語言模型是基于深度學習和神經網絡,像GPT-4這樣的大語言模型是在大量文本數(shù)據上進行訓練,以學習模式、上下文以及單詞和短語之間的關系。

它們可以生成類似人類的文本、回答問題、提供建議以及執(zhí)行其他自然語言任務,還可以很好地處理模棱兩可和不完整的信息,并且處理廣泛的主題。

不難發(fā)現(xiàn),兩者在知識的學習、分析、推理方面有著類似的功能,但卻各有優(yōu)劣勢。

知識圖譜通常需要手動或半自動構建,是一種非常耗時耗人力的工作,隨著知識的不斷擴展和變化,知識圖譜也需要不斷更新;

同時,它的作用僅限于圖譜編碼中的知識范圍,這使得它在處理模棱兩可或不完整的信息時準確率較低。

但它的優(yōu)勢在于準確的知識庫,對于事實性的、專業(yè)性的知識有著非常高的準確度。

相反,專業(yè)知識在大模型訓練語料里占比非常少,這也使得ChatGPT等語言大模型生成的內容的可靠性和真實性備受質疑。

它無法將真實與想象、真實與虛構分開,這種現(xiàn)象甚至促使創(chuàng)造了一個新術語:人工智能幻覺,維基百科將其定義為“人工智能的自信反應,其訓練數(shù)據似乎沒有合理性”。

同時,語言大模型需要大量的計算能力和資源來進行訓練和微調,其花費的時間和成本也不容小覷。

目前,語言大模型只在通用領域給出了較為驚艷的表現(xiàn),至于在知識圖譜廣泛應用的垂直領域,語言大模型暫時未顯示出領先的一面。

知識圖譜退場為時尚早

正因為語言大模型暫時還無法解決事實準確性、可信度、可追溯等問題,知識圖譜的存在就非常有意義。

知識圖譜或者類似的知識庫、知識引擎,能夠為大模型提供準確的知識,它可以被用來通知、聚焦、過濾和控制生成式人工智能,增強大模型響應的智能和可靠性,使其更適合關鍵任務。

當大模型真正落地到工業(yè)應用時,也需要有知識圖譜對專業(yè)領域知識的支撐,至少短期來看是非常需要的。

因此,我們也可以說,知識圖譜的構建原來有各種各樣的構建方式,現(xiàn)在又多了一種構建方式——用大模型去輔助整個知識圖譜構建,通過大量語料和大數(shù)據的學習,通過Prompt去進行知識的激發(fā)。

同時知識圖譜反過來也能夠去推動大模型Prompt工程里的相關工作,融入到大模型的訓練中,使得生成更可控,更準確。同時,知識圖譜也可以提供很多額外的語義信息,幫助大模型的知識推理做得更好。

所以從本質上看,大語言模型出現(xiàn)后,并不是將知識圖譜消滅了,而是可以發(fā)揮知識圖譜和大模型這兩種技術的優(yōu)勢:在需要可控知識或可控邏輯的時候,知識圖譜會發(fā)揮更大作用;在需要更自由的交互任務理解和生成時,大模型發(fā)揮更好的作用。

結合這兩種方法的優(yōu)勢,可以產生更強大和有效的自然語言處理系統(tǒng)。

知識圖譜與大語言模型的結合

那么,知識圖譜如何與大語言模型相結合呢?

有意思的是,ChatGPT給出了將知識圖譜集成到大語言模型中的幾種方法:

使用知識圖譜數(shù)據進行預訓練

將知識圖譜中的知識注入到大語言模型的預訓練階段,可以幫助大模型學習實體與其屬性之間的關系??梢酝ㄟ^將知識圖譜三元組(主語、謂語、賓語)轉換為自然語言句子并將它們添加到訓練語料庫中來完成。

使用基于圖的目標進行微調

在預訓練之后,使用基于圖的目標對特定任務的模型進行微調,可以幫助大模型學習使用圖中編碼的知識進行推理和推理。這可能涉及將自然語言查詢轉換為基于圖形的查詢,以及開發(fā)將基于圖形的推理與基于文本的推理相結合的方法。

例如,可以對模型進行微調,以預測圖形中缺失的實體或關系,這可以提高其對底層結構的理解。

改進實體鏈接和消除歧義

增強模型識別文本中的實體并將其鏈接到知識圖譜中相應節(jié)點的能力。這可以通過在訓練或微調期間結合高級實體鏈接和消除歧義技術來實現(xiàn)。

集成圖嵌入

圖嵌入是一種用于將圖中的節(jié)點、邊或整個子圖轉換為連續(xù)向量或低維表示的技術,機器學習算法可以更輕松地處理這些向量或低維表示。

圖嵌入在知識工程的上下文中特別有用,因為它可以幫助將知識圖譜中的結構化信息轉換為可以更容易地與機器學習算法(尤其是神經網絡)集成的格式。

使用圖神經網絡或其他圖表示學習方法學習,并可用于豐富模型對實體及其關系的理解。

推理時查詢知識圖譜

當模型遇到需要精確、結構化知識的問題或任務時,可以查詢知識圖譜獲取相關信息。這可以通過將自然語言查詢轉換為基于圖形的查詢(例如,使用SPARQL),然后使用檢索到的信息來回答問題或執(zhí)行任務來完成。

知識圖譜引導生成

將大語言模型的生成能力與知識圖譜中的結構化信息相結合,可以生成更準確、更相關的文本。例如,在生成實體的摘要或描述時,模型可以對知識圖譜中的信息進行優(yōu)先級排序,以確保事實的正確性。

混合模型

開發(fā)包含基于圖和基于神經網絡的組件的混合模型,可以利用這兩種方法的優(yōu)勢。例如,圖神經網絡(GNN)可用于學習圖結構數(shù)據的潛在表示,然后可以將其與大語言模型集成以執(zhí)行自然語言處理任務。

鼓勵可解釋性和可解釋性

開發(fā)允許大語言模型基于知識圖譜為其推理和預測生成解釋的方法。這可以幫助用戶了解模型如何利用知識圖譜中的結構化信息,并有助于調試和優(yōu)化模型。

結語

技術的浪潮總是洶涌而至,在新的技術革新來臨之際,我們更應該客觀看待新舊技術的優(yōu)劣,而不是沖動地去擁抱新技術,拋棄現(xiàn)有成熟技術。

對于知識圖譜來說,大模型的出現(xiàn)并不是一個沖擊,恰恰是給了知識圖譜一個新的生長空間。當我們將大模型與自身優(yōu)勢的行業(yè)應用去深度結合,形成數(shù)據和算法的持續(xù)迭代,必將看到更好的結果持續(xù)涌現(xiàn)。

【關于科技云報道】

專注于原創(chuàng)的企業(yè)級內容行家——科技云報道。成立于2015年,是前沿企業(yè)級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數(shù)據、人工智能、區(qū)塊鏈等領域。

審核編輯黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31315

    瀏覽量

    269659
  • ChatGPT
    +關注

    關注

    29

    文章

    1566

    瀏覽量

    7868
  • 大模型
    +關注

    關注

    2

    文章

    2516

    瀏覽量

    2935
收藏 人收藏

    評論

    相關推薦

    微軟發(fā)布《GraphRAG實踐應用白皮書》助力開發(fā)者

    近日,微軟針對開發(fā)者群體,重磅推出了《GraphRAG實踐應用白皮書》。該白皮書全面而深入地涵蓋了知識圖譜的核心內容,為開發(fā)者和企業(yè)提供了寶貴的指導和啟示。 從知識圖譜的基礎概念出發(fā),白皮書詳細闡述
    的頭像 發(fā)表于 01-13 16:11 ?234次閱讀

    利智方:驅動企業(yè)知識管理與AI創(chuàng)新加速的平臺

    利智方致力于深度整合企業(yè)知識資產,全面打通知識生命周期的各個環(huán)節(jié)。通過構建強大的知識庫和精準的知識圖譜,支持快速定制和部署各類AI應用,為企業(yè)創(chuàng)新發(fā)展提供堅實的技術支撐??啥嗑S度提升企
    的頭像 發(fā)表于 12-30 11:07 ?301次閱讀

    傳音旗下人工智能項目榮獲2024年“上海產學研合作優(yōu)秀項目獎”一等獎

    和華東師范大學聯(lián)合申報的“跨語言知識圖譜構建與推理技術研究及應用”項目憑借創(chuàng)新性和技術先進性榮獲一等獎。該項目成功突破了多形態(tài)信息抽取技術、跨語言知識圖譜對齊技術和知識問答對
    的頭像 發(fā)表于 12-16 17:04 ?356次閱讀
    傳音旗下人工智能項目榮獲2024年“上海產學研合作優(yōu)秀項目獎”一等獎

    ChatGPT短暫“罷工”,服務器還能用嗎?

    日,備受歡迎的AI聊天機器人ChatGPT突然遭遇了一次短暫的服務中斷,這讓不少用戶心生疑慮:服務器,這個支撐起無數(shù)互聯(lián)網應用的強大后盾,究竟還靠譜嗎?
    的頭像 發(fā)表于 12-12 11:45 ?182次閱讀

    三星自主研發(fā)知識圖譜技術,強化Galaxy AI用戶體驗與數(shù)據安全

    據外媒11月7日報道,三星電子全球AI中心總監(jiān)Kim Dae-hyun近日透露,公司正致力于自主研發(fā)知識圖譜技術,旨在進一步優(yōu)化Galaxy AI的功能,提升其易用性,并加強用戶數(shù)據的隱私保護。
    的頭像 發(fā)表于 11-07 15:19 ?675次閱讀

    華納ChatGPT 登陸 Windows

    ChatGPT 現(xiàn)已在 Windows 上推出。 今天,OpenAI宣布已開始預覽其 AI 聊天機器人平臺ChatGPT的專用 Windows 應用程序。 OpenAI 表示, ChatGPT
    的頭像 發(fā)表于 10-18 15:50 ?260次閱讀

    三星電子將收購英國知識圖譜技術初創(chuàng)企業(yè)

    在人工智能技術日新月異的今天,三星電子公司再次展現(xiàn)了其前瞻性的戰(zhàn)略布局與技術創(chuàng)新實力。近日,三星正式宣布完成了對英國領先的人工智能(AI)與知識圖譜技術初創(chuàng)企業(yè)Oxford Semantic Technologies的收購,此舉標志著三星在提升設備端AI能力、深化個性化用戶體驗方面邁出了重要一步。
    的頭像 發(fā)表于 07-18 14:46 ?555次閱讀

    知識圖譜與大模型之間的關系

    在人工智能的廣闊領域中,知識圖譜與大模型是兩個至關重要的概念,它們各自擁有獨特的優(yōu)勢和應用場景,同時又相互補充,共同推動著人工智能技術的發(fā)展。本文將從定義、特點、應用及相互關系等方面深入探討知識圖譜與大模型之間的關系。
    的頭像 發(fā)表于 07-10 11:39 ?1142次閱讀

    使用espbox lite進行chatgpt_demo的燒錄報錯是什么原因?

    我使用espbox lite進行chatgpt_demo的燒錄 我的idf是v5.1release版本的,espbox是master版本的 在編譯時似乎沒有什么問題 在燒錄時報錯 請問這是什么原因
    發(fā)表于 06-11 08:45

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    當?shù)貢r間5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的一大步。在GPT-4turbo的強大基礎上,這種迭代擁有顯著的改進。在發(fā)布會的演示中,OpenAI展示該模型的高級
    發(fā)表于 05-27 15:43

    OpenAI推出ChatGPT新功能:連接微軟OneDrive谷歌Drive盤服務

    據5月17日消息,Kristi Hines發(fā)布推文透露,OpenAI為企業(yè)客戶量身打造了ChatGPT全新版的“Connect Apps”,支持與微軟OneDrive及谷歌Drive盤服務的無縫對接。
    的頭像 發(fā)表于 05-17 10:21 ?569次閱讀

    古河科技智慧醫(yī)院解決方案

    ,打造智能化的數(shù)字空間。通過數(shù)據治理、知識圖譜和輕量建模技術,提升醫(yī)院運營管理效率,創(chuàng)新醫(yī)院智慧運營模式。構建智慧醫(yī)院運營數(shù)字中臺,跨越部門界限,集成并存儲各類數(shù)據,形成運營體系內不斷流轉的支撐力量,實現(xiàn)數(shù)據
    的頭像 發(fā)表于 05-10 14:49 ?381次閱讀
    古河<b class='flag-5'>云</b>科技智慧醫(yī)院解決方案

    在FPGA設計中是否可以應用ChatGPT生成想要的程序呢

    當下AI人工智能崛起,很多開發(fā)領域都可看到ChatGPT的身影,F(xiàn)PGA設計中,是否也可以用ChatGPT輔助設計呢?
    發(fā)表于 03-28 23:41

    利用知識圖譜與Llama-Index技術構建大模型驅動的RAG系統(tǒng)(下)

    對于語言模型(LLM)幻覺,知識圖譜被證明優(yōu)于向量數(shù)據庫。知識圖譜提供更準確、多樣化、有趣、邏輯和一致的信息,減少了LLM中出現(xiàn)幻覺的可能性。
    的頭像 發(fā)表于 02-22 14:13 ?1262次閱讀
    利用<b class='flag-5'>知識圖譜</b>與Llama-Index技術構建大模型驅動的RAG系統(tǒng)(下)

    【國產FPGA+OMAPL138開發(fā)板體驗】(原創(chuàng))6.FPGA連接ChatGPT 4

    OMAP-L138(定點/浮點DSP C674x+ARM9)+ FPGA處理器的開發(fā)板。 編寫一個用于FPGA訪問ChatGPT 4的程序代碼是一個相當復雜的任務,涉及到硬件設計、網絡通信、數(shù)據處理等多個
    發(fā)表于 02-14 21:58