0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大語(yǔ)言模型事實(shí)性幻象的實(shí)驗(yàn)性分析

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:RUC AI Box ? 2024-01-19 11:19 ? 次閱讀

作者|李軍毅 陳杰 機(jī)構(gòu)|中國(guó)人民大學(xué)

研究方向|自然語(yǔ)言處理

來(lái)自| RUC AI Box

盡管大語(yǔ)言模型能力不斷提升,但一個(gè)持續(xù)存在的挑戰(zhàn)是它們具有產(chǎn)生幻象的傾向。本文構(gòu)建了幻象評(píng)測(cè)基準(zhǔn)HaluEval 2.0,并基于該評(píng)測(cè)框架從預(yù)訓(xùn)練/有監(jiān)督微調(diào)/提示設(shè)計(jì)/推理四個(gè)方面探索幻象來(lái)源。另外,還通過(guò)一系列技術(shù)深入研究了減輕LLM幻象的方法。

引言

大語(yǔ)言模型(LLM)在自然語(yǔ)言處理(NLP)的廣泛領(lǐng)域中展現(xiàn)出巨大的潛力。然而,盡管模型能力有所提升,但一個(gè)持續(xù)存在的挑戰(zhàn)在于它們具有產(chǎn)生幻象的傾向,即生成看似合理但事實(shí)上不準(zhǔn)確的內(nèi)容。這一問(wèn)題嚴(yán)重限制了LLM在現(xiàn)實(shí)世界應(yīng)用(如臨床診斷)中的部署,在這些應(yīng)用中,生成值得信賴的可靠文本至關(guān)重要。

在 LLM 時(shí)代,幻象相關(guān)的研究顯著增加,這些研究主要圍繞三個(gè)問(wèn)題展開(kāi),即 LLM 為何產(chǎn)生幻象(source),如何檢測(cè)幻象(detection)以及如何減輕幻象(mitigation)?,F(xiàn)有的工作大多集中于分析或解決個(gè)別挑戰(zhàn),仍然缺乏系統(tǒng)而深入的對(duì) LLM 幻象的實(shí)驗(yàn)分析。為此,我們針對(duì)事實(shí)性幻象,從幻象的檢測(cè)、來(lái)源和緩解三個(gè)方面進(jìn)行了全面系統(tǒng)的實(shí)驗(yàn)性分析。我們的貢獻(xiàn)包括:

構(gòu)建了幻象評(píng)測(cè)基準(zhǔn) HaluEval 2.0,提出了一個(gè)簡(jiǎn)單有效的幻象自動(dòng)評(píng)估框架。

基于上述評(píng)測(cè)框架,我們從預(yù)訓(xùn)練(pre-training)、有監(jiān)督微調(diào)(supervised fine-tuning)、提示設(shè)計(jì)(prompt design)和推理(inference)四個(gè)方面探索幻象的來(lái)源。

我們還通過(guò)一系列廣泛使用的技術(shù),包括基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)、檢索增強(qiáng)(retrieval augmentation)、反思(self-reflexion)、提示改進(jìn)(prompt improvement)等,深入研究了減輕 LLM 幻象的方法。

總的來(lái)說(shuō),我們的工作帶來(lái)了一系列關(guān)于 LLM 幻象的來(lái)源和緩解的重要實(shí)證發(fā)現(xiàn),構(gòu)建的幻象評(píng)測(cè)基準(zhǔn)可用于進(jìn)一步的研究。

幻象評(píng)測(cè)基準(zhǔn)HaluEval 2.0

HaluEval 2.0包括五個(gè)領(lǐng)域的 8770 個(gè)問(wèn)題,其中生物醫(yī)學(xué)、金融、科學(xué)、教育和開(kāi)放域的問(wèn)題數(shù)量分別為1535、1125、1409、1701 和 3000?;?HaluEval 2.0,我們?cè)谝恍┚哂写硇缘拈_(kāi)源和閉源 LLM 上進(jìn)行了實(shí)驗(yàn):

開(kāi)源模型:Alpaca (7B), Vicuna (7B and 13B), YuLan-Chat (13B), Llama 2-Chat (7B and 13B)

閉源模型:text-davinci-002/003, ChatGPT, Claude, Claude 2

幻象的檢測(cè)

我們提出了一個(gè)簡(jiǎn)單而有效的評(píng)測(cè)框架,用于檢測(cè) LLM 回答中的事實(shí)性錯(cuò)誤。我們將具有挑戰(zhàn)性的幻象檢測(cè)任務(wù)分解為兩個(gè)較簡(jiǎn)單的子任務(wù):1)從回答中提取多個(gè)事實(shí)性陳述;2)確定每個(gè)陳述是否包含幻象。基于該檢測(cè)方法,我們可以在 HaluEval 2.0 上對(duì)各種 LLM 進(jìn)行評(píng)估。我們?cè)O(shè)計(jì)了兩個(gè)不同級(jí)別的指標(biāo)來(lái)衡量 LLM 回答中包含幻象的程度。

微觀幻象率(MiHR)衡量每個(gè)回答中幻象陳述的比例:

b0db48ec-b138-11ee-8b88-92fbcf53809c.png

宏觀幻象率(MaHR)計(jì)算含有幻象陳述的回答比例:

b0ed51fe-b138-11ee-8b88-92fbcf53809c.png

我們?cè)?HaluEval 2.0 上衡量了各種 LLM 產(chǎn)生幻象的傾向,實(shí)驗(yàn)結(jié)果如下表所示:

b0fb2d7e-b138-11ee-8b88-92fbcf53809c.png

我們可以看到,開(kāi)源模型和閉源模型之間存在著明顯的性能差距。在開(kāi)源模型中,我們可以發(fā)現(xiàn)擴(kuò)大模型規(guī)模可以有效降低產(chǎn)生幻象的傾向。另外我們發(fā)現(xiàn),MaHR 和 MiHR 的正相關(guān)性并不強(qiáng),這是因?yàn)橛行┠P蛢A向于用較少的事實(shí)生成較短的回答,從而減少幻象的發(fā)生,但同時(shí)也減少了回答中信息的豐富性。更多的實(shí)驗(yàn)結(jié)論與分析詳見(jiàn)論文。

幻象的來(lái)源和緩解

我們進(jìn)行了廣泛的實(shí)驗(yàn),從預(yù)訓(xùn)練(pre-training)、有監(jiān)督微調(diào)(supervised fine-tuning)、提示設(shè)計(jì)(prompt design)和推理(inference)四個(gè)方面探索可能誘發(fā) LLM 幻象的因素:

b116e320-b138-11ee-8b88-92fbcf53809c.jpg

我們研究了基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)、檢索增強(qiáng)(retrieval augmentation)、反思(self-reflexion)、提示改進(jìn)(prompt improvement)等廣泛使用的方法減輕 LLM 幻象的有效性:

b1267e3e-b138-11ee-8b88-92fbcf53809c.jpg

下面是各部分的實(shí)驗(yàn)結(jié)論,更多的實(shí)驗(yàn)細(xì)節(jié)、結(jié)果和分析詳見(jiàn)論文。

預(yù)訓(xùn)練:在更多 tokens 上進(jìn)行預(yù)訓(xùn)練對(duì)減少 LLM 幻象的影響較小,而將專業(yè)數(shù)據(jù)(如科學(xué)文本)納入預(yù)訓(xùn)練則可以極大地減輕特定領(lǐng)域的幻象。預(yù)訓(xùn)練知識(shí)的頻率對(duì)幻象的來(lái)源有很大影響,即頻率越低,幻象越多。

微調(diào):通過(guò)改進(jìn)指令對(duì) LLM 進(jìn)行有監(jiān)督微調(diào)有助于減輕幻象。平衡指令的復(fù)雜性有利于減少幻象,而使用過(guò)于復(fù)雜的指令則會(huì)導(dǎo)致更高水平的幻象。RLHF 是減輕 LLM 幻象的有效方法,但其效果依賴于所在領(lǐng)域。

推理:在專業(yè)領(lǐng)域如醫(yī)學(xué),以多樣性為導(dǎo)向的解碼方法會(huì)誘發(fā)更多幻象,而在開(kāi)放領(lǐng)域,貪心搜索會(huì)加劇幻象。逐個(gè) token 生成的方式可能會(huì)讓 LLM 在先前生成錯(cuò)誤的基礎(chǔ)上繼續(xù)出現(xiàn)錯(cuò)誤,從而導(dǎo)致幻象。量化雖然加快了推理速度,但在很大程度上也會(huì)導(dǎo)致 LLM 幻象的產(chǎn)生。

提示設(shè)計(jì):在任務(wù)描述中加入更多細(xì)節(jié)并利用上下文學(xué)習(xí)可以減少幻象的產(chǎn)生。改寫(xiě)問(wèn)題或?qū)⑷蝿?wù)描述放在問(wèn)題之后會(huì)誘發(fā)更多幻象。對(duì)于更易讀和表達(dá)更正式、更具體的問(wèn)題,LLM 產(chǎn)生幻象的傾向較低。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    3472

    瀏覽量

    42944
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    550

    瀏覽量

    10432
  • 自然語(yǔ)言處理
    +關(guān)注

    關(guān)注

    1

    文章

    624

    瀏覽量

    13736
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    308

    瀏覽量

    515

原文標(biāo)題:HaluEval 2.0:大語(yǔ)言模型事實(shí)性幻象的實(shí)驗(yàn)性分析

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【大語(yǔ)言模型:原理與工程實(shí)踐】大語(yǔ)言模型的預(yù)訓(xùn)練

    數(shù)據(jù)格式的轉(zhuǎn)換、數(shù)據(jù)字段的匹配和整合等。通過(guò)數(shù)據(jù)級(jí)凈化,可以進(jìn)一步提高數(shù)據(jù)的質(zhì)量和可用,為后續(xù)的數(shù)據(jù)分析和建模提供更有價(jià)值的數(shù)據(jù)支持。 在得到了大語(yǔ)言模型的數(shù)據(jù)之后,就是對(duì)其進(jìn)行預(yù)
    發(fā)表于 05-07 17:10

    【大語(yǔ)言模型:原理與工程實(shí)踐】大語(yǔ)言模型的評(píng)測(cè)

    是否與事實(shí)或邏輯相符;以及推理過(guò)程的完整,即模型在解題過(guò)程中是否提供了完整的推理鏈或證據(jù)支持。 摘要生成類評(píng)測(cè)任務(wù):考察大語(yǔ)言模型在內(nèi)容
    發(fā)表于 05-07 17:12

    基于信號(hào)完整分析的高速數(shù)字PCB的設(shè)計(jì)方法

    以依據(jù)芯片引腳的功能選用相似的或缺省的IBIS模型。當(dāng)然,也可以通過(guò)實(shí)驗(yàn)測(cè)量來(lái)建立簡(jiǎn)化的IBIS模型。   對(duì)于PCB板上的傳輸線,在進(jìn)行信號(hào)完整預(yù)
    發(fā)表于 06-14 09:14

    系統(tǒng)的電磁兼容分析模型及設(shè)計(jì)方法

    本帖最后由 sder1357 于 2011-10-24 09:21 編輯 系統(tǒng)的電磁兼容分析模型及設(shè)計(jì)方法1 電磁干擾的途徑及耦合過(guò)程1.1電磁干擾途徑透過(guò)屏蔽體將干擾耦合至屏蔽體內(nèi)透過(guò)
    發(fā)表于 10-19 19:51

    PCB設(shè)計(jì)常用板級(jí)信號(hào)完整分析模型zz

    的PCB板級(jí)信號(hào)完整分析,因此在高速數(shù)字PCB板設(shè)計(jì)中,需要混合上述幾種模型來(lái)最大程度地建立關(guān)鍵信號(hào)和敏感信號(hào)的傳輸模型。對(duì)于分立的無(wú)源器件,可以尋求廠家提供的SPICE
    發(fā)表于 11-20 10:31

    請(qǐng)問(wèn)這兩種機(jī)械手模型哪種實(shí)驗(yàn)性能更好,可擴(kuò)展性更好

    `我打算買(mǎi)個(gè)六軸機(jī)械手模型用來(lái)驗(yàn)證自動(dòng)運(yùn)行算法,但不知道從機(jī)械角度上來(lái)來(lái)說(shuō)哪種實(shí)驗(yàn)性能更好,可擴(kuò)展性更好,這兩種都是數(shù)字舵機(jī)帶動(dòng)的。麻煩給出為什么的理由,謝謝!左上角那種好像是工業(yè)機(jī)械手的模型,右下角那種是什么呢??jī)煞N應(yīng)該都可以
    發(fā)表于 07-15 17:00

    【下載】《信號(hào)完整分析

    `編輯推薦《國(guó)外電子與通信教材系列:信號(hào)完整與電源完整分析(第二版)》強(qiáng)調(diào)直覺(jué)理解、實(shí)用工具和工程素養(yǎng)。作者以實(shí)踐專家的視角指出造成信號(hào)完整性問(wèn)題的根源,并特別給出了設(shè)計(jì)階段前期的問(wèn)題解決
    發(fā)表于 09-19 18:21

    基于信號(hào)完整分析的高速數(shù)字PCB板的設(shè)計(jì)開(kāi)發(fā)

    以依據(jù)芯片引腳的功能選用相似的或缺省的IBIS模型。當(dāng)然,也可以通過(guò)實(shí)驗(yàn)測(cè)量來(lái)建立簡(jiǎn)化的IBIS模型。   對(duì)于PCB板上的傳輸線,在進(jìn)行信號(hào)完整預(yù)
    發(fā)表于 08-29 16:28

    用于自制合成器的實(shí)驗(yàn)性5鍵鍵盤(pán)

    描述5 開(kāi)關(guān)陣列用于自制合成器的實(shí)驗(yàn)性 5 鍵鍵盤(pán)。旨在與磁感應(yīng)簧片開(kāi)關(guān)、霍爾效應(yīng)傳感器或其他簡(jiǎn)單的按鈕和開(kāi)關(guān)一起使用。五個(gè)通道可以獨(dú)立運(yùn)行,也可以由一個(gè)公共輸入饋送并混合到一個(gè)公共輸出。在“混音”模式下,您可以為電阻、二極管等使用額外的空間/焊盤(pán)。大量未連接的焊盤(pán)用于其他定制。
    發(fā)表于 08-16 07:07

    一個(gè)用于Z20X的實(shí)驗(yàn)性CPU升級(jí)模塊

    描述Z20X電腦的ZNEO CPU板這是一個(gè) 用于 Z20X 的實(shí)驗(yàn)性 CPU 升級(jí)模塊,帶有 ZiLOG 的 16 位 ZNEO 處理器。與默認(rèn)的 eZ80 模塊不同,ZNEO 具有非常不同的引腳
    發(fā)表于 08-23 07:04

    實(shí)驗(yàn)性源極跟隨器電路圖

    實(shí)驗(yàn)性源極跟隨器電路圖
    發(fā)表于 08-08 16:43 ?828次閱讀
    <b class='flag-5'>實(shí)驗(yàn)性</b>源極跟隨器電路圖

    實(shí)驗(yàn)性AI將COVID輕度與嚴(yán)重區(qū)分開(kāi)

    由紐約大學(xué)的研究人員與中國(guó)的兩家醫(yī)院合作開(kāi)發(fā)的實(shí)驗(yàn)性決策支持工具可以幫助ER醫(yī)師確定哪些患者可以住院,哪些患者可以回家。這是在大流行期間做出的一個(gè)關(guān)鍵決定,大流行使許多醫(yī)院的資源超出了產(chǎn)能。
    的頭像 發(fā)表于 05-21 10:20 ?1923次閱讀

    基于模型的航空飛行安全分析技術(shù)綜述

    近年來(lái),基于模型的安全分析技術(shù)(MBSA)在航空等領(lǐng)堿有著廣泛應(yīng)用,因此對(duì)以ⅹSAP安全分析平臺(tái)為核心,基于MBSA的系統(tǒng)安全評(píng)估方法進(jìn)
    發(fā)表于 06-07 15:06 ?6次下載

    生成式摘要的經(jīng)典模型

    以往的標(biāo)題模型產(chǎn)生的都是平實(shí)標(biāo)題,即簡(jiǎn)單語(yǔ)言描述的事實(shí)性標(biāo)題。但是,實(shí)際上我們可能更需要有記憶點(diǎn)的爆款標(biāo)題來(lái)增加點(diǎn)擊量/曝光率。因此,衍生出了一個(gè)新任務(wù)——帶有風(fēng)格的標(biāo)題生成,即 S
    的頭像 發(fā)表于 07-08 17:04 ?2448次閱讀

    用于自制合成器的實(shí)驗(yàn)性5鍵鍵盤(pán)

    電子發(fā)燒友網(wǎng)站提供《用于自制合成器的實(shí)驗(yàn)性5鍵鍵盤(pán).zip》資料免費(fèi)下載
    發(fā)表于 07-28 11:38 ?0次下載
    用于自制合成器的<b class='flag-5'>實(shí)驗(yàn)性</b>5鍵鍵盤(pán)