0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

識別「ChatGPT造假」,效果超越OpenAI:北大、華為的AI生成檢測器來了

智能感知與物聯(lián)網(wǎng)技術研究所 ? 來源:未知 ? 2023-06-06 11:05 ? 次閱讀
AI 造假的成功率很高,前幾天「10 分鐘騙 430萬」還上了熱搜。在最熱門的大語言模型上,研究人員最近探索了一種識別方法。

隨著生成式大模型的不斷進步,它們生成的語料正逐步逼近人類。雖然大模型正在解放無數(shù)文書的雙手,它以假亂真的強勁能力也為一些不法分子所利用,造成了一系列社會問題:

a3c9c258-0415-11ee-90ce-dac502259ad0.jpg

a3d3def0-0415-11ee-90ce-dac502259ad0.png

a3e93af2-0415-11ee-90ce-dac502259ad0.jpg

來自北大、華為的研究者們提出了一種識別各式 AI 生成語料的可靠文本檢測器。根據(jù)長短文本的不同特性,提出了一種基于 PU 學習的多尺度 AI 生成文本檢測器訓練方法。通過對檢測器訓練過程的改進,在同等條件下能取得在長、短 ChatGPT 語料上檢測能力的可觀提升,解決了目前檢測器對于短文本識別精度低的痛點。

a3fa0b3e-0415-11ee-90ce-dac502259ad0.jpg

  • 論文地址:https://arxiv.org/abs/2305.18149

  • 代碼地址 (MindSpore):https://github.com/mindspore-lab/mindone/tree/master/examples/detect_chatgpt

  • 代碼地址 (PyTorch):https://github.com/YuchuanTian/AIGC_text_detector

引言

隨著大語言模型的生成效果越發(fā)逼真,各行各業(yè)迫切需要一款可靠的 AI 生成文本檢測器。然而,不同行業(yè)對檢測語料的要求不同,例如在學術界,普遍需要對大段完整的學術文本進行檢測;在社交平臺上,需要對相對簡短而較為支離破碎的假消息進行檢測。然而,既有檢測器往往無法兼顧各式需求。例如,主流的一些 AI 文本檢測器對較短的語料預測能力普遍較差。

對于不同長度語料的不同檢測效果,作者觀察到較短的 AI 生成文本可能存在著一部分歸屬上的「不確定性」;或者更直白地說,由于一些 AI 生成短句同時也常常被人類使用,因而很難界定 AI 生成的短文本是否來自于人或 AI。這里列舉了幾個人和 AI 分別對同一問題做出回答的例子:

a40572d0-0415-11ee-90ce-dac502259ad0.jpg

由這些例子可見,很難對 AI 生成的簡短回答進行識別:這類語料與人的區(qū)別過小,很難嚴格判斷其真實屬性。因此,將短文本簡單標注為人類 / AI 并按照傳統(tǒng)的二分類問題進行文本檢測是不合適的。

針對這個問題,本研究將人類 / AI 的二分類檢測部分轉化為了一個部分 PU(Positive-Unlabeled)學習問題,即在較短的句子中,人的語言為正類(Positive),機器語言為無標記類(Unlabeled),以此對訓練的損失函數(shù)進行了改進。此改進可觀地提升了檢測器在各式語料上的分類效果。

算法細節(jié)

在傳統(tǒng)的 PU 學習設定下,一個二分類模型只能根據(jù)正訓練樣本和無標記訓練樣本進行學習。一個常用的 PU 學習方法是通過制定 PU loss 來估計負樣本對應的二分類損失:

a40beb4c-0415-11ee-90ce-dac502259ad0.jpg

其中,a414d34c-0415-11ee-90ce-dac502259ad0.jpg表示正樣本與正標簽計算的二分類損失;a428b0f6-0415-11ee-90ce-dac502259ad0.jpg表示將無標記樣本全部假定為負標簽計算的二分類損失;a438ba82-0415-11ee-90ce-dac502259ad0.jpg表示將正樣本假定為負標簽計算的二分類損失;a4413202-0415-11ee-90ce-dac502259ad0.jpg表示的是先驗正樣本概率,即正樣本在全部 PU 樣本中的預估占比。在傳統(tǒng)的 PU 學習中,通常將先驗a4413202-0415-11ee-90ce-dac502259ad0.jpg設置為一個固定的超參數(shù)。然而在文本檢測的場景中,檢測器需要處理各式長度不同的文本;而對于不同長度的文本而言,其正樣本在所有和該樣本相同長度的 PU 樣本中的預估占比也是不同的。因此,本研究對 PU Loss 進行了改進,提出了長度敏感的多尺度 PU(MPU)loss 損失函數(shù)。

具體地,本研究提出了一個抽象的循環(huán)模型對較短文本檢測進行建模。傳統(tǒng)的 NLP 模型在處理序列時,通常是一個馬爾可夫鏈的結構,如 RNN、LSTM 等。此類循環(huán)模型的這個過程通??梢岳斫鉃橐粋€逐漸迭代的過程,即每個 token 輸出的預測,都是由上一個 token 及之前序列的預測結果和該 token 的預測結果經(jīng)過變換、融合得到的。即以下過程:

a45364cc-0415-11ee-90ce-dac502259ad0.jpg

為了根據(jù)這個抽象的模型進行先驗概率的估計,需要假定該模型的輸出為某個句子為正類(Positive)的置信度,即判定為人說出的樣本的概率。假設每個 token 的貢獻大小為句子 token 長度的反比,是非正(Positive)即無標記(Unlabeled)的,且為無標記的概率遠遠大于為正的概率。因為隨著大模型的詞匯量逐漸逼近人類,絕大部分詞匯會同時出現(xiàn)在 AI 和人類語料中。根據(jù)這個簡化后的模型和設定好的正 token 概率,通過求出不同輸入情況下模型輸出置信度的總期望,來得到最終的先驗估計。

a46956f6-0415-11ee-90ce-dac502259ad0.jpg

通過理論推導和實驗,估計得到先驗概率隨著文本長度的上升而上升,最終逐漸穩(wěn)定。這種現(xiàn)象也符合預期,因為隨著文本變長,檢測器可以捕捉的信息更多,文本的 「來源不確定性」也逐漸減弱:

a47e50b0-0415-11ee-90ce-dac502259ad0.jpg

之后,對于每個正樣本,根據(jù)其樣本長度得到的獨特先驗對 PU loss 進行計算。最后,由于較短文本僅有部分 “不確定性”(即較短文本也會含有一些人或者 AI 的文本特征),可以對二分類 loss 和 MPU loss 進行加權相加,作為最終的優(yōu)化目標:

a48c7a78-0415-11ee-90ce-dac502259ad0.jpg

此外需要注意的是,MPU loss 適配的是長度較為多樣的訓練語料。倘若既有的訓練數(shù)據(jù)單質化明顯,大部分語料為大段冗長的文本,則無法全面發(fā)揮 MPU 方法的功效。為了使得訓練語料的長度更多樣化,本研究還引入了一個在句子層面進行多尺度化的模塊。該模塊隨機遮蓋訓練語料中的部分句子,并對余下句子在保留原有順序的前提下進行重組。經(jīng)過訓練語料的多尺度化操作,訓練文本得到了長度上的極大豐富,從而充分利用了 PU 學習進行 AI 文本檢測器訓練。

實驗結果

a4963482-0415-11ee-90ce-dac502259ad0.jpg

如上表所示,作者先在較短的 AI 生成語料數(shù)據(jù)集 Tweep-Fake 上檢驗 MPU loss 的效果。該數(shù)據(jù)集中的語料均為推特上較為短小的語段。作者又在傳統(tǒng)的語言模型微調基礎上將傳統(tǒng)二分類 loss 替換為含有 MPU loss 的優(yōu)化目標。改進之后的語言模型檢測器效果較為突出,超過了其它基線算法。

a4ac3962-0415-11ee-90ce-dac502259ad0.jpg

作者又對 chatGPT 生成文本進行了檢測,經(jīng)過傳統(tǒng)微調得到的語言模型檢測器在短句上表現(xiàn)較差;經(jīng)過 MPU 方式在同等條件下訓練得到的檢測器在短句上表現(xiàn)良好,且同時能夠在完整語料上取得可觀的效果提升,F(xiàn)1-score 提升了 1%,超越了 OpenAI 和 DetectGPT 等 SOTA 算法。

a4ca26d4-0415-11ee-90ce-dac502259ad0.jpg

如上表所示,作者在消融實驗中觀察了每個部分帶來的效果增益。MPU loss 加強了長、短語料的分類效果。

a4dd29a0-0415-11ee-90ce-dac502259ad0.jpg

作者還對比了傳統(tǒng) PU 和 Multiscale PU(MPU)。由上表可見 MPU 效果更勝一籌,能更好地適配 AI 多尺度文本檢測的任務。

總結

作者通過提出基于多尺度 PU 學習的方案,解決了文本檢測器對于短句識別的難題,隨著未來 AIGC 生成模型的泛濫,對于這類內容的檢測將會越來越重要。這項研究在 AI 文本檢測的問題上邁出了堅實的一步,希望未來會有更多類似的研究,把 AIGC 內容進行更好的管控,防止 AI 生成內容的濫用。


原文標題:識別「ChatGPT造假」,效果超越OpenAI:北大、華為的AI生成檢測器來了

文章出處:【微信公眾號:智能感知與物聯(lián)網(wǎng)技術研究所】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:識別「ChatGPT造假」,效果超越OpenAI:北大、華為的AI生成檢測器來了

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    AI真會人格分裂!OpenAI最新發(fā)現(xiàn),ChatGPT善惡開關已開啟

    AI現(xiàn)在就像一個小朋友,很容易就學壞了!OpenAI剛剛發(fā)現(xiàn),如果用錯誤的數(shù)據(jù)微調自家的模型的一個領域,ChatGPT就會把在這個領域學到的「惡」和「壞」泛化到其他領域。比如「刻意」用錯誤數(shù)據(jù)在汽車
    的頭像 發(fā)表于 06-20 12:41 ?366次閱讀
    <b class='flag-5'>AI</b>真會人格分裂!<b class='flag-5'>OpenAI</b>最新發(fā)現(xiàn),<b class='flag-5'>ChatGPT</b>善惡開關已開啟

    OpenAI嘗試減少對ChatGPT的審查

    近日,OpenAI宣布了一項新政策,旨在改變其訓練人工智能模型的方式,以明確擁護“知識自由”的理念。OpenAI強調,無論一個話題多么具有挑戰(zhàn)性或爭議性,都應當被平等對待和呈現(xiàn)。 據(jù)OpenAI表示
    的頭像 發(fā)表于 02-17 14:42 ?851次閱讀

    OpenAI計劃開發(fā)可替代手機的生成AI專用終端

    近日,據(jù)日經(jīng)報道,人工智能研究公司 OpenAI 的 CEO Sam Altman 在接受采訪時透露,OpenAI 計劃開發(fā)一款可替代手機的生成AI 專用終端。 據(jù)了解,
    的頭像 發(fā)表于 02-05 14:50 ?442次閱讀

    OpenAIChatGPT宕機事件致歉

    近日,全球領先的AI研究機構OpenAI遭遇了一次重大的服務中斷事件,其備受歡迎的聊天機器人ChatGPT在全球范圍內出現(xiàn)了宕機現(xiàn)象。與此同時,Sora及相關的API服務也受到了波及,無法正常運作
    的頭像 發(fā)表于 12-16 09:47 ?787次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無疑為AI技術注入了新的活力。 據(jù)悉,Sora與Ope
    的頭像 發(fā)表于 12-12 09:40 ?670次閱讀

    OpenAI發(fā)布滿血版ChatGPT Pro

    科技巨頭OpenAI近期宣布了一項重大更新,正式推出了其備受期待的“滿血版”ChatGPT Pro。這一新版本基于全新的推理模型o1,旨在為用戶提供更為強大的處理能力和更高質量的回答。 據(jù)了解
    的頭像 發(fā)表于 12-06 11:10 ?777次閱讀

    OpenAI推出Windows桌面版ChatGPT應用

    近日,OpenAI正式為微軟Windows 10和Windows 11用戶帶來了桌面版ChatGPT應用程序,這一創(chuàng)新之舉為用戶提供了更加便捷和高效的交互體驗。 據(jù)OpenAI產(chǎn)品開發(fā)
    的頭像 發(fā)表于 11-18 14:04 ?660次閱讀

    ChatGPT服務中斷,OpenAI正積極恢復

    近日,據(jù)OpenAI官方報道,他們發(fā)現(xiàn)ChatGPT服務出現(xiàn)了用戶暫時無法接入的問題。這一突發(fā)狀況引發(fā)了廣泛關注,許多用戶紛紛表達了對服務中斷的不滿和擔憂。 面對這一突發(fā)狀況,OpenAI迅速作出
    的頭像 發(fā)表于 11-11 13:38 ?817次閱讀

    OpenAI收購chat.com,強化ChatGPT品牌

    近日有消息報道,OpenAI在成功收購ai.com域名后,再次出手買下了chat.com這一極具價值的域名。相較于ai.com,chat.com更貼合OpenAI旗下熱門產(chǎn)品
    的頭像 發(fā)表于 11-08 11:08 ?808次閱讀

    OpenAI推出ChatGPT搜索功能

    近日,OpenAI再次邁出了重要的一步,為其廣受好評的ChatGPT平臺添加了一項全新的搜索功能。 據(jù)悉,這項被命名為“ChatGPT搜索”的新功能,將為用戶帶來前所未有的搜索體驗。以往,當用戶需要
    的頭像 發(fā)表于 11-04 10:34 ?650次閱讀

    OpenAIChatGPT增添搜索功能

    近日,OpenAI宣布為其旗艦產(chǎn)品ChatGPT增添全新的搜索功能,此舉標志著該公司對Alphabet旗下谷歌的直接挑戰(zhàn)進一步升級。OpenAI周四正式揭曉了這一名為“ChatGPT
    的頭像 發(fā)表于 11-01 17:01 ?719次閱讀

    華納云:ChatGPT 登陸 Windows

    ChatGPT 現(xiàn)已在 Windows 上推出。 今天,OpenAI宣布已開始預覽其 AI 聊天機器人平臺ChatGPT的專用 Windows 應用程序。
    的頭像 發(fā)表于 10-18 15:50 ?507次閱讀

    OpenAIChatGPT周活躍用戶突破2億

    OpenAI近日宣布了一項令人矚目的成就:其明星產(chǎn)品ChatGPT的周活躍用戶量已突破2億大關,僅用一年時間便實現(xiàn)了用戶數(shù)量的翻倍增長。自2022年問世以來,ChatGPT憑借其能夠根據(jù)用戶輸入
    的頭像 發(fā)表于 09-02 16:29 ?791次閱讀

    OpenAI承認正研發(fā)ChatGPT文本水印

    識別效果并不理想。而且因為多重顧慮OpenAI尚未正式發(fā)布這項工具。 據(jù)悉,OpenAI的這個識別工具本質上是在文字中創(chuàng)建一個不可見的水印
    的頭像 發(fā)表于 08-05 15:56 ?1248次閱讀

    手機檢測器電路圖 手機檢測器的功能和應用

    手機檢測器是一種通過發(fā)射基波信號,接收來自目標再輻射的2次、3次甚至是更高次的諧波/組合波信號,并對目標手機進行判斷、識別和探測的設備。與定位手機信號的設備相比,手機檢測器不僅能獲取目標手機的基波
    的頭像 發(fā)表于 06-28 17:19 ?3275次閱讀
    手機<b class='flag-5'>檢測器</b>電路圖 手機<b class='flag-5'>檢測器</b>的功能和應用

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品