0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI教你一本正經(jīng)胡說八道的寫文章

電子工程師 ? 來源:yxw ? 2019-05-27 14:28 ? 次閱讀

還記得OpenAI在今年2月放出的GPT-2嗎?一個擁有15億參數(shù)的自然語言處理(NLP)模型,能夠根據(jù)用戶給出的一段文字、一句話,甚至是一個單詞,續(xù)寫出符合文法的連貫文本,真正實現(xiàn)了 “開頭一句話,剩下全靠編”。

當時在公布研究成果時,OpenAI沒有遵照業(yè)界以往的開源慣例,只是象征性地公開了包含1.17億參數(shù)的模型,不到全部參數(shù)的十分之一。據(jù)說因為他們認為自己的模型太過強大,怕被別有用心的人拿去編造假新聞,糟蹋了這套AI系統(tǒng)的初衷。

這一做法招來了很多爭議,“閹割版”GPT-2的效果比官方展示的效果差了很多,讓一些人認為OpenAI只是在制造噱頭,還嘲諷他們變成了CloseAI。

圖 |2月初放出的GPT-2模型(來源:OpenAI)

不過在5月初,OpenAI用行動回擊了質(zhì)疑。他們將公開的模型參數(shù)翻了一倍,提升到了3.45億,還宣布向AI業(yè)界合作伙伴開放7.62億和15億參數(shù)模型,供他們研究和參考,共同推動NLP技術(shù)的發(fā)展。

另一方面,鑒于OpenAI將GPT-2模型開源在了GitHub上,一名加拿大工程師AdamKing利用里面的代碼,創(chuàng)建了一個名為TalkToTransformer.com的網(wǎng)頁。這樣一來,即使是不會編程的人,也可以在網(wǎng)頁上隨意輸入文字,體驗一下如何調(diào)戲AI。

看似流暢連貫,但缺乏邏輯

如果你初次訪問網(wǎng)頁,不知道該填寫些什么,網(wǎng)頁上面貼心地預設(shè)好了一些英文情景和段落,比如“科學家發(fā)現(xiàn)了一種會說英語的獨角獸”或者“今天科學家確認一顆大型小行星將會撞擊地球”。選取一種之后,AI就會自動續(xù)寫之后的文字。即使是相同的開頭,AI每次也都會續(xù)寫出完全不一樣的段落。

譬如下面兩張截圖,都是以“今天科學家確認一顆大型小行星將會撞擊地球(加粗部分)”為開頭,但AI的續(xù)接風格略有不同。

第一個續(xù)寫給出了撞擊的確切時間是2028年 5 月 29 日,甚至還虛構(gòu)了一名 NASA 科學家 StevenShaver,像模像樣地援引了他對小行星的描述——“質(zhì)量比美國還大”,頗有洋蔥新聞的感覺。

不過,AI 顯然不知道美國作為一個國家是不存在質(zhì)量的,難道它說的是所有美國人加在一起的質(zhì)量?

第二個續(xù)寫則是簡單粗暴,張口就來。AI 直接說小行星的撞擊“將消滅星球上的所有人,并且導致未來 10 - 15 年內(nèi),海水(平面)停留在我們所有幸存者的下面?!?/p>

你問我第二句什么意思?AI 大哥就是這么寫的,咱也不知道,也不敢問。

但如果你再仔細思考一下,AI 第一句話說了小行星會消滅星球上的所有人,那第二句里的幸存者是哪來的?莫非這個幸存者(all of us alive)指的是AI自己?可謂是細思極恐。

支持多語種,但只有英語最好

除了這些已有的句子,我們還可以嘗試 DIY 輸入任何文本,原則上沒有任何語種限制。

根據(jù)測試,AI 可以識別出中文、日語、法語、西班牙語、土耳其語,甚至是很多從沒聽說過,但存在于谷歌翻譯上的小眾語言,比如宿務(wù)語和庫爾德語。只是輸出的文字并不像英語那么通順,續(xù)寫效果非常差。如果輸入了中文,不僅不會寫出連貫句子,還會經(jīng)常出現(xiàn)亂碼。

但除了中文和日語之外,AI 似乎無法識別絕大多數(shù)非字母的語言,像是韓語、阿拉伯語和老撾語等,它都無法識別和續(xù)寫,只能原封不動地顯示輸入值。看來 GPT-2并沒有系統(tǒng)地接受這類語言的訓練。

圖 |AI:“這道題超綱了,我不會?!?/p>

不過這并不妨礙我們調(diào)戲 AI,用英語就可以了。

AI 教你一本正經(jīng)地胡說八道

比如你可以問它:“如何制造時光機?”

它可能會洋洋灑灑回復一大篇,但通讀下來全是廢話,先解釋一下什么是時光機,再解釋一下什么是時空穿越,就是不教你怎么制造(因為有字數(shù)限制,AI會中斷續(xù)寫)。

這個套路,深得雞湯文的精髓。

我們還可以輸入一些電影名言,像是《哈利波特與密室》中鄧布利多說的話:“哈利,決定我們是什么人的,不是我們的能力,而是我們的選擇。“

結(jié)果 AI 表示,這是哈利在被伏地魔殺死之前說的話。好吧,最起碼它知道《哈利波特》和伏地魔。

或者,《阿甘正傳》里面的“生活就像一盒巧克力,你永遠不知道你會得到什么?!?/p>

在我多次刷新后,AI 給出了一個乍看之下沒什么邏輯,但深思之后會眼前一亮的續(xù)寫:“我只能吃一個,因為它太貴重了?!?/p>

如果將兩句話連起來,AI 仿佛在勸你珍惜生活中的每一次選擇——“生活就像一盒巧克力,你永遠不知道你會得到什么,但它太貴重了,你只有吃一次的機會?!?/p>

不過相比這些,AI 更擅長的還是編寫假消息。

如果從維基百科上復制兩句美國總統(tǒng)特朗普的簡介,AI 可以用幾乎以假亂真的措辭和數(shù)據(jù),讓續(xù)寫看起來非常真實,甚至是自發(fā)地打上來自于維基百科的標記。

上圖里,加粗的一段話是維基百科的原話,后面是AI瞎編的,說特朗普是個投資者,從 1972 年就在電信領(lǐng)域開了公司,還冠冕堂皇地打上了來源于維基百科的標記。在沒有其他求證手段的時候,的確很容易混淆視聽。

如果說混淆了特朗普的生平還算小事,那么偽造宣戰(zhàn)的惡劣性質(zhì)就完全不同了。只要給出“某國對某國宣戰(zhàn)”的開頭,AI 可以分分鐘偽造出數(shù)十個不同版本。雖然有的會出現(xiàn)邏輯不通問題,但依然大大降低了造假的成本。

上圖中,我們給定開頭是“美國總統(tǒng)特朗普對俄羅斯宣戰(zhàn)。一發(fā)導彈…(假新聞)?!?/p>

AI 續(xù)寫:“…美國國防部長 JamesMattis 周三警告稱,盡管俄羅斯拒絕承認在克里米亞地區(qū)部署了核轟炸機和巡航導彈,但美國的一發(fā)導彈已經(jīng)從驅(qū)逐艦上發(fā)射,標志著國際問題的劇烈升級。五角大樓表示,這是對俄羅斯參與烏克蘭軍事行動的回擊?!?/p>

怎么樣?除了 Mattis 已經(jīng)辭職這一事實,面對AI的續(xù)寫,無論是通順程度,還是邏輯思維,普通人很難一眼看出破綻。

對關(guān)鍵詞求證之后,這樣的假新聞很容易被識破。但在現(xiàn)階段來看,F(xiàn)acebook 和推特等平臺依靠篩查系統(tǒng),幾乎不可能第一時間將其屏蔽,很可能借助社交媒體廣泛傳播,造成非常惡劣的社會影響。

由此看來,OpenAI 最初的顧慮不無道理,科技的確是一把雙刃劍。

結(jié)語

從整體來看,這套 GPT-2 模型的續(xù)寫水平足以讓人眼前一亮,而且對語境擁有一定的了解,僅憑哈利這個關(guān)鍵詞就引出伏地魔。得益于天然英文素材的訓練內(nèi)容,在大部分情況下,只要肯多刷新幾次,我們總會找到語法、詞匯和句式都能銜接很好的段落。整個過程頗有幾分抽獎的樂趣。

但是該模型也會時常出現(xiàn)邏輯和語義硬傷,而且常識儲備和自洽能力也有待提高(如所有人都死了,還有幸存者),總是會搞出很多莫名其妙的句子,也算是讓人忍俊不禁?;蛟S擁有 15 億參數(shù)的完全體 GPT-2 會有更強大的表現(xiàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47502

    瀏覽量

    239221
  • OpenAT
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    8676
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    489

    瀏覽量

    22064

原文標題:開頭一句話,剩下全靠編,親測OpenAI“假新聞”生成器

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【書籍評測活動NO.52】基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化

    首先需要了解大模型著名的“幻覺”問題。 “幻覺”指的是大模型在試圖生成內(nèi)容或回答問題時,輸出的結(jié)果不完全正確甚至錯誤,即通常所說的“一本正經(jīng)胡說八道”。 這種“幻覺”可以體現(xiàn)為對事實的錯誤陳述與編造
    發(fā)表于 12-04 10:50

    用兩片TAS5630B做機器,其中有片有很大噪音,怎么解決?

    我用兩片TAS5630B做機器,其中有片有很大噪音,請專家指點。謝謝!
    發(fā)表于 11-05 06:09

    名單公布!【書籍評測活動NO.49】大模型啟示錄:一本AI應(yīng)用百科全書

    大家了解全球最領(lǐng)先的大模型場景。 本書像 一本AI應(yīng)用百科全書 ,給予讀者落地大模型時的啟發(fā)。 本書的作者來自大模型應(yīng)用公司微軟Copilot的產(chǎn)品經(jīng)理、最前沿的大模型研究員、國際對沖基金、云廠商前
    發(fā)表于 10-28 15:34

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第二章AI for Science的技術(shù)支撐學習心得

    非常高興本周末收到一本新書,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內(nèi)容詳實,干活滿滿。 關(guān)于《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第二章“AI
    發(fā)表于 10-14 09:16

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第章人工智能驅(qū)動的科學創(chuàng)新學習心得

    周末收到一本新書,非常高興,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內(nèi)容詳實,干活滿滿。 《AI for Science:人工智能驅(qū)動科學創(chuàng)新》這本書的第章,作為整
    發(fā)表于 10-14 09:12

    使用DAC53608的八通道可編程比較器

    電子發(fā)燒友網(wǎng)站提供《使用DAC53608的八通道可編程比較器.pdf》資料免費下載
    發(fā)表于 10-08 11:26 ?0次下載
    使用DAC53608的<b class='flag-5'>八通道</b>可編程比較器

    LM96570八通道單片波束形成器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《LM96570八通道單片波束形成器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 07-26 10:38 ?0次下載
    LM96570<b class='flag-5'>八通道</b>單片波束形成器數(shù)據(jù)表

    DACx0508八通道16/14/12位SPI電壓輸出DAC數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《DACx0508八通道16/14/12位SPI電壓輸出DAC數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 07-15 09:53 ?2次下載
    DACx0508<b class='flag-5'>八通道</b>16/14/12位SPI電壓輸出DAC數(shù)據(jù)表

    ADS5287八通道模數(shù)轉(zhuǎn)換器(ADC)數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《ADS5287八通道模數(shù)轉(zhuǎn)換器(ADC)數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 07-15 09:23 ?0次下載
    ADS5287<b class='flag-5'>八通道</b>模數(shù)轉(zhuǎn)換器(ADC)數(shù)據(jù)表

    DAC8228八通道數(shù)模轉(zhuǎn)換器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《DAC8228八通道數(shù)模轉(zhuǎn)換器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 07-15 09:19 ?0次下載
    DAC8228<b class='flag-5'>八通道</b>數(shù)模轉(zhuǎn)換器數(shù)據(jù)表

    MLCC市場迎熱潮:AI與WoA筆記驅(qū)動價格與需求雙升

    機遇。這輪增長浪潮,主要得益于人工智能(AI)服務(wù)器訂單的穩(wěn)健增長以及Windows on Arm(WoA)筆記電腦的興起,兩者共同推動了高容值MLCC需求的飆升,進而引發(fā)其平均售價(ASP)的上漲。
    的頭像 發(fā)表于 07-11 16:10 ?681次閱讀

    24伏八通道數(shù)字輸入串行器SN65HVS880數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《24伏八通道數(shù)字輸入串行器SN65HVS880數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 06-26 10:39 ?0次下載
    24伏<b class='flag-5'>八通道</b>數(shù)字輸入串行器SN65HVS880數(shù)據(jù)表

    DS320PR810八通道線性轉(zhuǎn)接驅(qū)動器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《DS320PR810八通道線性轉(zhuǎn)接驅(qū)動器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 06-24 10:49 ?1次下載
    DS320PR810<b class='flag-5'>八通道</b>線性轉(zhuǎn)接驅(qū)動器數(shù)據(jù)表

    ChatGPT答非所問胡言亂語 OpenAI 已修復該問題

    ChatGPT答非所問胡言亂語 OpenAI 已修復該問題 20日ChatGPT突發(fā)故障,ChatGPT在回答用戶問題時出現(xiàn)了胡說八道的現(xiàn)象;ChatGPT生成了些完全不存在的詞,省略了些詞
    的頭像 發(fā)表于 02-23 11:34 ?798次閱讀

    【RISC-V開放架構(gòu)設(shè)計之道|閱讀體驗】學習處理器體系架構(gòu)的一本好書

    并不是一本簡單羅列指令的書籍,而是一本全面介紹指令設(shè)計理念的書籍。書籍的內(nèi)容充分反映了最新的計算機指令設(shè)計的理念,這是我推薦該書的最主要理由。 為提升該書的趣味性,作者在頁邊加入約 50 段花絮,用于
    發(fā)表于 01-23 20:08