0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI的“隨機(jī)性”挑戰(zhàn):它們比人類更“不隨機(jī)”?

穎脈Imgtec ? 2025-02-20 13:11 ? 次閱讀

你有沒有想過,人類真的能做出完全隨機(jī)的選擇嗎?答案可能出乎你的意料。事實(shí)上,人類天生就不擅長“隨機(jī)”,我們總能在看似無序的事物中發(fā)現(xiàn)規(guī)律,甚至在本該隨機(jī)的場(chǎng)景中創(chuàng)造出模式。這種“偽隨機(jī)”行為,其實(shí)是一種獨(dú)特的人類特質(zhì)。最近,來自康奈爾大學(xué)探討了大語言模型(LLMs)在隨機(jī)性方面的表現(xiàn)。他們通過一個(gè)經(jīng)典的實(shí)驗(yàn)——生成二進(jìn)制隨機(jī)序列,來觀察這些模型是否能像人類一樣“不隨機(jī)”,或者是否能真正實(shí)現(xiàn)“隨機(jī)”。

研究結(jié)果令人驚訝。研究者發(fā)現(xiàn),GPT-4和Llama-3在生成隨機(jī)序列時(shí),不僅表現(xiàn)出人類的偏差,甚至還加劇了這些偏差。


真隨機(jī) 與 偽隨機(jī)

人類有一種奇妙的天賦——發(fā)現(xiàn)規(guī)律。我們總能在生活中找到各種模式:在咖啡的奶泡中看到人臉,在星空里描繪出星座,甚至因?yàn)橥洿┬疫\(yùn)衫而覺得勒布朗·詹姆斯投籃不中是自己的錯(cuò)。

然而,這種對(duì)規(guī)律的敏感也讓我們?cè)诿鎸?duì)“隨機(jī)性”時(shí)變得格外笨拙。比如,當(dāng)你讓一個(gè)人隨機(jī)選擇一個(gè)1到10之間的數(shù)字時(shí),他們大概率會(huì)選擇7;或者讓他們?cè)谀X海中拋硬幣,結(jié)果多半是正面。這些看似隨機(jī)的選擇,其實(shí)背后隱藏著可預(yù)測(cè)的規(guī)律。


拋硬幣實(shí)驗(yàn)背后的秘密

從20世紀(jì)初開始,人類對(duì)隨機(jī)性的研究就從未停止。早在1913年,F(xiàn)ernberger就指出,人類生成隨機(jī)序列的行為是一個(gè)復(fù)雜而迷人的課題。此后,無數(shù)研究發(fā)現(xiàn),人類生成的隨機(jī)序列與真正的隨機(jī)序列有著顯著的差異。

我們通過一個(gè)經(jīng)典的行為科學(xué)實(shí)驗(yàn)來研究這一問題:讓人類或機(jī)器生成一系列隨機(jī)結(jié)果,比如拋硬幣的序列,然后將這些序列與真正的隨機(jī)序列進(jìn)行比較。簡單來說,就是看看這些序列與“純粹的隨機(jī)性”有多大差距。


虛擬硬幣實(shí)驗(yàn)

▎溫度參數(shù):AI的“隨機(jī)性開關(guān)”

與人類不同,大語言模型有一個(gè)關(guān)鍵參數(shù)——溫度(temperature)。溫度決定了模型輸出的多樣性:溫度越低,輸出越一致;溫度越高,輸出越隨機(jī)、越多樣化。然而,當(dāng)溫度過高(比如超過1.5)時(shí),模型的輸出可能會(huì)變得混亂,甚至無法從中解析出硬幣的正反面。因此,我們的實(shí)驗(yàn)溫度范圍設(shè)定在0到1.5之間。

1d96ccd2-ef49-11ef-9434-92fbcf53809c.png

當(dāng)我們讓AI連續(xù)拋20次硬幣時(shí),結(jié)果同樣有趣。實(shí)驗(yàn)發(fā)現(xiàn),所有模型在序列的第一次拋硬幣中都傾向于選擇“正面”,這與人類的行為高度一致。無論溫度如何變化,這種“正面優(yōu)先”的傾向始終存在。這不僅揭示了AI在隨機(jī)性任務(wù)中繼承了人類的偏差,還表明這些偏差在某些情況下可能被進(jìn)一步放大。

▎AI的“第一印象”偏差

在我們的實(shí)驗(yàn)中,超過88%的AI生成的硬幣序列以“正面”開始,這一比例遠(yuǎn)遠(yuǎn)高于人類數(shù)據(jù)。這表明AI在“第一印象”上繼承了人類的偏差,并且表現(xiàn)得更加明顯。尤其是Llama-3,它的偏差比GPT系列模型更強(qiáng)。GPT-4和GPT-3.5之間也存在差異,GPT-4通常表現(xiàn)出更少的偏差。

1da737f2-ef49-11ef-9434-92fbcf53809c.png

這種“第一印象”偏差不僅出現(xiàn)在硬幣的正反面選擇中,還出現(xiàn)在其他二元選擇中,比如“真/假”或“A/B”。這可能暗示了語言中的“固定二元組”對(duì)AI的決策產(chǎn)生了影響。

▎AI的“平衡”偏差

在實(shí)驗(yàn)中,GPT-4和Llama-3生成的序列中,正面和反面的比例往往比隨機(jī)分布更接近50%,甚至比人類生成的序列還要“平衡”。例如,在8次拋硬幣的序列中,它們平均會(huì)有4次正面,這與人類的行為非常相似。不過,Llama-3在低溫時(shí)表現(xiàn)出輕微的正面偏好,而GPT-3.5在低溫時(shí)則表現(xiàn)出強(qiáng)烈的反面偏好,但在高溫時(shí)會(huì)逐漸接近人類的分布。

1db0fce2-ef49-11ef-9434-92fbcf53809c.png

▎連續(xù)序列與N-gram模式人類在生成隨機(jī)序列時(shí),往往會(huì)過度切換正面和反面,認(rèn)為這樣看起來更“隨機(jī)”。研究表明,人類序列的交替比例通常為60%,而真正的隨機(jī)序列應(yīng)該是50%。在AI實(shí)驗(yàn)中,這種“過度切換”的傾向被進(jìn)一步放大。例如,在8次拋硬幣的序列中,理論上應(yīng)該平均有3.5次交替,但AI模型的交替次數(shù)普遍高于這個(gè)值。GPT-4在低溫時(shí)幾乎總是生成“正反交替”的序列,而Llama-3則傾向于生成“正反正反……”或“正反正正……”的模式。

1dee9d18-ef49-11ef-9434-92fbcf53809c.png

本文轉(zhuǎn)自:Coggle數(shù)據(jù)科學(xué)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34588

    瀏覽量

    276150
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    561

    瀏覽量

    10709
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    322

    瀏覽量

    717
收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    labview怎么輸出不重復(fù)的整數(shù)隨機(jī)數(shù)

    大佬們我想問一下怎么能夠生成不重復(fù)的隨機(jī)數(shù),labview能夠輸出整數(shù)隨機(jī)數(shù)
    發(fā)表于 04-16 11:15

    隨機(jī)化在PCIe IDE驗(yàn)證中的重要

    本文將探討隨機(jī)化在 PCIe IDE 驗(yàn)證中的重要,重點(diǎn)介紹它如何在確保數(shù)據(jù)完整和加密可靠方面發(fā)揮關(guān)鍵作用,同時(shí)也揭示了該過程的獨(dú)特挑戰(zhàn)
    的頭像 發(fā)表于 03-06 09:27 ?428次閱讀
    <b class='flag-5'>隨機(jī)</b>化在PCIe IDE驗(yàn)證中的重要<b class='flag-5'>性</b>

    ADC12DJ3200采樣數(shù)據(jù)在FPGA端隨機(jī)性出現(xiàn)錯(cuò)點(diǎn),是什么原因?

    如題,我設(shè)置的前臺(tái)校準(zhǔn),F(xiàn)G—DONE沒有拉高,2C1寄存器0000_0010,208寄存器0111_1100。采樣數(shù)據(jù)在FPGA端隨機(jī)性出現(xiàn)錯(cuò)點(diǎn)。請(qǐng)問是什么原因?
    發(fā)表于 11-27 08:10

    內(nèi)存儲(chǔ)器分為隨機(jī)存儲(chǔ)器和什么

    內(nèi)存儲(chǔ)器是計(jì)算機(jī)系統(tǒng)中用于臨時(shí)存儲(chǔ)數(shù)據(jù)和程序的關(guān)鍵部件,它直接影響到計(jì)算機(jī)的運(yùn)行速度和性能。內(nèi)存儲(chǔ)器主要分為兩大類:隨機(jī)存儲(chǔ)器(RAM,Random Access Memory)和只讀存儲(chǔ)器(ROM
    的頭像 發(fā)表于 10-14 09:54 ?2651次閱讀

    隨機(jī)內(nèi)存儲(chǔ)器的特點(diǎn)有哪些

    運(yùn)行時(shí)的主要存儲(chǔ)器,因?yàn)樗峁┝丝焖俚臄?shù)據(jù)訪問速度,這對(duì)于執(zhí)行程序和處理數(shù)據(jù)至關(guān)重要。 隨機(jī)存取存儲(chǔ)器的特點(diǎn) 快速訪問速度 :RAM的訪問時(shí)間非常短,通常在納秒級(jí)別,這使得它能夠快速響應(yīng)CPU的指令和數(shù)據(jù)請(qǐng)求。 易失 :RAM是一種易失
    的頭像 發(fā)表于 10-14 09:51 ?1322次閱讀

    閃存隨機(jī)讀寫與連續(xù)讀寫哪個(gè)重要

    快速響應(yīng)的應(yīng)用中,如數(shù)據(jù)庫操作、服務(wù)器處理請(qǐng)求等,隨機(jī)讀寫速度至關(guān)重要。 多任務(wù)處理能力 : 隨機(jī)讀寫能力強(qiáng)的閃存能夠更有效地處理多個(gè)并發(fā)任務(wù),因?yàn)?b class='flag-5'>它們可以更快地訪問和修改存儲(chǔ)在不同位置的數(shù)據(jù)。 連續(xù)讀寫的重要
    的頭像 發(fā)表于 10-12 11:44 ?989次閱讀

    隨機(jī)存儲(chǔ)器的特點(diǎn)和結(jié)構(gòu)

    隨機(jī)存儲(chǔ)器最顯著的特點(diǎn)是其易失,即當(dāng)電源關(guān)閉時(shí),存儲(chǔ)在RAM中的數(shù)據(jù)會(huì)立即丟失。這是因?yàn)镽AM依賴于電流來維持其存儲(chǔ)的數(shù)據(jù)狀態(tài)。當(dāng)電源被切斷時(shí),RAM中的電容器會(huì)迅速放電,導(dǎo)致存儲(chǔ)的信息消失。這種特性使得RAM主要用于臨時(shí)存儲(chǔ)數(shù)據(jù)和程序,如操作系統(tǒng)、正在運(yùn)行的應(yīng)用程序以
    的頭像 發(fā)表于 09-26 18:18 ?2410次閱讀

    靜態(tài)隨機(jī)存儲(chǔ)器的定義和工作原理

    靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)是隨機(jī)存取存儲(chǔ)器(RAM)的一種,以其獨(dú)特的靜態(tài)存儲(chǔ)方式而著稱。所謂“靜態(tài)”,意味著只要保持通電狀態(tài),SRAM內(nèi)部存儲(chǔ)的數(shù)據(jù)就可以恒常保持,無需像動(dòng)態(tài)隨機(jī)
    的頭像 發(fā)表于 09-26 16:25 ?5449次閱讀
    靜態(tài)<b class='flag-5'>隨機(jī)</b>存儲(chǔ)器的定義和工作原理

    eprom可以采用隨機(jī)存取方式嗎

    EPROM(Erasable Programmable Read-Only Memory,可擦寫只讀存儲(chǔ)器)是一種早期的非易失存儲(chǔ)技術(shù),它允許用戶通過紫外線照射來擦除存儲(chǔ)器中的數(shù)據(jù),并通過編程器
    的頭像 發(fā)表于 09-18 11:13 ?2338次閱讀

    淺析隨機(jī)相位雙向可控硅光耦

    可控硅光耦利用光信號(hào)在電路間傳輸,實(shí)現(xiàn)電氣隔離與交流電控制,由發(fā)光二極管和光電雙向品閘管組成,是交流負(fù)載控制的理想選擇??煽毓韫獍?b class='flag-5'>隨機(jī)相位雙向可控硅光和零交叉雙向可控硅光兩大類;產(chǎn)品描述
    的頭像 發(fā)表于 09-12 10:13 ?809次閱讀
    淺析<b class='flag-5'>隨機(jī)</b>相位雙向可控硅光耦

    EMI衰減技術(shù),雙隨機(jī)擴(kuò)散光譜應(yīng)用說明

    電子發(fā)燒友網(wǎng)站提供《EMI衰減技術(shù),雙隨機(jī)擴(kuò)散光譜應(yīng)用說明.pdf》資料免費(fèi)下載
    發(fā)表于 09-11 11:44 ?0次下載
    EMI衰減技術(shù),雙<b class='flag-5'>隨機(jī)</b>擴(kuò)散光譜應(yīng)用說明

    雅特力AT32 MCU的隨機(jī)數(shù)生成

    概述產(chǎn)品和生態(tài)系統(tǒng)安全的需求比以往任何時(shí)候都更加重要。真隨機(jī)數(shù)是所有安全系統(tǒng)的核心,其質(zhì)量會(huì)影響設(shè)計(jì)的安全。因此在沒有內(nèi)置硬件TRNG的AT32的微控制器系列中,如何提高隨機(jī)數(shù)的有
    的頭像 發(fā)表于 08-30 12:26 ?1136次閱讀
    雅特力AT32 MCU的<b class='flag-5'>隨機(jī)</b>數(shù)生成

    EMI降低技術(shù):雙隨機(jī)展頻

    電子發(fā)燒友網(wǎng)站提供《EMI降低技術(shù):雙隨機(jī)展頻.pdf》資料免費(fèi)下載
    發(fā)表于 08-23 09:16 ?0次下載
    EMI降低技術(shù):雙<b class='flag-5'>隨機(jī)</b>展頻

    如何在FPGA中實(shí)現(xiàn)隨機(jī)數(shù)發(fā)生器

    分享如何在Xilinx Breadboardable Spartan-7 FPGA, CMOD S7中實(shí)現(xiàn)4位偽隨機(jī)數(shù)發(fā)生器(PRNGs)。
    的頭像 發(fā)表于 08-06 11:20 ?1136次閱讀
    如何在FPGA中實(shí)現(xiàn)<b class='flag-5'>隨機(jī)</b>數(shù)發(fā)生器

    無功補(bǔ)償隨機(jī)補(bǔ)償和隨器補(bǔ)償?shù)膮^(qū)別

    無功補(bǔ)償?shù)?b class='flag-5'>隨機(jī)補(bǔ)償和隨器補(bǔ)償是兩種不同的補(bǔ)償策略,它們在應(yīng)用場(chǎng)景、控制方法和效果上存在差異。 一、隨機(jī)補(bǔ)償 1、概述 隨機(jī)補(bǔ)償是指無功補(bǔ)償設(shè)備(如電容器、無功補(bǔ)償柜等)根據(jù)電網(wǎng)中無功功
    的頭像 發(fā)表于 07-18 14:20 ?1289次閱讀
    無功補(bǔ)償<b class='flag-5'>隨機(jī)</b>補(bǔ)償和隨器補(bǔ)償?shù)膮^(qū)別

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品