0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI自發(fā)激活了數(shù)量感 挑選最喜歡的數(shù)字

電子工程師 ? 來源:fqj ? 2019-05-15 11:05 ? 次閱讀

人類和部分動物都具有一種數(shù)量感知能力,不需要刻意數(shù)數(shù),就能憑借視覺對數(shù)量多少得出一個基本判斷,甚至直接抽象出具體數(shù)量。比如一張圖片中有 4 個蘋果和 4 只狗,人類在觀察圖片并識別蘋果和狗的過程中,大腦自然而然就能形成 “兩類物體都有 4 個” 這樣的抽象概念。

雖然這種數(shù)感能力的準(zhǔn)確率會隨著數(shù)量級的上升而下降——我們很難憑感覺判斷圖片中有 100 只狗,還是 98 只——但是在一張有 98 只狗和 50 個蘋果的圖片中,我們依然可以對誰多誰少有一個大致準(zhǔn)確的概念。

更重要的是,這種能力似乎源自于大腦中的視覺感知區(qū)域,其中的神經(jīng)元在受到視覺刺激的情況下,也可以同時激活一部分?jǐn)?shù)感機制。

那么問題來了,我們發(fā)明的人工智能AI),尤其是所謂的模擬大腦工作機制的神經(jīng)網(wǎng)絡(luò),是否也具備這種能力呢?換言之,一個受到視覺訓(xùn)練的神經(jīng)網(wǎng)絡(luò),是否可以形成類似的數(shù)感機制?

近日,來自德國和美國的科學(xué)家就這一問題展開了研究,得出的結(jié)論是肯定的。他們在訓(xùn)練圖像分類 AI 系統(tǒng)時發(fā)現(xiàn),一些神經(jīng)元的激活模式與猴腦神經(jīng)元處理數(shù)量信息時的激活模式非常相似,而且它們甚至還發(fā)展出了對特定數(shù)字的偏好,足以說明神經(jīng)網(wǎng)絡(luò)可以從圖像中抽象出數(shù)量信息。

也就是說,在沒有進(jìn)行專門數(shù)數(shù)訓(xùn)練的情況下,神經(jīng)網(wǎng)絡(luò)僅憑視覺信息,就在一定程度上 “發(fā)展出” 了如何從中獲得數(shù)量信息,產(chǎn)生了類似于人類和動物的數(shù)量感知能力。

證實數(shù)感能力的存在,或許可以證明我們對生物智能的復(fù)制在某些方面是富有成效的。該研究成果發(fā)表于期刊 Science Advances 上。

人與計算機的不同“腦回路”

剛剛提到,現(xiàn)有神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是嘗試模擬人腦運作機制的產(chǎn)物,但計算機和人類的 “腦回路” 截然不同。

我們都知道,相比買菜找零都要算上幾秒鐘的人類,計算機的計算能力可以說是碾壓般的存在,每秒鐘可以完成上億次的運算,還能保證相當(dāng)高的精確度。當(dāng)然,這也是我們發(fā)明它的目的。

不過,人類的強大之處在于,可以通過直覺感知場景中物體的數(shù)量,還具有很強的抗干擾和類比能力,計算機卻必須收到確切的計算指令,比如給出圖片中狗的數(shù)量,才能開始執(zhí)行任務(wù)。

這種對于數(shù)量的感知能力也被稱為“數(shù)量感”,指的是快速理解、估計和產(chǎn)生數(shù)量,并對數(shù)量進(jìn)行表征以及理解數(shù)量間關(guān)系的能力。

研究顯示,人類和動物的大腦中存在特殊神經(jīng)元,能夠?qū)?shù)量和數(shù)值產(chǎn)生反應(yīng)。因此通過視覺刺激,我們可以對物體特征進(jìn)行抽象并表征其數(shù)量信息,甚至不受物體大小、顏色和形狀的影響。

遵循這一思路,德國和美國的研究人員將目光轉(zhuǎn)換到神經(jīng)網(wǎng)絡(luò)上,看看是否可以從中挖掘出類似的神經(jīng)元觸發(fā)機制。

無師自通的分類模型

他們選擇了受生物特性啟發(fā)而成的分層卷積神經(jīng)網(wǎng)絡(luò)(HCNN)作為實驗對象。該模型廣泛使用于計算機視覺應(yīng)用中,由多個前饋層和視網(wǎng)膜拓?fù)浣Y(jié)構(gòu)層組成,層中的每個網(wǎng)絡(luò)單元都可以模擬不同類型的視覺神經(jīng)元。

整個模型包含兩套網(wǎng)絡(luò):一個是特征提取網(wǎng)絡(luò),可以將自然圖像轉(zhuǎn)化成(特征的)高級表示;另一個是圖像分類網(wǎng)絡(luò),負(fù)責(zé)歸納和總結(jié)特征,將圖像按可能性分成不同類別。這兩個網(wǎng)絡(luò)包含了卷積層和池化層。

圖 | 訓(xùn)練識別物體的 HCNN 模型

模型構(gòu)建完成后,研究人員使用了知名的 ImageNet 數(shù)據(jù)集進(jìn)行圖像分類訓(xùn)練,其中約有 120 萬張圖像。訓(xùn)練過程與數(shù)量感知毫無關(guān)系,HCNN 只是學(xué)習(xí)普通的圖像分類任務(wù),其分類準(zhǔn)確率約為 49.9%。

隨后,為了搞清楚神經(jīng)元的激活方式,并且判斷是否存在數(shù)感機制,他們移除了圖像分類網(wǎng)絡(luò),僅保留了特征提取網(wǎng)絡(luò),而且模型的輸入圖片也從 ImageNet 變成了特制圖片。

研究團隊開發(fā)了三組用來刺激神經(jīng)元的圖像集,每一組都包含 30 張黑色圖片,上面分別有 1-30 個白點。第一組的每張圖片由大小不一的圓點組成。第二組每張圖片上所有圓點的總面積相同,因此隨著白點數(shù)量的增加,每個點的大小都會縮小。而第三組則包含了多種形狀,比如圓形,方形和三角形等。

圖 | 三組不同的刺激神經(jīng)元的圖像集

之所以選擇這些圖片,是因為它們幾乎沒有類別可言,不適合進(jìn)行圖像分類??墒侨绻麑⑺鼈兎湃氲?HCNN 分類模型中,得到反饋結(jié)果,研究人員就可以更好地查看神經(jīng)元的激活方式是否與數(shù)感機制相關(guān)。

通過雙向方差分析(ANOVA),他們可以篩選出那些對數(shù)量敏感的網(wǎng)絡(luò)單元,同時避免對神經(jīng)元的刺激和交互過程造成較大影響。

最終,在超過 3.7 萬個神經(jīng)元中,有 3601 個神經(jīng)元(約 9.6%)出現(xiàn)了數(shù)字選擇性,即出現(xiàn)了對某個數(shù)字的偏好,對相應(yīng)的視覺刺激(圖片)產(chǎn)生了反應(yīng)。

具體來說,一個神經(jīng)元只會對一個數(shù)字的刺激展現(xiàn)出最大的 “反應(yīng)(response)”,就好像是它“最喜歡的數(shù)字” 一樣。它的 “反應(yīng)” 還會隨著數(shù)字的不斷變化而逐漸衰退,兩個數(shù)字相差越大,“反應(yīng)”的衰減就越明顯。

AI自發(fā)激活了數(shù)量感 挑選最喜歡的數(shù)字

圖 | 不同神經(jīng)元有自己 “喜歡” 和“不感興趣”的數(shù)字

舉個例子,一個 “最喜歡” 數(shù)字 4 的神經(jīng)元,就會對一張包含 4 個白點的圖像展現(xiàn)出最激烈的“反應(yīng)”。如果給它看包含 12 個白點的圖片,它就會展現(xiàn)出不那么激烈的“反應(yīng)”。如果再增加到 30 個白點,它甚至都不會有什么“反應(yīng)”。

將所有數(shù)據(jù)以曲線的形式表達(dá)出來后,研究人員發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的激活模式與猴腦神經(jīng)元的激活模式高度相似,就連兩種神經(jīng)元的喜好分布規(guī)律都非常相近:更多的神經(jīng)元偏好小數(shù)字,其次是最大的數(shù)字,最后才是中間的數(shù)字,其中對 0-5 之間數(shù)字產(chǎn)生 “反應(yīng)” 的神經(jīng)元甚至超過六成。

AI自發(fā)激活了數(shù)量感 挑選最喜歡的數(shù)字

圖 | B 組圖表:神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的激活(響應(yīng))規(guī)律;C 組圖表:猴子大腦中神經(jīng)元的激活規(guī)律;D 組柱狀圖:神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的偏好分布;E 組柱狀圖:猴子大腦中神經(jīng)元的偏好分布

這意味著,一套經(jīng)過視覺訓(xùn)練的圖像分類神經(jīng)網(wǎng)絡(luò),在沒有接受任何計數(shù)訓(xùn)練和計算指令的情況下無師自通,其中的神經(jīng)元對不同數(shù)字發(fā)展出了不同的敏感度,運作機制跟人類和動物大腦的數(shù)感機制十分相似。

該實驗結(jié)果證明,數(shù)感能力天然存在于視覺系統(tǒng)的運作機制當(dāng)中,伴隨著獲取視覺信息和視覺刺激,數(shù)量感就會以副產(chǎn)品的形式自然而然地出現(xiàn)。這或許也可以解釋為什么在未經(jīng)訓(xùn)練的情況下,嬰幼兒和野生動物都會展現(xiàn)出數(shù)感。不過雖然數(shù)感能力可能是天生的,但它也是可以通過后天訓(xùn)練不斷加強的,兩者并不沖突。

另一方面,這項研究也證明了我們對神經(jīng)網(wǎng)絡(luò)的運作機制并非完全了解,仍然有尚未發(fā)現(xiàn)的特征提取模式,比如提取不存在于圖像分類訓(xùn)練中的高級數(shù)字特征,卻與人腦的數(shù)感機制類似,說明我們創(chuàng)造的神經(jīng)網(wǎng)絡(luò)可能比我們想象的更像人腦。

下一步,研究團隊打算嘗試更多類似的研究,試圖挖掘出更多未知的神經(jīng)網(wǎng)絡(luò)運作機制,比如它會如何對待按數(shù)量多少順序排列的物體,能否建立起與人腦類似的時間感知機制。這也是人類在計數(shù)過程中所使用的能力:理解 “每個數(shù)字都是前面數(shù)字 + 1” 這樣的抽象概念,而不是單純地將每個數(shù)字視為獨立個體。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:最新研究顯示:AI自發(fā)激活了數(shù)量感,并會挑選“最喜歡”的數(shù)字

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    電氣工程師最喜歡用的編程方法

    了再洗碗。那在自動化行業(yè)中設(shè)備也要遵循一點的邏輯。就比如這個最常用的機械手動作(如圖1),它也是一步步將物料搬運到指定位置。針對動作邏輯,電氣工程師最喜歡用的編程方法就是 “賦值比較法” 。 那針對這種方法,我們
    的頭像 發(fā)表于 10-29 09:32 ?255次閱讀
    電氣工程師<b class='flag-5'>最喜歡</b>用的編程方法

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后

    很幸運社區(qū)給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和深遠(yuǎn)影響。在
    發(fā)表于 10-14 09:21

    特斯拉德國柏林超級工廠激活超級電動通勤列車

    8月8日最新資訊,特斯拉德國柏林超級工廠近期成功激活了一項革命性的員工通勤方案——“Giga Train”超級電動通勤列車。此舉措旨在高效解決員工往返工廠的交通難題,預(yù)計每日將承載4500名員工穿梭于工廠與周邊居住區(qū)之間,為電動汽車的制造注入強勁動力。
    的頭像 發(fā)表于 08-08 16:05 ?1276次閱讀

    蘋果積極響應(yīng)并加入自發(fā)性人工智能(AI)安全規(guī)范體系

    7月26日最新資訊顯示,美國政府于上周五正式宣布,蘋果公司已積極響應(yīng)并加入由官方倡導(dǎo)的自發(fā)性人工智能(AI)安全規(guī)范體系,此前,包括OpenAI、亞馬遜、谷歌、Meta及微軟在內(nèi)的多家科技巨頭也已
    的頭像 發(fā)表于 07-27 14:29 ?540次閱讀

    炬芯科技與CyweeMotion攜手,共推AI技術(shù)革新智能穿戴領(lǐng)域應(yīng)用

    深圳咸兌科技有限公司,業(yè)界知名的CyweeMotion品牌持有者,與炬芯科技股份有限公司攜手構(gòu)建了長期戰(zhàn)略伙伴關(guān)系,旨在融合雙方技術(shù)精髓,引領(lǐng)AI技術(shù)在智能手表領(lǐng)域的革新
    的頭像 發(fā)表于 07-25 12:39 ?796次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)激活函數(shù)的作用

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNNs)是深度學(xué)習(xí)中一種重要的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),廣泛應(yīng)用于圖像識別、語音識別、自然語言處理等領(lǐng)域。在卷積神經(jīng)網(wǎng)絡(luò)中,激活函數(shù)
    的頭像 發(fā)表于 07-03 09:18 ?1121次閱讀

    扎心靈魂小拷問:有了AI編寫代碼之后,軟件工程師會被AI取代嗎?

    軟件開發(fā)者們有很多讓他們焦慮的事情。他們最擔(dān)心的不再是如何用他們最喜歡的編程語言(C、C++、Erlang、Java等)表達(dá)最新的算法。相反,這種擔(dān)憂正逐漸被人工智能(AI)所取代。 在這里,我們將探討AI編寫代碼的過程,并回
    的頭像 發(fā)表于 05-24 19:17 ?665次閱讀
    扎心靈魂小拷問:有了<b class='flag-5'>AI</b>編寫代碼之后,軟件工程師會被<b class='flag-5'>AI</b>取代嗎?

    三星貼片電容挑選技巧是什么呢?

    其實關(guān)于三星貼片電容的挑選技巧首先要注意三星貼片電容的表面質(zhì)量以及功能,這是比較重要的兩個方面,一般情況下,建議企業(yè)用戶在挑選電容的時候,可以根據(jù)這兩個細(xì)節(jié)做挑選。當(dāng)然,如果企業(yè)用戶不知道怎么
    的頭像 發(fā)表于 05-22 14:04 ?274次閱讀

    STM8蜂鳴器不響的原因?

    的狀態(tài)*/ Beep_Option_status=FLASH_ReadOptionByte(0x4803); /*Beep_Option_status的最高位為1激活了Beep,否則不激活
    發(fā)表于 05-10 07:16

    anigif.ocx注冊成功但是Labview的active容器沒有anigif選項

    已經(jīng)激活了anigif.ocx 但是activex容器里面沒有 然后我直接強硬選擇文件 結(jié)果是這樣 我看旁邊有個激活的選項 結(jié)果是這樣 各位大佬,這是怎么回事啦T-T 求解決~~
    發(fā)表于 04-25 22:40

    育碧發(fā)布全新生成式AI原型:NPC以自發(fā)行為展開對話

    近日,育碧巴黎工作室推出了一款名為 NEON NPC 的全新 AI 原型項目。借助 NVIDIA 的 Audio2Face 及 InWorld 的 LLM 大語言模型技術(shù),NPC可以根據(jù)角色設(shè)定自發(fā)生成對話。
    的頭像 發(fā)表于 03-20 10:17 ?471次閱讀

    AI女友比AI男友更受歡迎?前者是后者的700%+

    生成式 AI 催生了各種新的應(yīng)用類別,但其中最大的影響之一是重新激活了 AI 約會和陪伴……
    的頭像 發(fā)表于 03-18 09:07 ?443次閱讀

    LLM中的大規(guī)模激活

    篇論文主要研究了大型語言模型(LLMs)中的一個現(xiàn)象,即在模型的隱藏狀態(tài)中存在極少數(shù)激活值(activations)遠(yuǎn)大于其他激活值的情況,這些被稱為“massive activations”。
    的頭像 發(fā)表于 03-01 11:38 ?587次閱讀
    LLM中的大規(guī)模<b class='flag-5'>激活</b>

    名單公布!2024 春節(jié)有獎話題:春節(jié)最喜歡做的事是什么?精美禮品等你來領(lǐng)!

    美好時光。同時,也愿電子發(fā)燒友論壇越來越好,成為更多工程師的技術(shù)交流和學(xué)習(xí)的平臺。最后,祝您春節(jié)快樂,闔家幸福,萬事如意! 有獎話題:#春節(jié)最喜歡做的事是什么?# 春節(jié),不僅僅是一個節(jié)日,更是一個情感
    發(fā)表于 02-01 16:24

    國內(nèi)手機激活量同比下滑,華為和小米銷量逆勢上揚

    從各大廠商的表現(xiàn)來看,受益于Nova12系列的上市,華為以107.3萬臺的總激活數(shù)量排名第一。橫向比較,華為最近三周的平均激活量約為67萬臺,環(huán)比增長近乎翻番,實屬罕見。
    的頭像 發(fā)表于 01-24 09:33 ?820次閱讀