0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能和人類看到的東西一樣嗎

汽車玩家 ? 來源:工程師曾玲 ? 2019-08-29 15:59 ? 次閱讀

為了讓深度學(xué)習(xí)算法像人類一樣用形狀來識別物體,研究人員用涂有不相干紋理的圖片來訓(xùn)練這些系統(tǒng)。結(jié)果表明:系統(tǒng)的表現(xiàn)得到了提高,這同時也為我們視覺的進化提供了線索。

當(dāng)你注視一張貓的照片,無論它被涂成姜黃色,被弄皺,變成黑白色,被污染,被磨損甚至是褪色,你都有可能把它識別出來。當(dāng)貓藏在枕頭后面或正在向工作臺上跳躍時,你同樣可能會識別出它。你已經(jīng)很自然地學(xué)會了在幾乎任何情況下識別一只貓。相比之下,由深度神經(jīng)網(wǎng)絡(luò)驅(qū)動的機器視覺系統(tǒng)有時甚至能在某些條件下比人類做得更好。但是在一些特殊的情形下,如圖片上有噪聲,顆粒等的情況下,機器的識別率會大打折扣。

德國的一個研究小組發(fā)現(xiàn)了導(dǎo)致這種情況的令人意想不到的原因:當(dāng)人類關(guān)注物體的形狀時,深度學(xué)習(xí)計算機視覺算法通常會關(guān)注物體的紋理。

這一發(fā)現(xiàn)使人類和機器的“思考”方式形成鮮明對比,并說明了我們的直覺可能誤導(dǎo)了人工智能的發(fā)展,同時也暗示了人類的視覺為什么會以現(xiàn)有的方式進化。

身著大象皮膚的貓咪和鐘表組成的飛機

深度學(xué)習(xí)算法的訓(xùn)練方法是向神經(jīng)網(wǎng)絡(luò)展示包含或不包含貓的數(shù)千幅圖像。系統(tǒng)從這些數(shù)據(jù)中找到一些模式,然后用這些模式來決定如何給從未見過的圖像貼上標(biāo)簽。該網(wǎng)絡(luò)的架構(gòu)粗略地模仿了人類視覺系統(tǒng)的架構(gòu),因為它相互連接的層可以讓它從圖像中提取越來越抽象的特征。這個系統(tǒng)通過一個黑箱過程來建立聯(lián)系,使其找到正確的答案,而人類只能在事后去理解這個過程?!拔覀円恢痹谠噲D找出這些深度學(xué)習(xí)計算機視覺算法成功的原因,和導(dǎo)致了它們的不穩(wěn)定的因素?!倍砝諏萘⒋髮W(xué)(Oregon State University)計算機科學(xué)家托馬斯·迪特里希(Thomas Dietterich)說。

大象皮膚的貓

為了做到這一點,一些研究人員來研究通過修改圖像來欺騙網(wǎng)絡(luò)時會發(fā)生什么。他們發(fā)現(xiàn),非常小的變化就能導(dǎo)致系統(tǒng)的識別結(jié)果完全錯誤,而大的變化又不會導(dǎo)致這些錯誤。與此同時,其他專家通過網(wǎng)絡(luò)去分析單個“神經(jīng)元”對圖像的反應(yīng),生成系統(tǒng)學(xué)得的“激活圖譜”的特征。

但德國圖賓根大學(xué)(University of Tubingen)計算神經(jīng)學(xué)家馬蒂亞斯貝斯格(Matthias Bethge)和心理物理學(xué)家費利克斯威克曼(Felix Wichmann)的實驗室里的一隊科學(xué)家采用了一種更加定性的方法。去年,這個小組訓(xùn)練一個對被某種特定噪音影響的圖像進行分類的神經(jīng)網(wǎng)絡(luò)時,發(fā)現(xiàn)它可以比人類做得更好。但是,當(dāng)這些圖像以一種稍微不同的方式改變時,它就完全失效了,盡管在人類看來,新的這兩種情況看起來幾乎一樣。

為了解釋這個結(jié)果,研究人員想到即使是只包含極小的噪聲其特征也會變化很大的特征量——紋理。貝斯格(Bethge)和威克曼實驗室的研究生、這項研究的主要作者羅伯特·吉爾霍斯(Robert Geirhos)說:“如果一直增加噪音,物體的形狀基本上是完好無損的。但是圖像中的局部結(jié)構(gòu)會隨著噪音的添加很快被扭曲?!彼运麄兿氤隽艘粋€聰明的方法來測試人和深度學(xué)習(xí)系統(tǒng)是如何處理圖像的。

貝斯格(Bethge)和威克曼的同事制作了包括兩種特征的圖像:其中形狀來自一個物體,紋理來自另一個物體。例如一只貓的輪廓顏色與大象的皮膚紋理,或者鋁罐構(gòu)成的熊或一架由鐘面填充的飛機。在展示了數(shù)百張這樣的圖片后,人類幾乎每次都會根據(jù)它們的形狀——貓、熊、飛機——給它們貼上標(biāo)簽,就像預(yù)期的那樣。然而,四種不同的分類算法卻傾向于另一種方式,它們貼出的標(biāo)簽反映了物體的紋理的識別:大象、罐頭、時鐘。

哥倫比亞大學(xué)的計算神經(jīng)學(xué)家Nikolaus Kriegeskorte說:“這改變了我們對深度前饋神經(jīng)網(wǎng)絡(luò)如何進行視覺識別的理解”。

乍一看,人工智能偏愛紋理甚于形狀似乎有些奇怪,但這是有道理的??死锔袼箍铺兀↘riegeskorte)說:“你可以把紋理想象成更微小尺度上的形狀。這種微小尺度更容易被系統(tǒng)捕捉到:包含紋理信息的像素數(shù)量遠(yuǎn)遠(yuǎn)超過構(gòu)成物體邊界的像素數(shù)量,而網(wǎng)絡(luò)的最初幾步包括檢測線和邊緣等局部特征。多倫多約克大學(xué)(York University)的計算視覺科學(xué)家約翰索索斯(John Tsotsos)說?!凹y理就是將以相同方式排列的線段分組?!?/p>

吉爾霍斯和他的同事已經(jīng)證明,這些局部特征足以讓網(wǎng)絡(luò)執(zhí)行圖像分類任務(wù)。事實上,貝斯格和該研究的另一名作者、博士后研究員維蘭德布倫德爾(Wieland Brendel)在一篇論文中也闡明了這一點。在這項工作中,他們建立了一個深度學(xué)習(xí)系統(tǒng),它運行起來很像深度學(xué)習(xí)出現(xiàn)之前的分類算法——就像一個“功能包”?!八褕D像分成小塊,就像現(xiàn)在的模型開始做的那樣,但是,接下來并不是整合這些信息逐步提取高級特性,而是直接判斷每個小塊的內(nèi)容。它只是將這些小塊加在一起來確定對象的身份,而沒有考慮每個小塊之間的全局空間關(guān)系。然而,它卻能以驚人的準(zhǔn)確度識別物體。

布倫德爾說:“這挑戰(zhàn)了‘深度學(xué)習(xí)正在做一些完全不同于以往的事情’的假設(shè)?!薄帮@然……這是一個飛躍。這一飛躍接近一些人的預(yù)期?!?/p>

約克大學(xué)(York University)和多倫多大學(xué)(University of Toronto)的博士后研究員阿米爾羅森菲爾德(Amir Rosenfeld)表示,“我們認(rèn)為神經(jīng)網(wǎng)絡(luò)應(yīng)該做的事情和它們實際做的事情之間仍然存在巨大差異”,包括它們在多大程度上重現(xiàn)了人類行為。

布倫德爾表達(dá)了類似的觀點。他說,一般我們假設(shè)神經(jīng)網(wǎng)絡(luò)將像我們?nèi)祟愐粯咏鉀Q任務(wù)。“但我們往往忘記還有其他方式。”

更人性化的方案

目前的深度學(xué)習(xí)方法可以將局部特征(如紋理)集成到更全局的模式(如形狀)中。克里格斯科特說:“在這些論文中,令人驚訝的一點是,盡管架構(gòu)允許這樣做,但如果你只是訓(xùn)練它(對標(biāo)準(zhǔn)圖像進行分類),它不會自動學(xué)會這種整合方式的。”

吉爾霍斯想看看當(dāng)團隊強制令他們的模型忽略紋理時會發(fā)生什么。該團隊拍攝了傳統(tǒng)上用于訓(xùn)練分類算法的圖像,并以不同的風(fēng)格“繪制”它們,本質(zhì)上剝離了它們有用的紋理信息。當(dāng)他們根據(jù)新的圖像重新訓(xùn)練每個深度學(xué)習(xí)模型時,系統(tǒng)開始依賴更大、更全局的模式,并表現(xiàn)出更像人類的對形狀的偏好。

圖賓根大學(xué)(University of Tubingen)計算神經(jīng)科學(xué)研究員維蘭德?布倫德爾(Wieland Brendel)發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)將圖像視為“特征包”,并依賴于這些特征信息對圖像對象進行分類。

當(dāng)這種情況發(fā)生時,算法也變得更善于對有噪聲的圖像進行分類,即使它們沒有接受過處理這種失真的訓(xùn)練?!盎谛螤畹木W(wǎng)絡(luò)變得更加強大,”吉爾霍斯說。“這告訴我們,對特定的任務(wù)有正確的偏好,也就是形狀偏好,在這種情況下,有助于將其推廣到一個新的背景?!?/p>

它還暗示,人類可能天生就有這種偏好,因為即使是在有噪聲的情況下,用形狀定義我們所看到的東西也是一種更有力的方式。人類生活在一個三維的世界里,在這個世界里,人們可以在許多不同的條件下從多個角度觀察物體,我們的其他感官,比如觸覺,可以根據(jù)需要幫助識別物體。所以我們的視覺將形狀置于紋理之上是有道理的。

威克曼說,這項研究提醒我們,“數(shù)據(jù)利用的偏好和影響比我們想象的要多?!边@并不是研究人員第一次遇到這樣的問題:面部識別程序、自動招聘算法和其他神經(jīng)網(wǎng)絡(luò)因為訓(xùn)練他們所用的數(shù)據(jù)存在自身的偏好,所以之前已經(jīng)被證明過于重視我們不太關(guān)注的特征。事實證明,在他們的決策過程中消除這些不必要的偏好是困難的,但威克曼表示,新的研究表明這是可能的。

然而,即使是關(guān)注形狀的吉爾霍斯模型,也可能被圖像中過多的噪音或特定的像素變化打敗——這表明它們距離實現(xiàn)人類水平的視覺還有很長的路要走。盡管如此,克里格斯科特說,通過這樣的研究,“我們可以很明確地說這些模型還沒有捕捉到人類大腦的重要機制。”“在某些情況下,”威克曼說,“也許研究數(shù)據(jù)集更重要?!?/p>

“我們需要設(shè)計更聰明的數(shù)據(jù)和更聰明的任務(wù),” 多倫多大學(xué)的計算機科學(xué)家費德勒(Sanja Fidler)說。她和她的同事們正在研究給予神經(jīng)網(wǎng)絡(luò)次要任務(wù)從而能幫助它們發(fā)揮主要功能。受吉爾霍斯發(fā)現(xiàn)的啟發(fā),他們最近訓(xùn)練了一種圖像分類算法,不僅能識別物體本身,還能識別出哪些像素是物體輪廓或形狀的一部分。網(wǎng)絡(luò)自動地在它的常規(guī)對象識別任務(wù)中變得更好。費德勒說:“給你一個任務(wù),你會選擇性關(guān)注某些特征而對其他很多事情都視而不見。”“如果我給你多個任務(wù),你可能會關(guān)注更多的方面。這些算法也是一樣的。解決不同的任務(wù)讓他們“對不同的信息產(chǎn)生偏好”,這與吉爾霍斯在形狀和紋理上的實驗相似。

迪特里希說,這些研究成果是令人興奮的一步,加深了我們對(深度學(xué)習(xí))現(xiàn)狀的理解,或許有助于我們克服目前所看到的局限?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47387

    瀏覽量

    238900
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5506

    瀏覽量

    121265
收藏 人收藏

    評論

    相關(guān)推薦

    嵌入式和人工智能究竟是什么關(guān)系?

    領(lǐng)域,如工業(yè)控制、智能家居、醫(yī)療設(shè)備等。 人工智能是計算機科學(xué)的個分支,它研究如何使計算機具備像人類一樣思考、學(xué)習(xí)、推理和決策的能力。
    發(fā)表于 11-14 16:39

    人工智能人類的影響有哪些

    人工智能(AI)作為現(xiàn)代科技的杰出代表,正在以前所未有的速度改變著人類的生活、工作和社會結(jié)構(gòu)。這種影響是全方位的,既帶來了顯著的積極變化,也伴隨著系列挑戰(zhàn)和問題。 、積極影響 工作
    的頭像 發(fā)表于 10-22 17:23 ?2043次閱讀

    Vicor技術(shù)如何改進生成式人工智能的供電

    生成式人工智能(genAI)帶來的文化革命可能像互聯(lián)網(wǎng)普及一樣人類產(chǎn)生深遠(yuǎn)影響。從您的角度來看,目前情況如何?
    的頭像 發(fā)表于 10-16 09:54 ?320次閱讀
    Vicor技術(shù)如何改進生成式<b class='flag-5'>人工智能</b>的供電

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    農(nóng)業(yè)、環(huán)保等,為人類社會的可持續(xù)發(fā)展做出貢獻。 總結(jié) 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們展示了個充滿希望和機遇的未來。在這個未來中,
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    深刻認(rèn)識到人工智能在推動科學(xué)進步中的核心價值。它不僅是科技進步的加速器,更是人類智慧拓展的催化劑,引領(lǐng)我們邁向個更加智慧、高效、可持續(xù)的科學(xué)研究新時代。
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V在人工智能圖像處理領(lǐng)域的應(yīng)用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應(yīng)用前景的詳細(xì)分析: 、RISC-V的基本特點 RISC-V
    發(fā)表于 09-28 11:00

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    ! 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》 這本書便將為讀者徐徐展開AI for Science的美麗圖景,與大家起去了解: 人工智能究竟幫科學(xué)家做了什么? 人工智能
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    呈現(xiàn)、產(chǎn)業(yè)展覽、技術(shù)交流、學(xué)術(shù)論壇于體的世界級人工智能合作交流平臺。本次大會暨博覽會由工業(yè)和信息化部政府采購中心、廣東省工商聯(lián)、前海合作區(qū)管理局、深圳市工信局等單位指導(dǎo),深圳市人工智能產(chǎn)業(yè)協(xié)會主辦
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    人工智能如何改變著各行各樣

    人工智能的風(fēng)起云涌,幾乎顛覆了千行百業(yè)創(chuàng)新的節(jié)奏,今天的人工智能就如同揮舞著“指揮棒”一樣,改變著各行各樣本來的“模樣”。
    的頭像 發(fā)表于 07-19 10:58 ?509次閱讀
    <b class='flag-5'>人工智能</b>如何改變著各行各樣

    Meta高管稱大語言模型永遠(yuǎn)無法像人類一樣

    Meta的人工智能主管楊立昆近日表示,盡管ChatGPT等生成式人工智能產(chǎn)品備受矚目,但其背后的大型語言模型(LLM)永遠(yuǎn)無法實現(xiàn)像人類一樣的推理和計劃能力。
    的頭像 發(fā)表于 05-27 09:50 ?448次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    課程類別 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 人工智能 參賽基礎(chǔ)知識指引 14分50秒 https://t.elecfans.com/v/25508.html *附件:參賽基礎(chǔ)知識指引
    發(fā)表于 04-01 10:40

    英偉達(dá)2024年GTC人工智能大會看點,黃仁勛發(fā)布最炸裂的B200 GPU,講述人工智能奇跡

    ABSTRACT摘要2024年GTC人工智能大會,和過去一樣,黃仁勛,這位穿黑色皮夾克的男人用兩個小時講述了人工智能的奇跡,發(fā)布最炸裂的B200GPU,以及讓人工智能唱歌跳舞的下
    的頭像 發(fā)表于 03-20 08:24 ?1021次閱讀
    英偉達(dá)2024年GTC<b class='flag-5'>人工智能</b>大會看點,黃仁勛發(fā)布最炸裂的B200 GPU,講述<b class='flag-5'>人工智能</b>奇跡

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能
    發(fā)表于 02-26 10:17