0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于對圖像識(shí)別的深度學(xué)習(xí)算法的逐點(diǎn)剖析

姚小熊27 ? 來源:互聯(lián)網(wǎng) ? 作者:互聯(lián)網(wǎng) ? 2020-09-29 09:47 ? 次閱讀

如今,深度學(xué)習(xí)已經(jīng)貫穿于我們的生活,無論是汽車自動(dòng)駕駛、AI 醫(yī)學(xué)診斷,還是面部、聲音識(shí)別技術(shù),無一沒有 AI 的參與。然而,盡管人們早已明了深度學(xué)習(xí)的輸入和輸出,卻對其具體的學(xué)習(xí)過程一無所知。

近日,針對這一問題,奧本大學(xué)(Auburn university)計(jì)算機(jī)科學(xué)和軟件工程副教授 Anh Nguyen 對圖像識(shí)別的深度學(xué)習(xí)算法進(jìn)行了逐點(diǎn)剖析;無獨(dú)有偶,加州大學(xué)歐文分校(UC Irine) 計(jì)算機(jī)科學(xué)副教授 Sameer Singh 正在制作歸因圖(attribution maps),以幫助理解為何自然語言算法懂得與你交談,并說出一些涉及種族主義的話。

機(jī)器學(xué)習(xí)(machine learning)是人工智能的一種形式,它使用大量的數(shù)據(jù)來訓(xùn)練自己對某些問題形成算法。例如,向機(jī)器提供成千上萬張標(biāo)有“貓”的照片,它就能學(xué)會(huì)識(shí)別“貓”這一生物。

Nguyen 說,機(jī)器學(xué)習(xí)的想法可以追溯到 20 世紀(jì) 50 年代,但直到最近,計(jì)算機(jī)才能夠有效地處理大量數(shù)據(jù),并得出精確結(jié)果。到 20 世紀(jì) 90 年代,機(jī)器學(xué)習(xí)算法僅使用簡單的概念,但很明顯,現(xiàn)實(shí)生活中存在各種復(fù)雜的問題,從而需要更復(fù)雜的算法,這就是深度學(xué)習(xí)的意義所在。

與機(jī)器學(xué)習(xí)不同,深度學(xué)習(xí)(deep learning)不需要結(jié)構(gòu)化數(shù)據(jù)作為基礎(chǔ),利用人工神經(jīng)網(wǎng)絡(luò)(artificial neural net),即多個(gè)神經(jīng)元一起工作,通過這些“神經(jīng)元”來考慮數(shù)據(jù)并對數(shù)據(jù)進(jìn)行分類。

神經(jīng)網(wǎng)絡(luò)非常擅長圖像識(shí)別,當(dāng)向它們提供足夠的數(shù)據(jù)后,他們可以挑出人眼看不見的圖案或差異。利用這一點(diǎn),深度學(xué)習(xí)可以實(shí)現(xiàn)自動(dòng)駕駛汽車的行人偵查或腫瘤篩查。

但是, 當(dāng)出現(xiàn)超出其參數(shù)范圍的輸入時(shí),神經(jīng)網(wǎng)絡(luò)也會(huì)崩潰。在特定的,狹窄定義的任務(wù)中,深度學(xué)習(xí)通常優(yōu)于人類,但是一旦神經(jīng)網(wǎng)絡(luò)失效時(shí),往往會(huì)導(dǎo)致嚴(yán)重的后果。如果錯(cuò)誤識(shí)別的圖像發(fā)生在腫瘤患者身上或自動(dòng)駕駛車上時(shí),后果可能是致命的。

但問題是這些系統(tǒng)是如此的密集和復(fù)雜,人類無法理解它們,對人類來說,深度學(xué)習(xí)如同一個(gè)科技黑箱。除了令人不安之外,我們無法理解的計(jì)算機(jī)程序還可以做出一些不可預(yù)測的事情,并且當(dāng)它們出錯(cuò)時(shí),很難對其進(jìn)行反向工程或糾正。

正如 Nguyen 所說, “歸根結(jié)底,我們要搞清楚為什么神經(jīng)網(wǎng)絡(luò)的行為是這樣,而不是相反?!?/p>

揭示神經(jīng)網(wǎng)絡(luò)的想法

能徹底搞亂人工智能的數(shù)據(jù)被稱為“對抗性數(shù)據(jù)”,它會(huì)導(dǎo)致一個(gè)通??煽康纳窠?jīng)網(wǎng)絡(luò)犯下奇怪的錯(cuò)誤。靜態(tài)的、波浪狀的人字紋,以及五顏六色的條紋,可能被 AI 自信地識(shí)別為“蜈蚣”或“熊貓”。

不僅如此,一些常見的圖像也會(huì)讓深度學(xué)習(xí)人工智能崩潰。把消防車圖片倒過來,AI 就會(huì)看到一個(gè)大雪橇;放大一輛公共汽車的窗戶,它在 AI 眼中就變成了一個(gè)出氣筒。

“令人震驚的是,我們發(fā)現(xiàn)這些網(wǎng)絡(luò)會(huì)在某種程度上被這些奇怪的圖案所愚弄,這是我們從未想象過的?!盢guyen 表示。

為了找出原因,Nguyen 創(chuàng)建了一個(gè)叫做 DeepVis 的工具來分析神經(jīng)網(wǎng)絡(luò)算法。該工具能夠?qū)⑸钊雽W(xué)習(xí) AI 的完整程序分離開來,并顯示出單個(gè)神經(jīng)元正在識(shí)別的內(nèi)容。從這里開始,Nguyen 能夠打破深入學(xué)習(xí)AI的連續(xù)工作進(jìn)程,從而理解它是如何一步步達(dá)到最終檢測結(jié)果的。

將識(shí)別對象簡單的隨機(jī)旋轉(zhuǎn)幾次,就足以將 AI 的分類精度從 77.5% 降到3%

由于神經(jīng)網(wǎng)絡(luò)這種復(fù)雜性,對其所做的“解剖”對于人工智能開發(fā)人員最有用,提供的大量細(xì)節(jié)可以幫助科學(xué)家們更深入地理解破解黑箱所需的神經(jīng)網(wǎng)絡(luò)訓(xùn)練,就好比醫(yī)生對于腫瘤的研究一樣。

但是,即使使用 DeepVis,黑箱的秘密可能也不會(huì)完全打開。神經(jīng)元群的絕對復(fù)雜性可能讓人類難以理解,畢竟它是一個(gè)黑箱。

2016 年,來自波士頓大學(xué)和微軟研究院的研究人員為一種算法提供了 300 多萬英文單詞的數(shù)據(jù)集,數(shù)據(jù)從谷歌新聞文章中提齲研究人員重點(diǎn)關(guān)注那些最常用的英文單詞,然后讓算法做完形填空。

“男人(Man)之于程序員(computer programmer),那么女人(woman)之于什么”,機(jī)器通過算法“思考”后,得出答案:“家庭主婦(homemaker)”。

很明顯, AI也會(huì)發(fā)出類似于人類社會(huì)的性別歧視和種族主義言論。為了找出其中的原因,專注于破解自然語言處理(NLP)算法黑箱并提出深度學(xué)習(xí)思維(deep learning thinking)這一概念的 Sameer Singh,使用了一種叫做歸因圖(attribution map)的工具:將語言插入到文本生成 NLP 算法中,歸因圖將突出顯示某些部分,展示什么在神經(jīng)網(wǎng)絡(luò)內(nèi)部“發(fā)光”也許是一個(gè)特定的字母組合。

Singh 的團(tuán)隊(duì)首先使用某些單詞,開發(fā)出特殊的觸發(fā)器,然后,他們按照歸因圖所說的算法最“感興趣”的模板來修改這些單詞,最終的結(jié)果是一連串的文字和半拼寫錯(cuò)誤,從而引發(fā)了某些看起來像“種族主義”的言論。

“突出顯示的內(nèi)容對模型的預(yù)測或輸出有很大的影響,”Singh 說,利用這些信息,可以使用故意的對抗觸發(fā)器來嘗試發(fā)現(xiàn)問題,并理解深度學(xué)習(xí)算法中的聯(lián)系。這足以讓人們了解人工智能的想法。

雖然歸因圖也有缺點(diǎn),不同的地圖生成器可能彼此不一致,但是大概的理解可能是我們所能獲得的最好的理解。

AI 黑箱 VS 人類黑箱

事實(shí)上,隨著算法變得更加復(fù)雜、更加強(qiáng)大和不透明化,圍繞黑箱的問題也進(jìn)一步深入到哲學(xué)上:當(dāng)我們?nèi)祟愖约旱纳窠?jīng)網(wǎng)絡(luò)仍然神秘時(shí),要求 AI 神經(jīng)網(wǎng)絡(luò)完全透明是公平的嗎?

不得不承認(rèn),人類本身的神經(jīng)網(wǎng)絡(luò)也是一個(gè)黑箱。我們雖然知道一些物理結(jié)構(gòu),知道它們是如何工作,但對“思想”和“意識(shí)”的確切含義仍不清楚。

接下來我們是否應(yīng)該思考,機(jī)器模仿人腦并繼承其精確、靈活等優(yōu)點(diǎn)的同時(shí),是否也繼承了人性中的偏見?

當(dāng)然,隨著未來科學(xué)家們在深度學(xué)習(xí)領(lǐng)域中不斷取得的突破,由人類創(chuàng)造的 AI 黑箱終將變成“灰色”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評論

    相關(guān)推薦

    AI圖像識(shí)別攝像機(jī)

    ?AI圖像識(shí)別攝像機(jī)是一種集成了先進(jìn)算法深度學(xué)習(xí)模型的智能監(jiān)控設(shè)備。這些攝像機(jī)不僅能夠捕捉視頻畫面,還能實(shí)時(shí)分析和處理所拍攝的內(nèi)容,從而實(shí)現(xiàn)對特定對象、場景或行
    的頭像 發(fā)表于 11-08 10:38 ?324次閱讀
    AI<b class='flag-5'>圖像識(shí)別</b>攝像機(jī)

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識(shí)別 圖像識(shí)別
    的頭像 發(fā)表于 10-27 11:13 ?447次閱讀

    AI大模型在圖像識(shí)別中的優(yōu)勢

    大模型借助高性能的計(jì)算硬件和優(yōu)化的算法,能夠在短時(shí)間內(nèi)完成對大量圖像數(shù)據(jù)的處理和分析,顯著提高了圖像識(shí)別的效率。 識(shí)別準(zhǔn)確性 :通過深度
    的頭像 發(fā)表于 10-23 15:01 ?883次閱讀

    深度識(shí)別算法包括哪些內(nèi)容

    :CNN是深度學(xué)習(xí)中處理圖像和視頻等具有網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的主要算法。它通過卷積層、池化層和全連接層等組件,實(shí)現(xiàn)對圖像特征的自動(dòng)提取和
    的頭像 發(fā)表于 09-10 15:28 ?435次閱讀

    圖像識(shí)別算法有哪幾種

    計(jì)算機(jī)科學(xué)家開始嘗試使用計(jì)算機(jī)來處理和分析圖像數(shù)據(jù)。最初的圖像識(shí)別算法主要基于模板匹配和邊緣檢測等簡單方法,但隨著計(jì)算機(jī)硬件和算法的不斷發(fā)展,圖像識(shí)
    的頭像 發(fā)表于 07-16 11:22 ?1246次閱讀

    圖像檢測和圖像識(shí)別的原理、方法及應(yīng)用場景

    圖像檢測和圖像識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要概念,它們在許多應(yīng)用場景中發(fā)揮著關(guān)鍵作用。 1. 定義 1.1 圖像檢測 圖像檢測(Object Detection)是指在
    的頭像 發(fā)表于 07-16 11:19 ?4756次閱讀

    圖像識(shí)別算法都有哪些方法

    傳統(tǒng)方法和基于深度學(xué)習(xí)的方法。 傳統(tǒng)圖像識(shí)別算法 1.1 邊緣檢測 邊緣檢測是圖像識(shí)別的基礎(chǔ),它用于檢測
    的頭像 發(fā)表于 07-16 11:14 ?5880次閱讀

    圖像識(shí)別算法的提升有哪些

    引言 圖像識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的核心任務(wù)之一,旨在使計(jì)算機(jī)能夠自動(dòng)地識(shí)別和理解圖像中的內(nèi)容。隨著計(jì)算機(jī)硬件的發(fā)展和深度學(xué)習(xí)技術(shù)的突破,
    的頭像 發(fā)表于 07-16 11:12 ?713次閱讀

    圖像識(shí)別算法的優(yōu)缺點(diǎn)有哪些

    圖像識(shí)別算法可以快速地處理大量圖像數(shù)據(jù),提高工作效率。與傳統(tǒng)的人工識(shí)別方法相比,圖像識(shí)別算法
    的頭像 發(fā)表于 07-16 11:09 ?1829次閱讀

    圖像識(shí)別算法的核心技術(shù)是什么

    圖像識(shí)別算法是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要研究方向,其目標(biāo)是使計(jì)算機(jī)能夠像人類一樣理解和識(shí)別圖像中的內(nèi)容。圖像識(shí)別
    的頭像 發(fā)表于 07-16 11:02 ?707次閱讀

    圖像識(shí)別技術(shù)的原理是什么

    圖像識(shí)別技術(shù)是一種利用計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)對圖像進(jìn)行分析和理解的技術(shù)。它可以幫助計(jì)算機(jī)識(shí)別和理解圖像中的對象、場景和活動(dòng)。
    的頭像 發(fā)表于 07-16 10:46 ?1273次閱讀

    圖像識(shí)別屬于人工智能嗎

    屬于。圖像識(shí)別是人工智能(Artificial Intelligence, AI)領(lǐng)域的一個(gè)重要分支。 一、圖像識(shí)別概述 1.1 定義 圖像識(shí)別是指利用計(jì)算機(jī)技術(shù)對圖像中的內(nèi)容進(jìn)行分析
    的頭像 發(fā)表于 07-16 10:44 ?1234次閱讀

    opencv圖像識(shí)別有什么算法

    圖像識(shí)別算法: 邊緣檢測 :邊緣檢測是圖像識(shí)別中的基本步驟之一,用于識(shí)別圖像中的邊緣。常見的邊緣檢測算法
    的頭像 發(fā)表于 07-16 10:40 ?1155次閱讀

    如何利用CNN實(shí)現(xiàn)圖像識(shí)別

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)領(lǐng)域中一種特別適用于圖像識(shí)別任務(wù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它通過模擬人類視覺系統(tǒng)的處理方式,利用卷積、池化等操作,自動(dòng)提取圖像中的特征,進(jìn)而實(shí)現(xiàn)高效的
    的頭像 發(fā)表于 07-03 16:16 ?1484次閱讀

    圖像檢測和圖像識(shí)別的區(qū)別是什么

    圖像檢測和圖像識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要研究方向,它們在許多應(yīng)用場景中都有著廣泛的應(yīng)用。盡管它們在某些方面有相似之處,但它們之間還是存在一些明顯的區(qū)別。本文將從多個(gè)角度對圖像檢測和圖像識(shí)別
    的頭像 發(fā)表于 07-03 14:41 ?1142次閱讀