0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器視覺中的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)分析

ThunderSoft中科創(chuàng)達(dá) ? 2017-12-01 11:26 ? 次閱讀

視覺不論對生物界還是人類,都起到了至關(guān)重要的作用。隨著人工智能浪潮的大勢來襲,包括機器視覺、計算機視覺等在內(nèi)的智能視覺也在人工智能領(lǐng)域逐步扮演著越來越重要的角色。

智能視覺涉及心理物理學(xué)、計算機科學(xué)、圖像處理、模式識別、神經(jīng)生物學(xué)等諸多領(lǐng)域,主要指利用計算機來模擬人或再現(xiàn)與人類有關(guān)的某些智能行為的技術(shù),客觀的來說,這是從事物的圖像中提取信息進行處理并加以理解,從而最終用于實際的生產(chǎn)生活中去的過程。

由此可見,圖像分析是智能視覺中最為重要的一環(huán)。圖像分析與圖像處理關(guān)系密切,兩者有一定程度的交叉,但是又有所不同。

圖像分析更側(cè)重點在于研究圖像的內(nèi)容,包括但不局限于使用圖像處理的各種技術(shù),它更傾向于對圖像內(nèi)容的分析、解釋、和識別;而圖像處理側(cè)重于信號處理方面的研究,如圖像對比度的調(diào)節(jié)、圖像編碼、去噪以及濾波的研究。

圖像分析和計算機科學(xué)領(lǐng)域中的模式識別、計算機視覺關(guān)系更密切一些。概括地說,圖像分析一般利用數(shù)學(xué)模型并結(jié)合圖像處理的技術(shù)來分析底層特征和上層結(jié)構(gòu),從而提取具有一定智能性的信息。

圖像分析要求我們?nèi)祟惤虝嬎銠C識別物品,我們把一類物品的大量圖片丟給計算機,讓計算機去識別它,然后我們根據(jù)不同物品的不同特點建立簡單的幾何模型,比如一些矩形、三角形、圓形等的組合,從而讓計算機更好地識別出不同物品。

然而,實際操作的結(jié)果與上述的原理出現(xiàn)了很大的偏差,因為在現(xiàn)實世界中同種物品也大多有著不同的形態(tài)。比如一個杯子,它的形狀可以是圓柱狀的、立方體的、不規(guī)則形狀的等等,如果按照上述的原理進行圖像分析的話,那我們需要為所有杯子設(shè)計出對應(yīng)的模型來教給計算機如何去識別“杯子”這一生活中簡單的物品,顯然這是不可能完成的任務(wù)。

所以后來,科學(xué)家們從孩子們學(xué)習(xí)的過程中獲得了靈感。孩子的父母在教育孩子認(rèn)識“杯子”的時候并沒有告訴孩子如何去構(gòu)建一個杯子的幾何模型,孩子們學(xué)會認(rèn)識“杯子”是什么物品是依靠經(jīng)驗來學(xué)習(xí)的。于是,科學(xué)家們用機器學(xué)習(xí)的方式來處理這個問題,而其中很重要的技術(shù)在于“卷積神經(jīng)網(wǎng)絡(luò)”。

“卷積神經(jīng)網(wǎng)絡(luò)”是一個多層的神經(jīng)網(wǎng)絡(luò),與其他深度學(xué)習(xí)網(wǎng)絡(luò)最大的區(qū)別是擁有可以與二維數(shù)據(jù)直接卷積操作的卷積層。卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點是能夠直接與圖像像素進行卷積,從圖像像素中提取圖像特征,這種處理方式更加接近人類大腦視覺系統(tǒng)的處理方式 。

卷積神經(jīng)網(wǎng)絡(luò)的基本網(wǎng)絡(luò)結(jié)構(gòu)可以分為四個部分:輸入層、卷積層、全連接層和輸出層。在利用卷積神經(jīng)網(wǎng)絡(luò)進行圖像分析的過程中,首先將圖片分解為部分重復(fù)的小區(qū)域,卷積神經(jīng)網(wǎng)絡(luò)中的小神經(jīng)元集合與輸入圖像的一個小區(qū)域相連,也就是相當(dāng)于把每一個小區(qū)域都輸入到神經(jīng)網(wǎng)絡(luò)中來識別。

這樣做的好處是集合有重疊的平鋪開來,網(wǎng)絡(luò)中的每一層都重復(fù)同樣的過程,所以網(wǎng)絡(luò)能夠容忍輸入圖像的一定程度上的變形。然后對輸入的圖像鄰域進行卷積處理得到圖像的鄰域特征圖,再通過池化技術(shù)將小鄰域內(nèi)進行下采樣過程從而得到新的特征。

如此一來,我們就將一個圖片縮減成了較小的序列,最后我們再將這個數(shù)列輸入到另外的一個“完全連接”神經(jīng)網(wǎng)絡(luò)中,這個網(wǎng)絡(luò)決定圖片是否匹配。所以整個過程經(jīng)過卷積化、最大池化、“完全連接”神經(jīng)網(wǎng)絡(luò),結(jié)合實際問題我們可以決定卷積、最大池化的次數(shù),卷積層增多有助于識別更加復(fù)雜的特征,調(diào)用最大池化函數(shù)有助于縮小數(shù)據(jù)大小。近年來卷積神經(jīng)網(wǎng)絡(luò)在圖像分析領(lǐng)域得到了廣闊的應(yīng)用。

隨著科技的高速發(fā)展,視覺智能領(lǐng)域的圖像分析過程也越來越充滿挑戰(zhàn)性,卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn)解決了傳統(tǒng)處理方式中出現(xiàn)的問題。

伴隨著人工神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展,人工智能的視覺智能在未來將更加高效、準(zhǔn)確,不斷進步的圖像分析過程也將為人工智能的發(fā)展帶來巨大優(yōu)勢,因此,我們絕對有理由相信,未來的人工智能將不斷為人類帶來驚喜。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器視覺
    +關(guān)注

    關(guān)注

    162

    文章

    4396

    瀏覽量

    120485
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47497

    瀏覽量

    239189

原文標(biāo)題:AI|讓我們來聊一聊智能視覺中的圖像分析過程

文章出處:【微信號:THundersoft,微信公眾號:ThunderSoft中科創(chuàng)達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    卷積神經(jīng)網(wǎng)絡(luò)的實現(xiàn)工具與框架

    : TensorFlow是由Google Brain團隊開發(fā)的開源機器學(xué)習(xí)框架,它支持多種深度學(xué)習(xí)模型的構(gòu)建和訓(xùn)練,包括卷積神經(jīng)網(wǎng)絡(luò)。TensorFlow以其靈活性和可擴展性而聞名,適用于研究和生產(chǎn)環(huán)境。 特點: 靈活性: Te
    的頭像 發(fā)表于 11-15 15:20 ?294次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的工作原理和應(yīng)用

    卷積神經(jīng)網(wǎng)絡(luò)(FCN)是深度學(xué)習(xí)領(lǐng)域中的一種特殊類型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),尤其在計算機視覺領(lǐng)域表現(xiàn)出色。它通過全局平均池化或轉(zhuǎn)置卷積處理任意尺寸
    的頭像 發(fā)表于 07-11 11:50 ?1225次閱讀

    循環(huán)神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)的區(qū)別

    循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)領(lǐng)域中兩種非常重要的神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-04 14:24 ?1397次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)與循環(huán)神經(jīng)網(wǎng)絡(luò)的區(qū)別

    網(wǎng)絡(luò)結(jié)構(gòu),分別適用于不同的應(yīng)用場景。本文將從基本概念、結(jié)構(gòu)組成、工作原理及應(yīng)用領(lǐng)域等方面對這兩種神經(jīng)網(wǎng)絡(luò)進行深入解讀。
    的頭像 發(fā)表于 07-03 16:12 ?3560次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的實現(xiàn)原理

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。本文將詳細(xì)介紹卷積
    的頭像 發(fā)表于 07-03 10:49 ?590次閱讀

    bp神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)區(qū)別是什么

    結(jié)構(gòu)、原理、應(yīng)用場景等方面都存在一定的差異。以下是對這兩種神經(jīng)網(wǎng)絡(luò)的比較: 基本結(jié)構(gòu) BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),由輸入層、隱藏層和
    的頭像 發(fā)表于 07-03 10:12 ?1283次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)和工作原理

    和工作原理。 1. 引言 在深度學(xué)習(xí)領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)是一種非常重要的模型。它通過模擬人類視覺系統(tǒng),能夠自動學(xué)習(xí)圖像的特征,從而實現(xiàn)對圖像的識別和分類。與傳統(tǒng)的
    的頭像 發(fā)表于 07-03 09:38 ?767次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)激活函數(shù)的作用

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNNs)是深度學(xué)習(xí)中一種重要的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),廣泛應(yīng)用于圖像識別、語音識別、自然語言處理等領(lǐng)域。在卷積
    的頭像 發(fā)表于 07-03 09:18 ?1173次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。本文將詳細(xì)介紹卷積
    的頭像 發(fā)表于 07-03 09:15 ?457次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)和訓(xùn)練過程

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一種在圖像識別、視頻處理、自然語言處理等多個領(lǐng)域廣泛應(yīng)用的深度學(xué)習(xí)算法。其獨特的網(wǎng)絡(luò)結(jié)構(gòu)和算法設(shè)計,使得CNN在
    的頭像 發(fā)表于 07-02 18:27 ?975次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理與實現(xiàn)

    1.卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。 卷積
    的頭像 發(fā)表于 07-02 16:47 ?648次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及其功能

    。 引言 深度學(xué)習(xí)是機器學(xué)習(xí)的一個分支,它通過模擬人腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能,實現(xiàn)對數(shù)據(jù)的自動學(xué)習(xí)和特征提取。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)
    的頭像 發(fā)表于 07-02 14:45 ?2446次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理是什么

    基本概念、結(jié)構(gòu)、訓(xùn)練過程以及應(yīng)用場景。 卷積神經(jīng)網(wǎng)絡(luò)的基本概念 1.1 神經(jīng)網(wǎng)絡(luò) 神經(jīng)網(wǎng)絡(luò)是一種受人腦
    的頭像 發(fā)表于 07-02 14:44 ?715次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    不同的神經(jīng)網(wǎng)絡(luò)模型,它們在結(jié)構(gòu)、原理、應(yīng)用等方面都存在一定的差異。本文將從多個方面對這兩種神經(jīng)網(wǎng)絡(luò)進行詳細(xì)的比較和分析。 引言 神經(jīng)網(wǎng)絡(luò)是一
    的頭像 發(fā)表于 07-02 14:24 ?4485次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理、結(jié)構(gòu)及訓(xùn)練過程

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是一種深度學(xué)習(xí)算法,廣泛應(yīng)用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。本文將詳細(xì)介紹卷積
    的頭像 發(fā)表于 07-02 14:21 ?2804次閱讀