0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

【連載】深度學(xué)習(xí)筆記10:三維卷積、池化與全連接

人工智能實(shí)訓(xùn)營 ? 2018-10-25 20:09 ? 次閱讀


在上一講中,我們對(duì)卷積神經(jīng)網(wǎng)絡(luò)中的卷積操作進(jìn)行了詳細(xì)的解讀,但僅僅是對(duì)二維圖像,即通道數(shù)為 1 的圖像(灰度圖)進(jìn)行了卷積,對(duì)于三維或者更高維的圖像卷積顯然并沒有這么簡單。

如果圖像大小為 6*6*3,那么這里的 3 指的是三個(gè)顏色通道,你可以將其理解為 3 個(gè) 6*6 的圖像的堆疊,如果要對(duì)此圖像進(jìn)行卷積的話,我們的濾波器也需要變成三維的,假設(shè)采用一個(gè) 3*3*3 的濾波器對(duì)其進(jìn)行卷積(這里需要注意的是,濾波器的通道數(shù)一定要等于輸入圖像的通道數(shù)),根據(jù) ((n+2p-f)/s)+1 的計(jì)算公式我們可以知道輸出圖像的大小為 4*4*1,由一個(gè)濾波器進(jìn)行卷積之后輸出圖像的通道不是 3 而是 1 了。


那么究竟如何理解三通道的卷積過程?單通道的卷積操作我們已經(jīng)知道,就是直接對(duì)感受野與濾波器進(jìn)行元素相乘求和,那三通道呢?我們可以將 3*3*3 的濾波器想象為一個(gè)三維的立方體,為了計(jì)算立方體濾波器在輸入圖像上的卷積操作,我們首先將這個(gè)三維的濾波器放到左上角,讓三維濾波器的 27 個(gè)數(shù)依次乘以紅綠藍(lán)三個(gè)通道中的像素?cái)?shù)據(jù),即濾波器的前 9 個(gè)數(shù)乘以紅色通道中的數(shù)據(jù),中間 9 個(gè)數(shù)乘以綠色通道中的數(shù)據(jù),最后 9 個(gè)數(shù)乘以藍(lán)色通道中的數(shù)據(jù)。將這些數(shù)據(jù)加總起來,就得到輸出像素的第一個(gè)元素值。如下圖所示:


這樣做可能還不夠。在實(shí)際圖像處理中,僅靠單濾波器很難將復(fù)雜的圖像特征進(jìn)行充分提取。所以,通常而言,我們用來進(jìn)行卷積的濾波器遠(yuǎn)不止一個(gè)。下面我們用兩個(gè)濾波器對(duì)上述圖像進(jìn)行卷積操作。


我們用第一個(gè)濾波器進(jìn)行卷積得到一個(gè) 4*4 的輸出,然后用第二個(gè)濾波器進(jìn)行卷積又得到一個(gè) 4*4 的輸出,將這個(gè)輸出放到第一個(gè)輸出后面,形成了一個(gè) 4*4*2 的輸出,這里的 2 的就是濾波器的個(gè)數(shù)。

關(guān)于多通道卷積的另一種理解類似于 DNN 中的標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)中的 Z=Wx+b 的線性計(jì)算,其中 x 為輸入的原始圖像,W 為濾波器,b 偏差項(xiàng),卷積過程就類似與標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)的線性計(jì)算,完了之后利用激活函數(shù)進(jìn)行激活。還有一個(gè)關(guān)鍵問題就是卷積層有多少參數(shù),卷積層的參數(shù)通常在于濾波器 W,根據(jù)濾波器的大小,我們可以計(jì)算一個(gè)濾波器的參數(shù)數(shù)量為 f*f*nc,其中 nc 為通道熟量,那 k 個(gè)濾波器所含的參數(shù)數(shù)量則為 f*f*nc*k

卷積過程到此就差不多解釋完了。我們?cè)倏?CNN 的另一個(gè)重要操作——池化(pooling)。簡單來說,池化層是用來縮減模型大小,提高模型計(jì)算速度以及提高所提取特征的魯棒性。池化操作通常有兩種,一種是常用的最大池化(max pooling),另一種是不常用的平均池化(average pooling)。池化操作過程也非常簡單,假設(shè)池化層的輸入為一個(gè) 4*4 的圖像,我們用最大池化對(duì)其進(jìn)行池化,執(zhí)行最大池化的樹池是一個(gè) 2*2 的矩陣,執(zhí)行過程就是將輸入矩陣拆分為不同區(qū)域,對(duì)于 2*2 的輸出而言,輸出的每個(gè)元素都是其對(duì)應(yīng)區(qū)域的最大元素值。


最大池化過程就像是應(yīng)用了一個(gè) 2*2 的濾波器以步幅 2 進(jìn)行區(qū)域最大化輸出操作。所以簡單而言,池化的參數(shù)就是濾波器的大小 f 和步幅 s,池化的效果就相當(dāng)于對(duì)輸入圖像的高度和寬度進(jìn)行縮小。值得注意的是,最大池化只是計(jì)算神經(jīng)網(wǎng)絡(luò)某一層的靜態(tài)屬性,中間并沒有什么學(xué)習(xí)過程。

池化完成之后就是標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)中的全連接層了。全連接層我們?cè)?DNN 中有詳細(xì)介紹,這里就不再贅述??傊粋€(gè)典型的卷積層通常包括卷積層-池化層和全連接層。

下一講中,我們將一起嘗試如何利用 numpy 實(shí)現(xiàn)一個(gè)簡單的典型的卷積神經(jīng)網(wǎng)絡(luò)。

本文由《自興動(dòng)腦人工智能》項(xiàng)目部 凱文 投稿。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    南方智能推出三維地理實(shí)體生產(chǎn)軟件

    新型基礎(chǔ)測(cè)繪與實(shí)景三維中國建設(shè)持續(xù)推進(jìn),南方智能深度聚焦,基于自主研發(fā)的SmartGIS平臺(tái),打造以地理實(shí)體數(shù)據(jù)為核心的“生產(chǎn)、處理、質(zhì)檢、管理、可視化分析”實(shí)景三維系列軟件,提供
    的頭像 發(fā)表于 11-06 10:26 ?217次閱讀

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    。例如,最大值會(huì)選取窗口中的最大數(shù)據(jù)值而丟棄其它所有的值。這樣,數(shù)據(jù)量不斷減少,最終形成各個(gè)對(duì)象類別的唯一屬性。 卷積的結(jié)果是大量
    發(fā)表于 10-24 13:56

    三維觸摸面板-運(yùn)用觸感功能

    可以根據(jù)乘客的習(xí)慣和需求進(jìn)行個(gè)性的設(shè)置。 方向盤控制 :在方向盤上集成三維觸摸面板,駕駛員可以通過觸摸和按壓來控制車輛的巡航、多媒體、電話等功能,無需將手離開方向盤,進(jìn)一步提高了駕駛的便利性和安全性
    發(fā)表于 09-18 13:55

    三維可視的魅力與應(yīng)用

    三維可視是一種強(qiáng)大的工具,它融合了藝術(shù)、科學(xué)和技術(shù),通過在三維空間中呈現(xiàn)數(shù)據(jù)、概念和想法,為人們提供了一種直觀而生動(dòng)的方式來理解和探索信息。這項(xiàng)技術(shù)在當(dāng)今世界中的應(yīng)用非常廣泛,涵蓋了科學(xué)、教育
    的頭像 發(fā)表于 07-17 14:19 ?267次閱讀

    神經(jīng)網(wǎng)絡(luò)中的卷積層、層與連接

    深度學(xué)習(xí)中,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)是一種特別適用于處理圖像數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它通過卷積層、
    的頭像 發(fā)表于 07-11 14:18 ?5837次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的工作原理和應(yīng)用

    卷積神經(jīng)網(wǎng)絡(luò)(FCN)是深度學(xué)習(xí)領(lǐng)域中的一種特殊類型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),尤其在計(jì)算機(jī)視覺領(lǐng)域表現(xiàn)出色。它通過全局平均
    的頭像 發(fā)表于 07-11 11:50 ?1148次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)中層的作用

    深度學(xué)習(xí)領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)以其卓越的圖像處理和計(jì)算機(jī)視覺能力而廣受歡迎。CNN由多個(gè)層組成,其中包括卷積層、
    的頭像 發(fā)表于 07-03 15:58 ?1842次閱讀

    深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)作為其中的重要分支,已經(jīng)在多個(gè)領(lǐng)域取得了顯著的應(yīng)用成果。從圖像識(shí)別、語音識(shí)別
    的頭像 發(fā)表于 07-02 18:19 ?918次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)cnn中層的主要作用

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)領(lǐng)域中一種重要的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),廣泛應(yīng)用于圖像識(shí)別、語音識(shí)別、自然語言處理等領(lǐng)域。在CNN中,
    的頭像 發(fā)表于 07-02 14:50 ?1230次閱讀

    三維可視系統(tǒng)平臺(tái)介紹及優(yōu)勢(shì)

    三維可視 系統(tǒng)平臺(tái)是一種基于三維技術(shù)開發(fā)的軟件系統(tǒng),主要用于實(shí)現(xiàn)對(duì)三維空間中數(shù)據(jù)、模型、場(chǎng)景等內(nèi)容的可視展示和操作。這樣的系統(tǒng)平臺(tái)在各個(gè)
    的頭像 發(fā)表于 06-12 16:02 ?629次閱讀
    <b class='flag-5'>三維</b>可視<b class='flag-5'>化</b>系統(tǒng)平臺(tái)介紹及優(yōu)勢(shì)

    三維可視數(shù)據(jù)大屏的設(shè)計(jì)原理和技巧

    三維可視數(shù)據(jù)大屏設(shè)計(jì)面向交通、園區(qū)、城市、建筑、應(yīng)急等領(lǐng)域的客戶,以孿生可視能力賦能,提供行業(yè)解決方案。雙渲染引擎,1:1還原真實(shí)世界,在模型運(yùn)行流暢的基礎(chǔ)上提供極佳的視覺效果。今天,古河云
    的頭像 發(fā)表于 05-30 17:09 ?555次閱讀

    一種利用光電容積描記(PPG)信號(hào)和深度學(xué)習(xí)模型對(duì)高血壓分類的新方法

    層(Convolution、ReLU、LRN、Pooling)+3個(gè)連接層組成.它被認(rèn)為是深度學(xué)習(xí)領(lǐng)域的突破性架構(gòu),是對(duì)傳統(tǒng)深度
    發(fā)表于 05-11 20:01

    三維可視是怎么做的?特點(diǎn)有哪些?

    三維可視深入我們的生活當(dāng)中,它能直觀并且精準(zhǔn)的展示企業(yè)的場(chǎng)景情況,但是很多小伙伴并不清楚三維可視是怎么做的?特點(diǎn)有哪些?今天,古河云科技小編就來給大家聊一聊這一問題。
    的頭像 發(fā)表于 04-28 15:12 ?500次閱讀
    <b class='flag-5'>三維</b>可視<b class='flag-5'>化</b>是怎么做的?特點(diǎn)有哪些?

    三維掃描服務(wù)項(xiàng)目-工廠三維掃描建模

    工廠三維掃描,廠房三維掃描,工廠數(shù)字服務(wù),工廠三維掃描解決方案,逆向還原石化管線,完成工廠數(shù)據(jù),為工廠設(shè)施的設(shè)計(jì)改造和維修維護(hù)提供原始
    的頭像 發(fā)表于 04-26 09:46 ?565次閱讀
    <b class='flag-5'>三維</b>掃描服務(wù)項(xiàng)目-工廠<b class='flag-5'>三維</b>掃描建模

    泰來三維|文物三維掃描,文物三維模型怎樣制作

    文物三維掃描,文物三維模型怎樣制作:我們都知道文物是不可再生的,要繼續(xù)保存?zhèn)鞒?,需要文?b class='flag-5'>三維數(shù)字保護(hù),所以三維數(shù)字
    的頭像 發(fā)表于 03-12 11:10 ?635次閱讀
    泰來<b class='flag-5'>三維</b>|文物<b class='flag-5'>三維</b>掃描,文物<b class='flag-5'>三維</b>模型怎樣制作