說到Pooling,相信學(xué)習(xí)過CNN的朋友們都不會感到陌生。Pooling在中文當(dāng)中的意思是“池化”,在神經(jīng)網(wǎng)絡(luò)當(dāng)中非常常見,通常用的比較多的一種是Max Pooling,具體操作如下圖:
??結(jié)合圖像理解,相信你也會大概明白其中的本意。不過Pooling并不是只可以選取2x2的窗口大小,即便是3x3,5x5等等沒問題,步長(Stride)也是一個道理。除了在神經(jīng)網(wǎng)絡(luò)方面,Pooling為圖片打馬賽克也是可以取得不錯的效果,結(jié)合幾個例子看看。
??我們可以用Max Pooling先看看效果如何:
??Min Pooling和Average Pooling的操作也差不多,只不過把對應(yīng)的操作函數(shù)變了而已。
??Min Pooling:
??小動物的皮膚顏色都換了,再看看Average Pooling:
??綜上來看,Average Pooling似乎更加逼真一些,不過換一張圖片可能效果就不一樣了。
??以下是Pooling操作的代碼:
import cv2
import numpy as np
def average_pooling(img, G=5):
out = img.copy()
H, W, C = img.shape
Nh = H // G
Nw = W // G
for y in range(Nh):
for x in range(Nw):
for c in range(C):
out[G*y:G*(y+1), G*x:G*(x+1), c] = np.mean(out[G*y:G*(y+1), G*x:G*(x+1), c]).astype(np.int64)
return out
def max_pooling(img, G=5):
out = img.copy()
H, W, C = img.shape
Nh = H // G
Nw = W // G
for y in range(Nh):
for x in range(Nw):
for c in range(C):
out[G*y:G*(y+1), G*x:G*(x+1), c] = np.max(out[G*y:G*(y+1), G*x:G*(x+1), c]).astype(np.int64)
return out
def min_pooling(img, G=5):
out = img.copy()
H, W, C = img.shape
Nh = H // G
Nw = W // G
for y in range(Nh):
for x in range(Nw):
for c in range(C):
out[G*y:G*(y+1), G*x:G*(x+1), c] = np.min(out[G*y:G*(y+1), G*x:G*(x+1), c]).astype(np.int64)
return out
??由于是多顏色通道的圖片,所以記得別漏了這個參數(shù)。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4796瀏覽量
102175 -
馬賽克
+關(guān)注
關(guān)注
0文章
14瀏覽量
7121 -
cnn
+關(guān)注
關(guān)注
3文章
354瀏覽量
22561
原文標(biāo)題:Pooling與馬賽克的秘密
文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦

NDK 視頻傳輸馬賽克問題
基于ArkUI開發(fā)框架,圖片馬賽克處理的實(shí)現(xiàn)
數(shù)字電視的馬賽克業(yè)務(wù)
iPhone8支持去馬賽克功能,錢包已經(jīng)饑渴難耐
如何解決"馬賽克"問題呢?
如何解決LED顯示屏“馬賽克”問題
馬賽克模擬屏組成單元_馬賽克模擬屏的分類

iPhone13拍照有馬賽克 又現(xiàn)新bug
教程:在ArkUI開發(fā)框架中實(shí)現(xiàn)馬賽克處理功能

評論