0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一些常見的圖像分類任務(wù)中 額外支持的8種數(shù)據(jù)增廣方法

機(jī)器人創(chuàng)新生態(tài) ? 來源:機(jī)器人創(chuàng)新生態(tài) ? 作者:機(jī)器人創(chuàng)新生態(tài) ? 2020-09-23 10:03 ? 次閱讀

如果要把深度學(xué)習(xí)開發(fā)過程中幾個(gè)環(huán)節(jié)按重要程度排個(gè)序的話,相信準(zhǔn)備訓(xùn)練數(shù)據(jù)肯定能排在前幾位。要知道一個(gè)模型網(wǎng)絡(luò)被編寫出來后,也只是一坨代碼而已,和智能基本不沾邊,它只有通過學(xué)習(xí)大量的數(shù)據(jù),才能學(xué)會(huì)如何作推理。因此訓(xùn)練數(shù)據(jù)其實(shí)和一樣?xùn)|西非常像!——武俠小說中的神功秘笈,學(xué)之前菜鳥一只,學(xué)之后一統(tǒng)江湖!

但很可惜的是,訓(xùn)練數(shù)據(jù)和秘笈還有一個(gè)特點(diǎn)很相似,那就是可遇而不可求!也就是說很難獲取,除了那些公共數(shù)據(jù)集之外,如果用戶想基于自己的業(yè)務(wù)場景準(zhǔn)備數(shù)據(jù)的話,不僅數(shù)據(jù)的生產(chǎn)和標(biāo)注過程會(huì)比較復(fù)雜,而且一般需要的數(shù)量規(guī)模也會(huì)非常龐大,因?yàn)橹挥谐渥愕臄?shù)據(jù),才能確保模型訓(xùn)練的效果,這導(dǎo)致數(shù)據(jù)集的制作成本往往非常高。這個(gè)情況在計(jì)算機(jī)視覺領(lǐng)域尤甚,因?yàn)閳D像要一張一張拍攝與標(biāo)注,要是搞個(gè)幾十萬圖片,想想都讓人“不寒而栗”! 為了應(yīng)對上述問題,在計(jì)算機(jī)視覺領(lǐng)域中,圖像數(shù)據(jù)增廣是一種常用的解決方法,常用于數(shù)據(jù)量不足或者模型參數(shù)較多的場景。如果用戶手中數(shù)據(jù)有限的話,則可以使用數(shù)據(jù)增廣的方法擴(kuò)充數(shù)據(jù)集。一些常見的圖像分類任務(wù)中,例如ImageNet一千種物體分類,在預(yù)處理階段會(huì)使用一些標(biāo)準(zhǔn)的數(shù)據(jù)增廣方法,包括隨機(jī)裁剪和翻轉(zhuǎn)。除了這些標(biāo)準(zhǔn)的數(shù)據(jù)增廣方法之外,飛槳的圖像分類套件PaddleClas還會(huì)額外支持8種數(shù)據(jù)增廣方法,下面將為大家逐一講解。

下文所有的代碼都來自PaddleClas:

GitHub 鏈接:

https://github.com/PaddlePaddle/PaddleClas

Gitee 鏈接:

https://gitee.com/paddlepaddle/PaddleClas

8大數(shù)據(jù)增廣方法

首先咱們先來看看以ImageNet圖像分類任務(wù)為代表的標(biāo)準(zhǔn)數(shù)據(jù)增廣方法,該方法的操作過程可以分為以下幾個(gè)步驟:

圖像解碼,也就是將圖像轉(zhuǎn)為Numpy格式的數(shù)據(jù),簡寫為 ImageDecode。

圖像隨機(jī)裁剪,隨機(jī)將圖像的長寬均裁剪為 224 大小,簡寫為 RandCrop。

水平方向隨機(jī)翻轉(zhuǎn),簡寫為 RandFlip。

圖像數(shù)據(jù)的歸一化,簡寫為 Normalize。

圖像數(shù)據(jù)的重排。圖像的數(shù)據(jù)格式為[H, W, C](即高度、寬度和通道數(shù)),而神經(jīng)網(wǎng)絡(luò)使用的訓(xùn)練數(shù)據(jù)的格式為[C, H, W],因此需要對圖像數(shù)據(jù)重新排列,例如[224, 224, 3]變?yōu)閇3, 224, 224],簡寫為 Transpose。

多幅圖像數(shù)據(jù)組成 batch 數(shù)據(jù),如 BatchSize 個(gè)[3, 224, 224]的圖像數(shù)據(jù)拼組成[batch-size, 3, 224, 224],簡寫為 Batch。

相比于上述標(biāo)準(zhǔn)的圖像增廣方法,研究者也提出了很多改進(jìn)的圖像增廣策略,這些策略均是在標(biāo)準(zhǔn)增廣方法的不同階段插入一定的操作,基于這些策略操作所處的不同階段,大概分為三類:

圖像變換類:對 RandCrop 后的 224 的圖像進(jìn)行一些變換,包括AutoAugment和RandAugment。

圖像裁剪類:對Transpose 后的 224 的圖像進(jìn)行一些裁剪,包括CutOut、RandErasing、HideAndSeek和GridMask。

圖像混疊:對 Batch 后的數(shù)據(jù)進(jìn)行混合或疊加,包括Mixup和Cutmix。

PaddleClas中集成了上述所有的數(shù)據(jù)增廣策略,每種數(shù)據(jù)增廣策略的參考論文與參考開源代碼均在下面的介紹中列出。下文將介紹這些策略的原理與使用方法,并以下圖為例,對變換后的效果進(jìn)行可視化。

圖像變換類

通過組合一些圖像增廣的子策略對圖像進(jìn)行修改和跳轉(zhuǎn),這些子策略包括亮度變換、對比度增強(qiáng)、銳化等。基于策略組合的規(guī)則不同,可以劃分為AutoAugment和RandAugment兩種方式。

01

AutoAugment

論文地址:

https://arxiv.org/abs/1805.09501v1

不同于常規(guī)的人工設(shè)計(jì)圖像增廣方式,AutoAugment是在一系列圖像增廣子策略的搜索空間中通過搜索算法找到并組合成適合特定數(shù)據(jù)集的圖像增廣方案。針對ImageNet數(shù)據(jù)集,最終搜索出來的數(shù)據(jù)增廣方案包含 25 個(gè)子策略組合,每個(gè)子策略中都包含兩種變換,針對每幅圖像都隨機(jī)的挑選一個(gè)子策略組合,然后以一定的概率來決定是否執(zhí)行子策略中的每種變換。 PaddleClas中AutoAugment的使用方法如下所示。 fromppcls.data.imaugimportDecodeImage
fromppcls.data.imaugimportResizeImage
fromppcls.data.imaugimportImageNetPolicy
fromppcls.data.imaugimporttransform

size=224
#圖像解碼
decode_op=DecodeImage()
#圖像隨機(jī)裁剪
resize_op=ResizeImage(size=(size,size))
#使用AutoAugment圖像增廣方法
autoaugment_op=ImageNetPolicy()

ops=[decode_op,resize_op,autoaugment_op]
#圖像路徑
imgs_dir=“/imgdir/xxx.jpg”
fnames=os.listdir(imgs_dir)
forfinfnames:
data=open(os.path.join(imgs_dir,f)).read()
img=transform(data,ops) 變換結(jié)果如下圖所示。

02

RandAugment

論文地址: https://arxiv.org/pdf/1909.13719.pdf AutoAugment 的搜索方法比較暴力,直接在數(shù)據(jù)集上搜索針對該數(shù)據(jù)集的最優(yōu)策略,計(jì)算量會(huì)很大。在 RandAugment對應(yīng)的論文中作者發(fā)現(xiàn),針對越大的模型,越大的數(shù)據(jù)集,使用 AutoAugment 方式搜索到的增廣方式產(chǎn)生的收益也就越??;而且這種搜索出的最優(yōu)策略是針對指定數(shù)據(jù)集的,遷移能力較差,并不太適合遷移到其他數(shù)據(jù)集上。 在 RandAugment 中,作者提出了一種隨機(jī)增廣的方式,不再像 AutoAugment 中那樣使用特定的概率確定是否使用某種子策略,而是所有的子策略都會(huì)以同樣的概率被選擇到,論文中的實(shí)驗(yàn)也表明這種數(shù)據(jù)增廣方式即使在大模型的訓(xùn)練中也具有很好的效果。 PaddleClas中RandAugment的使用方法如下所示。 fromppcls.data.imaugimportDecodeImage
fromppcls.data.imaugimportResizeImage
fromppcls.data.imaugimportRandAugment
fromppcls.data.imaugimporttransform

size=224
#圖像解碼
decode_op=DecodeImage()
#圖像隨機(jī)裁剪
resize_op=ResizeImage(size=(size,size))
#使用RandAugment圖像增廣方法
randaugment_op=RandAugment()

ops=[decode_op,resize_op,randaugment_op]
#圖像路徑
imgs_dir=“/imgdir/xxx.jpg”
fnames=os.listdir(imgs_dir)
forfinfnames:
data=open(os.path.join(imgs_dir,f)).read()
img=transform(data,ops) 變換結(jié)果如下圖所示。

圖像裁剪類

圖像裁剪類主要是對Transpose 后的 224 的圖像進(jìn)行一些裁剪,即裁剪掉部分圖像,或者也可以理解為對部分圖像做遮蓋,共有CutOut、RandErasing、HideAndSeek和GridMask四種方法。

03

Cutout

論文地址:

https://arxiv.org/abs/1708.04552

Cutout 可以理解為 Dropout 的一種擴(kuò)展操作,不同的是 Dropout 是對圖像經(jīng)過網(wǎng)絡(luò)后生成的特征進(jìn)行遮擋,而 Cutout 是直接對輸入的圖像進(jìn)行遮擋,相對于Dropout對噪聲的魯棒性更好。作者在論文中也進(jìn)行了說明,這樣做法有以下兩點(diǎn)優(yōu)勢:

通過 Cutout 可以模擬真實(shí)場景中主體被部分遮擋時(shí)的分類場景。

可以促進(jìn)模型充分利用圖像中更多的內(nèi)容來進(jìn)行分類,防止網(wǎng)絡(luò)只關(guān)注顯著性的圖像區(qū)域,從而發(fā)生過擬合。

PaddleClas中Cutout的使用方法如下所示。 fromppcls.data.imaugimportDecodeImage
fromppcls.data.imaugimportResizeImage
fromppcls.data.imaugimportCutout
fromppcls.data.imaugimporttransform

size=224
#圖像解碼
decode_op=DecodeImage()
#圖像隨機(jī)裁剪
resize_op=ResizeImage(size=(size,size))
#使用Cutout圖像增廣方法
cutout_op=Cutout(n_holes=1,length=112)

ops=[decode_op,resize_op,cutout_op]
#圖像路徑
imgs_dir=“/imgdir/xxx.jpg”
fnames=os.listdir(imgs_dir)
forfinfnames:
data=open(os.path.join(imgs_dir,f)).read()
img=transform(data,ops) 裁剪結(jié)果如下圖所示:

04

RandomErasing

論文地址:

https://arxiv.org/pdf/1708.04896.pdf

RandomErasing 與 Cutout 方法類似,同樣是為了解決訓(xùn)練出的模型在有遮擋數(shù)據(jù)上泛化能力較差的問題,作者在論文中也指出,隨機(jī)裁剪的方式與隨機(jī)水平翻轉(zhuǎn)具有一定的互補(bǔ)性。作者也在行人再識別(REID)上驗(yàn)證了該方法的有效性。與Cutout不同的是,在RandomErasing中,圖片以一定的概率接受該種預(yù)處理方法,生成掩碼的尺寸大小與長寬比也是根據(jù)預(yù)設(shè)的超參數(shù)隨機(jī)生成。 PaddleClas中RandomErasing的使用方法如下所示。 fromppcls.data.imaugimportDecodeImage
fromppcls.data.imaugimportResizeImage
fromppcls.data.imaugimportToCHWImage
fromppcls.data.imaugimportRandomErasing
fromppcls.data.imaugimporttransform

size=224
#圖像解碼
decode_op=DecodeImage()
#圖像隨機(jī)裁剪
resize_op=ResizeImage(size=(size,size))
#使用RandomErasing圖像增廣方法
randomerasing_op=RandomErasing()

ops=[decode_op,resize_op,tochw_op,randomerasing_op]
#圖像路徑
imgs_dir=“/imgdir/xxx.jpg”
fnames=os.listdir(imgs_dir)
forfinfnames:
data=open(os.path.join(imgs_dir,f)).read()
img=transform(data,ops)
img=img.transpose((1,2,0)) 裁剪結(jié)果如下圖所示。

05

HideAndSeek

論文地址:

https://arxiv.org/pdf/1811.02545.pdf

HideAndSeek方法將圖像分為若干大小相同的區(qū)域塊(patch),對于每塊區(qū)域,都以一定的概率生成掩碼,如下圖所示,可能是完全遮擋、完全不遮擋或者遮擋部分。

PaddleClas中HideAndSeek的使用方法如下所示: fromppcls.data.imaugimportDecodeImage
fromppcls.data.imaugimportResizeImage
fromppcls.data.imaugimportToCHWImage
fromppcls.data.imaugimportHideAndSeek
fromppcls.data.imaugimporttransform

size=224
#圖像解碼
decode_op=DecodeImage()
#圖像隨機(jī)裁剪
resize_op=ResizeImage(size=(size,size))
#使用HideAndSeek圖像增廣方法
hide_and_seek_op=HideAndSeek()

ops=[decode_op,resize_op,tochw_op,hide_and_seek_op]
#圖像路徑
imgs_dir=“/imgdir/xxx.jpg”
fnames=os.listdir(imgs_dir)
forfinfnames:
data=open(os.path.join(imgs_dir,f)).read()
img=transform(data,ops)
img=img.transpose((1,2,0)) 裁剪結(jié)果如下圖所示。

06

GridMask

論文地址:

https://arxiv.org/abs/2001.04086

作者在論文中指出,之前的圖像裁剪方法存在兩個(gè)問題,如下圖所示:

過度刪除區(qū)域可能造成目標(biāo)主體大部分甚至全部被刪除,或者導(dǎo)致上下文信息的丟失,導(dǎo)致增廣后的數(shù)據(jù)成為噪聲數(shù)據(jù);

保留過多的區(qū)域,對目標(biāo)主體及上下文基本產(chǎn)生不了什么影響,失去增廣的意義。

因此如何避免過度刪除或過度保留成為需要解決的核心問題。GridMask是通過生成一個(gè)與原圖分辨率相同的掩碼,并將掩碼進(jìn)行隨機(jī)翻轉(zhuǎn),與原圖相乘,從而得到增廣后的圖像,通過超參數(shù)控制生成的掩碼網(wǎng)格的大小。 在訓(xùn)練過程中,有兩種以下使用方法:

設(shè)置一個(gè)概率p,從訓(xùn)練開始就對圖片以概率p使用GridMask進(jìn)行增廣。

一開始設(shè)置增廣概率為0,隨著迭代輪數(shù)增加,對訓(xùn)練圖片進(jìn)行GridMask增廣的概率逐漸增大,最后變?yōu)閜。

論文中表示,經(jīng)過驗(yàn)證后,上述第二種方法的訓(xùn)練效果更好一些。 PaddleClas中GridMask的使用方法如下所示。 fromdata.imaugimportDecodeImage
fromdata.imaugimportResizeImage
fromdata.imaugimportToCHWImage
fromdata.imaugimportGridMask
fromdata.imaugimporttransform

size=224
#圖像解碼
decode_op=DecodeImage()
#圖像隨機(jī)裁剪
resize_op=ResizeImage(size=(size,size))
#圖像數(shù)據(jù)的重排
tochw_op=ToCHWImage()
#使用GridMask圖像增廣方法
gridmask_op=GridMask(d1=96,d2=224,rotate=1,ratio=0.6,mode=1,prob=0.8)

ops=[decode_op,resize_op,tochw_op,gridmask_op]
#圖像路徑
imgs_dir=“/imgdir/xxx.jpg”
fnames=os.listdir(imgs_dir)
forfinfnames:
data=open(os.path.join(imgs_dir,f)).read()
img=transform(data,ops)
img=img.transpose((1,2,0)) 結(jié)果如下圖所示:

圖像混疊

前文所述的圖像變換與圖像裁剪都是針對單幅圖像進(jìn)行的操作,而圖像混疊是對兩幅圖像進(jìn)行融合,生成一幅圖像,Mixup和Cutmix兩種方法的主要區(qū)別為混疊的方式不太一樣。

07

Mixup

論文地址: https://arxiv.org/pdf/1710.09412.pdf Mixup是最先提出的圖像混疊增廣方案,其原理就是直接對兩幅圖的像素以一個(gè)隨機(jī)的比例進(jìn)行相加,不僅簡單,而且方便實(shí)現(xiàn),在圖像分類和目標(biāo)檢測領(lǐng)域上都取得了不錯(cuò)的效果。為了便于實(shí)現(xiàn),通常只對一個(gè) batch 內(nèi)的數(shù)據(jù)進(jìn)行混疊,在Cutmix中也是如此。 如下是imaug中的實(shí)現(xiàn),需要指出的是,下述實(shí)現(xiàn)會(huì)出現(xiàn)對同一幅進(jìn)行相加的情況,也就是最終得到的圖和原圖一樣,隨著 batch-size 的增加這種情況出現(xiàn)的概率也會(huì)逐漸減小。 PaddleClas中Mixup的使用方法如下所示。 fromppcls.data.imaugimportDecodeImage
fromppcls.data.imaugimportResizeImage
fromppcls.data.imaugimportToCHWImage
fromppcls.data.imaugimporttransform
fromppcls.data.imaugimportMixupOperator

size=224
#圖像解碼
decode_op=DecodeImage()
#圖像隨機(jī)裁剪
resize_op=ResizeImage(size=(size,size))
#圖像數(shù)據(jù)的重排
tochw_op=ToCHWImage()
#使用HideAndSeek圖像增廣方法
hide_and_seek_op=HideAndSeek()
#使用Mixup圖像增廣方法
mixup_op=MixupOperator()

ops=[decode_op,resize_op,tochw_op]

imgs_dir=“/imgdir/xxx.jpg”#圖像路徑
batch=[]
fnames=os.listdir(imgs_dir)
foridx,finenumerate(fnames):
data=open(os.path.join(imgs_dir,f)).read()
img=transform(data,ops)
batch.append((img,idx))#fakelabel

new_batch=mixup_op(batch) 混疊結(jié)果如下圖所示。

08

Cutmix

論文地址:

https://arxiv.org/pdf/1905.04899v2.pdf

與 Mixup 直接對兩幅圖進(jìn)行相加不一樣,Cutmix 是從另一幅圖中隨機(jī)裁剪出一個(gè) ROI(region of interest, 感興趣區(qū)域),然后覆蓋當(dāng)前圖像中對應(yīng)的區(qū)域,代碼實(shí)現(xiàn)如下所示: fromppcls.data.imaugimportDecodeImage
fromppcls.data.imaugimportResizeImage
fromppcls.data.imaugimportToCHWImage
fromppcls.data.imaugimporttransform
fromppcls.data.imaugimportCutmixOperator

size=224

#圖像解碼
decode_op=DecodeImage()
#圖像隨機(jī)裁剪
resize_op=ResizeImage(size=(size,size))
#圖像數(shù)據(jù)的重排
tochw_op=ToCHWImage()
#使用HideAndSeek圖像增廣方法
hide_and_seek_op=HideAndSeek()
#使用Cutmix圖像增廣方法
cutmix_op=CutmixOperator()


ops=[decode_op,resize_op,tochw_op]

imgs_dir=“/imgdir/xxx.jpg”#圖像路徑

batch=[]
fnames=os.listdir(imgs_dir)
foridx,finenumerate(fnames):
data=open(os.path.join(imgs_dir,f)).read()
img=transform(data,ops)
batch.append((img,idx))#fakelabel

new_batch=cutmix_op(batch) 混疊結(jié)果如下圖所示:

實(shí)驗(yàn)

經(jīng)過實(shí)驗(yàn)驗(yàn)證,在ImageNet1k數(shù)據(jù)集上基于PaddleClas使用不同數(shù)據(jù)增廣方式的分類精度如下所示,可見通過數(shù)據(jù)增廣方式可以有效提升模型的準(zhǔn)確率。

注意: 在這里的實(shí)驗(yàn)中,為了便于對比,將l2 decay固定設(shè)置為1e-4,在實(shí)際使用中,更小的l2 decay一般效果會(huì)更好。結(jié)合數(shù)據(jù)增廣,將l2 decay由1e-4減小為7e-5均能帶來至少0.3~0.5%的精度提升。

PaddleClas數(shù)據(jù)增廣避坑

指南以及部分注意事項(xiàng)

最后再為大家介紹幾個(gè)PaddleClas數(shù)據(jù)增廣使用方面的小Trick。

在使用圖像混疊類的數(shù)據(jù)處理時(shí),需要將配置文件中的use_mix設(shè)置為True,另外由于圖像混疊時(shí)需對label進(jìn)行混疊,無法計(jì)算訓(xùn)練數(shù)據(jù)的準(zhǔn)確率,所以在訓(xùn)練過程中沒有打印訓(xùn)練準(zhǔn)確率。

在使用數(shù)據(jù)增廣后,由于訓(xùn)練數(shù)據(jù)更難,所以訓(xùn)練損失函數(shù)可能較大,訓(xùn)練集的準(zhǔn)確率相對較低,但其擁有更好的泛化能力,所以驗(yàn)證集的準(zhǔn)確率相對較高。

在使用數(shù)據(jù)增廣后,模型可能會(huì)趨于欠擬合狀態(tài),建議可以適當(dāng)?shù)恼{(diào)小l2_decay的值來獲得更高的驗(yàn)證集準(zhǔn)確率。

幾乎每一類圖像增廣均含有超參數(shù),PaddleClas在這里只提供了基于ImageNet-1k的超參數(shù),其他數(shù)據(jù)集需要用戶自己調(diào)試超參數(shù),當(dāng)然如果對于超參數(shù)的含義不太清楚的話,可以閱讀相關(guān)的論文,調(diào)試方法也可以參考訓(xùn)練技巧的章節(jié)

原文標(biāo)題:干貨 | 計(jì)算機(jī)視覺的數(shù)據(jù)增廣技術(shù)大盤點(diǎn)!附漲點(diǎn)神器,已開源!

文章出處:【微信公眾號:機(jī)器人創(chuàng)新生態(tài)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:干貨 | 計(jì)算機(jī)視覺的數(shù)據(jù)增廣技術(shù)大盤點(diǎn)!附漲點(diǎn)神器,已開源!

文章出處:【微信號:robotplaces,微信公眾號:機(jī)器人創(chuàng)新生態(tài)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    傅立葉變換在機(jī)器學(xué)習(xí)的應(yīng)用 常見傅立葉變換的誤區(qū)解析

    傅里葉變換在機(jī)器學(xué)習(xí)的應(yīng)用 傅里葉變換是一種將信號分解為其組成頻率分量的數(shù)學(xué)運(yùn)算,它在機(jī)器學(xué)習(xí)的應(yīng)用日益廣泛。以下是一些主要的應(yīng)用領(lǐng)域: 信號處理 : 音頻處理:傅里葉變換有助于識
    的頭像 發(fā)表于 12-06 17:06 ?267次閱讀

    Pythondict支持多個(gè)key的方法

    不直接支持使用多個(gè)鍵進(jìn)行索引,但我們可以通過一些技巧來實(shí)現(xiàn)這功能。 下面,我將展示幾種處理包含多個(gè)鍵的字典的方法,并提供詳細(xì)的代碼示例。 1.方法
    的頭像 發(fā)表于 11-29 15:59 ?195次閱讀

    一些常見的動(dòng)態(tài)電路

    無論是模電還是數(shù)電,理論知識相對來說還是比較枯燥,各種電路原理理解清楚不算容易,換一種生動(dòng)形象的方式或許會(huì)增加一些趣味性,也更容易理解這些知識。下面整理了一些常見的電路,以動(dòng)態(tài)圖形的方
    的頭像 發(fā)表于 11-16 09:26 ?425次閱讀
    <b class='flag-5'>一些</b><b class='flag-5'>常見</b>的動(dòng)態(tài)電路

    主動(dòng)學(xué)習(xí)在圖像分類技術(shù)的應(yīng)用:當(dāng)前狀態(tài)與未來展望

    本文對近年來提出的主動(dòng)學(xué)習(xí)圖像分類算法進(jìn)行了詳細(xì)綜述,并根據(jù)所用樣本數(shù)據(jù)處理及模型優(yōu)化方案,將現(xiàn)有算法分為三類:基于數(shù)據(jù)增強(qiáng)的算法,包括利用圖像
    的頭像 發(fā)表于 11-14 10:12 ?396次閱讀
    主動(dòng)學(xué)習(xí)在<b class='flag-5'>圖像</b><b class='flag-5'>分類</b>技術(shù)<b class='flag-5'>中</b>的應(yīng)用:當(dāng)前狀態(tài)與未來展望

    分享一些常見的電路

    理解模電和數(shù)電的電路原理對于初學(xué)者來說可能比較困難,但通過一些生動(dòng)的教學(xué)方法和資源,可以有效地提高學(xué)習(xí)興趣和理解能力。 下面整理了一些常見的電路,以動(dòng)態(tài)圖形的方式展示。 整流電路 單相
    的頭像 發(fā)表于 11-13 09:28 ?371次閱讀
    分享<b class='flag-5'>一些</b><b class='flag-5'>常見</b>的電路

    常見的遙感數(shù)據(jù)源有哪些類型

    遙感技術(shù)是一種通過衛(wèi)星、飛機(jī)或其他載體上的傳感器系統(tǒng),從遠(yuǎn)距離收集地球表面信息的技術(shù)。遙感數(shù)據(jù)源的類型非常多樣,它們可以根據(jù)不同的原理、平臺(tái)、傳感器類型、分辨率、光譜范圍等特征進(jìn)行分類。以下是
    的頭像 發(fā)表于 09-04 14:33 ?906次閱讀

    圖像語義分割的實(shí)用性是什么

    什么是圖像語義分割 圖像語義分割是一種圖像的所有像素點(diǎn)按照其語義類別進(jìn)行分類
    的頭像 發(fā)表于 07-17 09:56 ?479次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計(jì)算機(jī)視覺領(lǐng)域的核心任務(wù),它涉及到從圖像中提取特征并進(jìn)行分類、識別和分析的過程。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,
    的頭像 發(fā)表于 07-16 11:14 ?5813次閱讀

    深度學(xué)習(xí)的時(shí)間序列分類方法

    時(shí)間序列分類(Time Series Classification, TSC)是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域的重要任務(wù),廣泛應(yīng)用于人體活動(dòng)識別、系統(tǒng)監(jiān)測、金融預(yù)測、醫(yī)療診斷等多個(gè)領(lǐng)域。隨著深度學(xué)習(xí)技術(shù)
    的頭像 發(fā)表于 07-09 15:54 ?1072次閱讀

    機(jī)器人視覺技術(shù)中常見圖像分割方法

    、場景理解、導(dǎo)航和交互等任務(wù)至關(guān)重要。以下是一些常見圖像分割方法: 閾值分割法(Thresholding) 閾值分割法是
    的頭像 發(fā)表于 07-09 09:31 ?805次閱讀

    計(jì)算機(jī)視覺怎么給圖像分類

    圖像分類是計(jì)算機(jī)視覺領(lǐng)域中的項(xiàng)核心任務(wù),其目標(biāo)是將輸入的圖像自動(dòng)分配到預(yù)定義的類別集合。這
    的頭像 發(fā)表于 07-08 17:06 ?810次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)分類方法有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像分類、目標(biāo)檢測、語義分割等計(jì)算機(jī)視覺任務(wù)。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-03 09:40 ?512次閱讀

    cnn卷積神經(jīng)網(wǎng)絡(luò)分類有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像分類、目標(biāo)檢測、語義分割等領(lǐng)域。本文將詳細(xì)介紹CNN在分類任務(wù)
    的頭像 發(fā)表于 07-03 09:28 ?670次閱讀

    雷達(dá)物位計(jì)的常見故障及維修方法

    雷達(dá)物位計(jì)在使用過程可能會(huì)遇到多種故障,以下是一些常見故障及其維修方法的清晰分點(diǎn)表示和歸納
    的頭像 發(fā)表于 06-08 17:22 ?2128次閱讀

    一種利用光電容積描記(PPG)信號和深度學(xué)習(xí)模型對高血壓分類的新方法

    間變化的波形。 PPG 信號的一些非常常見的應(yīng)用是心率測量和血流監(jiān)測。 PPG 信號因其非侵入性、方便性、廉價(jià)的血壓估計(jì)方法以及在健康監(jiān)測方面的巨大潛力而聞名。 創(chuàng)建個(gè)
    發(fā)表于 05-11 20:01