計(jì)算機(jī)視覺使計(jì)算機(jī)能夠理解圖像和視頻的內(nèi)容。計(jì)算機(jī)視覺的目標(biāo)是使人類視覺系統(tǒng)可以實(shí)現(xiàn)任務(wù)自動(dòng)化。
計(jì)算機(jī)視覺任務(wù)包括圖像采集、圖像處理和圖像分析。圖像數(shù)據(jù)可以采用不同的形式,例如視頻序列,從多個(gè)角度的不同的攝像機(jī)查看圖像或來自醫(yī)療掃描儀的多維數(shù)據(jù)。
用于計(jì)算機(jī)視覺訓(xùn)練的圖像數(shù)據(jù)集
Labelme:麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)創(chuàng)建的大型數(shù)據(jù)集,包含187,240張圖像、62,197條帶注釋的圖像和658,992張帶標(biāo)簽的對(duì)象。
樂高積木:通過文件夾和使用Blender渲染的計(jì)算機(jī)對(duì)大約16700種樂高積木進(jìn)行分類的大約12,700張圖像。
ImageNet:用于新算法的實(shí)際圖像數(shù)據(jù)集。根據(jù)WordNet層次結(jié)構(gòu)進(jìn)行組織,其中層次結(jié)構(gòu)的每個(gè)節(jié)點(diǎn)都以成千上萬的圖像進(jìn)行描繪。
LSUN:具有許多輔助任務(wù)的場(chǎng)景理解(房間布局估計(jì)、顯著性預(yù)測(cè)等)
MS COCO:COCO是包含200,000多個(gè)標(biāo)記圖像的大規(guī)模對(duì)象檢測(cè)、分割和字幕數(shù)據(jù)集。它可以用于對(duì)象分割,上下文識(shí)別以及許多其他用例。
哥倫比亞大學(xué)圖像庫:COIL100是一個(gè)數(shù)據(jù)集,其中包含360個(gè)旋轉(zhuǎn)角度中每個(gè)角度成像的100個(gè)不同對(duì)象。
視覺基因組:視覺基因組是一個(gè)數(shù)據(jù)集和知識(shí)庫,旨在將結(jié)構(gòu)化圖像概念與語言聯(lián)系起來。該數(shù)據(jù)庫具有詳細(xì)的視覺知識(shí)庫,并帶有108,077張圖像的字幕。
Google的開放圖像:“Creative Commons”下900萬個(gè)URL的圖像集合,這些URL已用6000多個(gè)類別的標(biāo)簽進(jìn)行了注釋。
來自“打開圖像”數(shù)據(jù)集的帶注釋的圖像。
左:Kevin Krejci的《鬼拱門》。右:J B制造的銀制廚房用具。兩個(gè)圖像均在CC BY 2.0許可下使用。
Youtube-8M:帶有標(biāo)簽的大規(guī)模數(shù)據(jù)集,由數(shù)百萬個(gè)YouTube視頻ID組成,帶有超過3,800多個(gè)視覺實(shí)體的注釋。
帶標(biāo)簽的野外面孔:13,000個(gè)帶標(biāo)簽的人臉圖像,用于開發(fā)涉及面部識(shí)別的應(yīng)用程序。
斯坦福犬類數(shù)據(jù)集:包含20,580張圖像和120種不同的犬種類別,每個(gè)類別約有150張圖像。
地點(diǎn):以場(chǎng)景為中心的數(shù)據(jù)庫,其中包含205個(gè)場(chǎng)景類別和250萬個(gè)帶有類別標(biāo)簽的圖像。
CelebFaces:具有超過200,000張名人圖像的人臉數(shù)據(jù)集,每個(gè)圖像帶有40個(gè)屬性注釋。
花卉:在英國(guó)常見的花朵圖像數(shù)據(jù)集,包含102個(gè)不同類別。每個(gè)花類由40至258張圖像組成,這些圖像具有不同的姿勢(shì)和光線變化。
植物圖像分析:涵蓋超過一百萬張植物圖像的數(shù)據(jù)集??梢詮?1種植物中選擇。
家庭對(duì)象:一個(gè)數(shù)據(jù)集,其中包含來自家庭的隨機(jī)對(duì)象,大部分來自廚房、浴室和客廳,這些對(duì)象分為訓(xùn)練和測(cè)試數(shù)據(jù)集。
CIFAR-10:包含60,000張32×32彩色圖像的大型圖像數(shù)據(jù)集,分為10類。數(shù)據(jù)集分為五個(gè)訓(xùn)練批次和一個(gè)測(cè)試批次,每個(gè)批次包含10,000張圖像。
CompCars:包含163種車型,包含1,716種車型,每種車型都標(biāo)有五個(gè)屬性,包括最大速度、排量、門數(shù)、座位數(shù)和汽車類型。
室內(nèi)場(chǎng)景識(shí)別:非常具體的數(shù)據(jù)集,非常有用,因?yàn)榇蠖鄶?shù)場(chǎng)景識(shí)別模型在“外部”效果更好。包含67個(gè)室內(nèi)類別,共15620張圖像。
VisualQA:VQA是一個(gè)數(shù)據(jù)集,包含有關(guān)265,016張圖像的開放式問題。這些問題需要對(duì)視覺和語言的理解。對(duì)于每個(gè)圖像,至少有3個(gè)問題,每個(gè)問題10個(gè)答案。
原文標(biāo)題:機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺的前20個(gè)圖像數(shù)據(jù)集
文章出處:【微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
機(jī)器視覺
+關(guān)注
關(guān)注
162文章
4372瀏覽量
120325 -
人工智能
+關(guān)注
關(guān)注
1791文章
47279瀏覽量
238510 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8418瀏覽量
132646
原文標(biāo)題:機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺的前20個(gè)圖像數(shù)據(jù)集
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論