0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

騰訊在arxiv上發(fā)布論文詳細(xì)介紹了數(shù)據(jù)集的構(gòu)成以及評(píng)價(jià)標(biāo)準(zhǔn)等內(nèi)容

DPVg_AI_era ? 來(lái)源:lq ? 2019-01-12 09:13 ? 次閱讀

2018 年 9 月騰訊 AI Lab 開(kāi)源 “Tencent ML-Images” 項(xiàng)目,該項(xiàng)目由多標(biāo)簽圖像數(shù)據(jù)集 ML-Images,以及業(yè)內(nèi)目前同類深度學(xué)習(xí)模型中精度最高的深度殘差網(wǎng)絡(luò) ResNet-101 構(gòu)成。 近日騰訊在 arxiv 上發(fā)布論文詳細(xì)介紹了數(shù)據(jù)集的構(gòu)成以及評(píng)價(jià)標(biāo)準(zhǔn)等內(nèi)容,對(duì) Tencent ML-Images 數(shù)據(jù)集的理解很有幫助。

騰訊 AI Lab 公布的圖像數(shù)據(jù)集 ML-Images,包含了 1800 萬(wàn)圖像和 1.1 萬(wàn)多種常見(jiàn)物體類別,在業(yè)內(nèi)已公開(kāi)的多標(biāo)簽圖像數(shù)據(jù)集中規(guī)模最大,足以滿足一般科研機(jī)構(gòu)及中小企業(yè)的使用場(chǎng)景。

此外,騰訊 AI Lab 還提供基于 ML-Images 訓(xùn)練得到的深度殘差網(wǎng)絡(luò) ResNet-101。該模型具有優(yōu)異的視覺(jué)表示能力和泛化性能,在當(dāng)前業(yè)內(nèi)同類模型中精度最高,將為包括圖像、視頻等在內(nèi)的視覺(jué)任務(wù)提供強(qiáng)大支撐,并助力圖像分類、物體檢測(cè)、物體跟蹤、語(yǔ)義分割等技術(shù)水平的提升。

題目:Tencent ML-Images: A Large-Scale Multi-Label Image Database for Visual Representation Learning

作者:Baoyuan Wu, Weidong Chen, Yanbo Fan, Yong Zhang, Jinlong Hou, Junzhou Huang, Wei Liu, Tong Zhang

【摘要】

在現(xiàn)有的視覺(jué)表示學(xué)習(xí)任務(wù)中,深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)通常是針對(duì)帶有單個(gè)標(biāo)簽的圖像進(jìn)行訓(xùn)練的,例如 ImageNet。然而,單個(gè)標(biāo)簽無(wú)法描述一幅圖像的所有重要內(nèi)容,一些有用的視覺(jué)信息在訓(xùn)練過(guò)程中可能會(huì)被浪費(fèi)。在這項(xiàng)工作中,我們建議對(duì)帶有多個(gè)標(biāo)簽的圖像進(jìn)行訓(xùn)練,以提高訓(xùn)練后的 CNN 模型的視覺(jué)表示質(zhì)量。

為此,我們構(gòu)建了一個(gè)大規(guī)模的多標(biāo)簽圖像數(shù)據(jù)庫(kù),其中包含 18000000 個(gè)圖像和 11000 個(gè)類別,我們稱之為 Tencent ML-Images。我們基于大規(guī)模分布式深度學(xué)習(xí)框架,即 TFplus,在 Tencent ML-Images 上高效訓(xùn)練 ResNet-101 多標(biāo)簽輸出模型,共 60 個(gè) epoch,耗時(shí) 90 小時(shí)。 通過(guò) ImageNet 和 Caltech-256 上的單標(biāo)簽圖像分類、PASCAL VOC 2007 上的對(duì)象檢測(cè)、PASCAL VOC 2012 上的語(yǔ)義分割三個(gè)遷移學(xué)習(xí)任務(wù),驗(yàn)證了 Tencent ML-Images checkpoint 的視覺(jué)表示質(zhì)量良好。

騰訊 ML-Images 數(shù)據(jù)庫(kù),ResNet-101 的 checkpoint 以及所有訓(xùn)練代碼已在https://github.com/Tencent/tencent-ml-images上發(fā)布。它有望推動(dòng)研究領(lǐng)域和工業(yè)界的其他視覺(jué)任務(wù)的發(fā)展。

論文地址:

https://arxiv.org/abs/1901.01703

作者簡(jiǎn)介

第一作者是吳保元,現(xiàn)在是騰訊 AI Lab 的高級(jí)研究員,2014 年 8 月至 2016 年 11 月在 KAUST 進(jìn)行博士后學(xué)習(xí),與 Bernard Ghanem 教授一起工作。2014 年 6 月獲得中國(guó)科學(xué)院自動(dòng)化研究所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室博士學(xué)位,導(dǎo)師為胡包鋼教授。作者研究興趣包括機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)和優(yōu)化,包括圖像標(biāo)注、弱 / 無(wú)監(jiān)督學(xué)習(xí)、結(jié)構(gòu)化預(yù)測(cè)、概率圖模型、視頻處理和整數(shù)規(guī)劃。

https://sites.google.com/site/baoyuanwu2015/home

其他作者包括樊艷波、張勇也都是博士畢業(yè)于中科院自動(dòng)化研究所,師從胡包鋼教授。

文章簡(jiǎn)介

這項(xiàng)工作在新建的多標(biāo)簽圖像數(shù)據(jù)庫(kù)(稱為 Tencent ML-Images)上展示了大規(guī)模的視覺(jué)表示學(xué)習(xí)。文章從討論以下兩個(gè)問(wèn)題開(kāi)始。

為什么我們需要大規(guī)模的圖像數(shù)據(jù)庫(kù)?深度學(xué)習(xí)一直處于長(zhǎng)期低谷,直到 2012 年,AlexNet 在 ILSVRC2012 挑戰(zhàn)的單標(biāo)簽圖像分類任務(wù)中取得了令人驚訝的成績(jī)。深度神經(jīng)網(wǎng)絡(luò)的潛力是通過(guò)大規(guī)模的圖像數(shù)據(jù)庫(kù)釋放出來(lái)的,即 ImageNet-ILSVRC2012 。此外,對(duì)于許多視覺(jué)任務(wù),如目標(biāo)檢測(cè)和語(yǔ)義分割,獲取訓(xùn)練數(shù)據(jù)的成本是非常高的。由于訓(xùn)練數(shù)據(jù)不足,需要在其他大型數(shù)據(jù)庫(kù)上預(yù)先訓(xùn)練好的視覺(jué)呈現(xiàn)良好的 checkpoint 作為初始化,用于其他視覺(jué)任務(wù) (如針對(duì)單標(biāo)簽圖像分類的 ImageNet-ILSVRC2012)。

為什么我們需要多標(biāo)簽圖像數(shù)據(jù)庫(kù)?由于在大多數(shù)自然圖像中存在多個(gè)對(duì)象,單個(gè)標(biāo)注可能會(huì)遺漏一些有用的信息,從而誤導(dǎo) CNN 的訓(xùn)練。例如,同時(shí)包含牛和草的兩個(gè)視覺(jué)上相似的圖像可能分別被標(biāo)注為牛和草。合理的方法是 “告訴”CNN 模型這兩幅圖像同時(shí)包含牛和草。

這項(xiàng)工作的主要貢獻(xiàn)有四個(gè)方面:

建立了一個(gè)包含一千八百萬(wàn)張圖像和一萬(wàn)一千個(gè)類別的多標(biāo)簽圖像數(shù)據(jù)庫(kù),被稱為 Tencent ML-Images,這是迄今為止最大的公開(kāi)可用的多標(biāo)簽圖像數(shù)據(jù)庫(kù)。

利用大規(guī)模分布式深度學(xué)習(xí)框架,在 Tencent ML-Images 上有效地訓(xùn)練 ResNet-101 模型。此外,還設(shè)計(jì)了一種新的損失函數(shù)來(lái)緩解大規(guī)模多標(biāo)簽數(shù)據(jù)庫(kù)中嚴(yán)重的類失衡問(wèn)題。

我們通過(guò)遷移學(xué)習(xí)三種不同的視覺(jué)任務(wù),證實(shí)了 Tencent ML-Images 和其預(yù)訓(xùn)練的檢查點(diǎn)有著比較好的質(zhì)量。

在 GitHub(https://github.com/Tencent/tencent-ml-images)上發(fā)布了 Tencent ML-Images 數(shù)據(jù)庫(kù),包含訓(xùn)練的 ResNet-101 檢查點(diǎn),以及從數(shù)據(jù)預(yù)處理,預(yù)訓(xùn)練,微調(diào)到圖像分類和特征提取的完整代碼。預(yù)計(jì)這將推動(dòng)研究領(lǐng)域和工業(yè)界的其他視覺(jué)任務(wù)的發(fā)展。

附文章中部分結(jié)果

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像分類
    +關(guān)注

    關(guān)注

    0

    文章

    90

    瀏覽量

    11942
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24747

原文標(biāo)題:論文終于公布!騰訊開(kāi)源最大規(guī)模多標(biāo)簽圖像數(shù)據(jù)集,刷新行業(yè)數(shù)據(jù)集基準(zhǔn)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    有方科技參編的信息技術(shù)團(tuán)體標(biāo)準(zhǔn)發(fā)布

    能力評(píng)價(jià)》團(tuán)體標(biāo)準(zhǔn)由中國(guó)計(jì)算機(jī)行業(yè)協(xié)會(huì)正式發(fā)布實(shí)施,明確信息技術(shù)產(chǎn)品供應(yīng)鏈成熟度共性指標(biāo)中企業(yè)背景、技術(shù)掌控、供給能力評(píng)價(jià)一級(jí)指標(biāo)框架
    的頭像 發(fā)表于 12-23 10:44 ?179次閱讀

    【「大話芯片制造」閱讀體驗(yàn)】+內(nèi)容概述,適讀人群

    和設(shè)備、檢驗(yàn)中如何發(fā)現(xiàn)問(wèn)題以及如何出貨。回答芯片制造為何要高標(biāo)準(zhǔn)的問(wèn)題。涉及到芯片制造成本,化學(xué)藥品,項(xiàng)目管理部分內(nèi)容。 總的來(lái)說(shuō),《大
    發(fā)表于 12-21 16:32

    【「從算法到電路—數(shù)字芯片算法的電路實(shí)現(xiàn)」閱讀體驗(yàn)】+內(nèi)容簡(jiǎn)介

    設(shè)計(jì)的關(guān)系,芯片設(shè)計(jì)人員掌握算法知識(shí)的必要性,以及位寬確定、有符號(hào)數(shù)處理、浮點(diǎn)數(shù)運(yùn)算、溢出保護(hù)和四舍五入算法的實(shí)現(xiàn)。第3~11章重點(diǎn)介紹各種典型基本算法的電路設(shè)計(jì),其中包括任何數(shù)字芯片都必不可少
    發(fā)表于 11-21 17:14

    騰訊申請(qǐng)注冊(cè)多枚“騰訊AI助手”商標(biāo)

    近日,根據(jù)愛(ài)企查App的最新數(shù)據(jù)顯示,騰訊科技(深圳)有限公司商標(biāo)領(lǐng)域有新動(dòng)作,該公司已經(jīng)正式申請(qǐng)注冊(cè)多枚“
    的頭像 發(fā)表于 11-19 11:01 ?441次閱讀

    中國(guó)首推汽車智能安全評(píng)價(jià)體系,助力自動(dòng)駕駛汽車安全性評(píng)估

    10月10日傳來(lái)消息,我國(guó)智能汽車安全領(lǐng)域取得了顯著進(jìn)展,重慶正式推出了首個(gè)汽車智能安全評(píng)價(jià)體系。該體系針對(duì)智能汽車的環(huán)境感知、決策控制及應(yīng)急響應(yīng)核心方面,設(shè)立了全面的
    的頭像 發(fā)表于 10-10 16:29 ?1048次閱讀

    聯(lián)想M大師臺(tái)式機(jī)將低碳理念帶進(jìn)PC端,推進(jìn)綠色計(jì)算機(jī)評(píng)價(jià)標(biāo)準(zhǔn)落地

    “2024綠色計(jì)算機(jī)標(biāo)準(zhǔn)及新品發(fā)布會(huì)”。在這次活動(dòng)中,聯(lián)想多家OEM的綠色電腦機(jī)型獲得了首批認(rèn)證。特別值得一提的是,聯(lián)想M大師臺(tái)式機(jī)還榮獲“綠色可持續(xù)發(fā)展計(jì)算機(jī)
    的頭像 發(fā)表于 09-23 11:43 ?336次閱讀
    聯(lián)想M大師臺(tái)式機(jī)將低碳理念帶進(jìn)PC端,推進(jìn)綠色計(jì)算機(jī)<b class='flag-5'>評(píng)價(jià)標(biāo)準(zhǔn)</b>落地

    谷歌DeepMind被曝抄襲開(kāi)源成果,論文還中了頂流會(huì)議

    谷歌DeepMind一篇中了頂流新生代會(huì)議CoLM 2024的論文被掛了,瓜主直指其抄襲一年前就掛在arXiv的一項(xiàng)研究。開(kāi)源的那種。
    的頭像 發(fā)表于 07-16 18:29 ?618次閱讀
    谷歌DeepMind被曝抄襲開(kāi)源成果,<b class='flag-5'>論文</b>還中了頂流會(huì)議

    綠色小水電站生態(tài)環(huán)境監(jiān)測(cè)系統(tǒng)解決方案

    水利部發(fā)布的《綠色小水電評(píng)價(jià)規(guī)程》(SL/T 752—2024)是《綠色小水電評(píng)價(jià)標(biāo)準(zhǔn)》(SL/T 752—2020)的基礎(chǔ)修訂而成,為
    的頭像 發(fā)表于 05-11 16:09 ?434次閱讀

    振弦采集儀巖土工程監(jiān)測(cè)中的性能評(píng)價(jià)標(biāo)準(zhǔn)選擇

    弦采集儀的性能評(píng)價(jià)標(biāo)準(zhǔn)選擇進(jìn)行詳細(xì)介紹。 振弦采集儀巖土工程監(jiān)測(cè)中的性能評(píng)價(jià)
    的頭像 發(fā)表于 05-10 13:30 ?270次閱讀
    振弦采集儀<b class='flag-5'>在</b>巖土工程監(jiān)測(cè)中的性能<b class='flag-5'>評(píng)價(jià)</b>及<b class='flag-5'>標(biāo)準(zhǔn)</b>選擇

    騰訊突然宣布,微信鴻蒙版要來(lái)了!

    「微信」的身影,不少網(wǎng)友更是喊話騰訊,希望QQ、微信盡快適配。 現(xiàn)在, 好消息來(lái)了! 最近在網(wǎng)上看到一條重磅消息—— 原生鴻蒙版「微信」已在路上了 。 近日,騰訊程序員交流平臺(tái)發(fā)布
    發(fā)表于 04-30 19:34

    語(yǔ)音數(shù)據(jù)智能駕駛中的價(jià)值與應(yīng)用

    、應(yīng)用場(chǎng)景以及挑戰(zhàn)。 二、語(yǔ)音數(shù)據(jù)智能駕駛中的價(jià)值 提升駕駛安全性:通過(guò)語(yǔ)音指令,駕駛員可以不分散注意力的情況下對(duì)車輛進(jìn)行操作,如導(dǎo)航
    的頭像 發(fā)表于 01-31 17:08 ?449次閱讀

    自動(dòng)駕駛領(lǐng)域的數(shù)據(jù)匯總

    發(fā)自動(dòng)駕駛論文哪少的數(shù)據(jù),今天筆者將為大家推薦一篇最新的綜述,總結(jié)了200多個(gè)自動(dòng)駕駛領(lǐng)域的數(shù)據(jù)
    的頭像 發(fā)表于 01-19 10:48 ?1026次閱讀
    自動(dòng)駕駛領(lǐng)域的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>匯總

    語(yǔ)音數(shù)據(jù)智能語(yǔ)音助手中的應(yīng)用與挑戰(zhàn)

    。本文將詳細(xì)介紹語(yǔ)音數(shù)據(jù)智能語(yǔ)音助手中的應(yīng)用、面臨的挑戰(zhàn)以及未來(lái)的發(fā)展趨勢(shì)。 二、語(yǔ)音
    的頭像 發(fā)表于 01-18 15:46 ?427次閱讀

    語(yǔ)音數(shù)據(jù)智能語(yǔ)音搜索中的應(yīng)用與挑戰(zhàn)

    揮著重要作用,為系統(tǒng)提供豐富的語(yǔ)音數(shù)據(jù)和信息,提高了搜索的準(zhǔn)確性和效率。本文將詳細(xì)介紹語(yǔ)音數(shù)據(jù)
    的頭像 發(fā)表于 01-18 15:09 ?574次閱讀

    鴻蒙ArkTS的起源和簡(jiǎn)介

    的div頁(yè)面元素,其中的{{message}}是數(shù)據(jù)綁定的語(yǔ)義,Vue中表示為T(mén)emplate。第69行是JS代碼,描述一個(gè)Vue對(duì)象,對(duì)應(yīng)上述的app頁(yè)面元素
    發(fā)表于 01-16 16:23