0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Open Images Extended合集中引入了更具包容性的人物注釋MIAP數(shù)據(jù)集

硬件三人行 ? 來源:TensorFlow ? 作者:TensorFlow ? 2021-08-16 17:20 ? 次閱讀

發(fā)布人:Google Research 軟件工程師 Candice Schumann 和 Susanna Ricco

2016 年,我們推出了 Open Images。此協(xié)作版本包含約 900 萬張含有標簽的圖像,涵蓋數(shù)千個對象類別和 600 個類的邊界框注釋。從那之后,我們進行了多次更新,如將眾包數(shù)據(jù)發(fā)布到 Open Images Extended 合集,以此提高對象注釋的多樣性。

更新

https://ai.googleblog.com/2019/05/announcing-open-images-v5-and-iccv-2019.html

Open Images Extended

https://storage.googleapis.com/openimages/web/extended.html

雖然這些數(shù)據(jù)集提供的標簽擴展性很強,但此類標簽并沒有關(guān)注人物的敏感屬性,這些屬性對于許多機器學習 (ML) 公平性任務(wù)(例如公平性評估和偏見緩解)至關(guān)重要。事實上,找到包含徹底標記此類敏感屬性的數(shù)據(jù)集是很困難的,尤其是在計算機視覺領(lǐng)域。

公平性任務(wù)

https://developers.google.com/machine-learning/crash-course/fairness/video-lecture

今天,我們在 Open Images Extended 合集中引入了更具包容性的人物注釋 (MIAP) 數(shù)據(jù)集。此合集包含更多完整的邊界框注釋,用于包含 10 萬張人物圖像中的的人物類層級結(jié)構(gòu)。每個注釋還帶有可感知到的性別呈現(xiàn)和年齡范圍等公平相關(guān)屬性的標簽。作為 Responsible AI 研究的一部分,越來越多的人開始關(guān)注如何減少不公平偏見,我們希望這些注釋能夠激勵已經(jīng)在使用 Open Images 的研究者,將公平分析納入他們的研究中。

Responsible AI 研究

https://ai.google/principles/

交叉描述通過為現(xiàn)有圖像-描述對和輔助描述添加語義相似度人工評分來擴展 MS-COCO 評估集(實線),并通過為新的圖像-描述、描述-描述和圖像-圖像對添加人工評分來提高評分密度(虛線)*

Open Images 中的注釋

原始 Open Images 數(shù)據(jù)集中的每個圖像都包含圖像級注釋(寬泛地描述圖像)和包圍特定對象的邊界框。為了避免對同一個對象繪制多個邊界框,我們從標簽候選集中臨時刪減了具體性較弱的類,我們將這一過程稱為層級去重。舉個例子,若一個圖像的標簽包括動物、 貓,和洗衣機則該圖像的注釋邊界框為貓和洗衣機,而不會注釋多余的類 ——動物。

圖像級注釋

https://cloud.google.com/vision/docs/labels

邊界框

https://cloud.google.com/vision/docs/object-localizer

MIAP 數(shù)據(jù)集可用于原始 Open Images 數(shù)據(jù),集中人物 層級包含的五個類:人物、男人、女人、男孩、女孩。由于這些標簽的存在,Open Images 數(shù)據(jù)集對于推進 Responsible AI 的研究具有獨特的價值,能夠幫助開發(fā)者訓練通用的人物檢測器,訪問性別和年齡范圍特定的標簽,以實現(xiàn)公平分析和偏見緩解。

Responsible AI

https://ai.google/responsibilities/responsible-ai-practices/

人物檢測器

https://cloud.google.com/video-intelligence/docs/people-detection

然而,我們發(fā)現(xiàn)結(jié)合了層級去重和女人/女孩與男人/男孩之間的社會性區(qū)別后,原始注釋會受到限制。舉個例子,如果要求注釋器針對女孩這一分類繪制邊界框,它們便不會在圖像中的男孩周圍繪制邊界框。注釋器可能會也可能不會在某位女性周圍繪制邊界框,這取決于其對個人年齡的評估以及對女孩這一概念的文化性理解。此類判斷在不同圖像中可能會存在不一致,這取決于單獨的注釋器的文化背景、圖像人物的外表和場景的上下文。因此,某些圖像中的邊界框注釋會不完整,一些較為顯眼的人物沒有得到注釋。

MIAP 中的注釋

新的 MIAP 注釋旨在解決這些限制,實現(xiàn)讓 Open Images 成為推動機器學習公平性研究取得新進展的數(shù)據(jù)集的保障。我們不要求注釋器為層級結(jié)構(gòu)中最具體的類(例如,女孩)繪制邊界框,而是將此程序反過來,要求它們?yōu)樾詣e和年齡未知的人物分類繪制邊界框。

所有人物邊界框?qū)脮r都將獲得感知到的性別呈現(xiàn)(很大可能是女性、很大可能是男性,或未知)以及年齡呈現(xiàn)(青年、中年、老年,或未知)等標簽。我們認識到性別不是二元的,個人的性別認同可能與其感知或預(yù)期的性別呈現(xiàn)不符,為了緩解無意識偏見對注釋的影響,這里提示:注釋器,與性別呈現(xiàn)相關(guān)的規(guī)范因文化而異,且會隨時間的推移而變化。

這個過程添加了大量先前丟失的邊界框。

在包含人物的 10 萬張圖像中,人物邊界框的數(shù)量從 35.8 萬左右增加到 45.4 萬左右。各個感知性別呈現(xiàn)和感知年齡呈現(xiàn)的邊界框數(shù)量持續(xù)增加。這些新注釋為人物檢測器的訓練提供了更完整的基本事實,并提供了更準確的子組標簽,以將公平性納入計算機視覺研究。

預(yù)期用例

我們?yōu)槿宋镞吔缈虻母兄挲g范圍和性別呈現(xiàn)納入了注釋,因為我們認為有必要添加此類注釋,以便提高能力,實現(xiàn)更好的理解以及努力緩解并消除圖像理解領(lǐng)域,受保護子組之間的不公平偏見或不同性能。

我們注意到,標簽捕獲的性別和年齡范圍是第三方僅根據(jù)視覺線索,而不是個人的自我認知性別或?qū)嶋H年齡評估出來的。我們不支持也不容忍構(gòu)建或部署根據(jù)這些注釋訓練的性別或年齡呈現(xiàn)分類器,因為我們認為在公平性研究之外使用這些技術(shù)的相關(guān)風險大于任何潛在好處。

風險

https://dl.acm.org/doi/10.1145/3173574.3173582

致謝

這項研究背后的核心團隊成員包括 Utsav Prabhu、Vittorio Ferrari 和 Caroline Pantofaru。同時,我們還要感謝 Alex Hanna、Reena Jana、Alina Kuznetsova、Matteo Malloci、Stefano Pellegrini、Jordi Pont-Tuset 和 Mahima Pushkarna 對本項目的貢獻。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33415

    瀏覽量

    273940
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1704

    瀏覽量

    46446
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8477

    瀏覽量

    133793
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1220

    瀏覽量

    25181

原文標題:最新進展:將包容性人物注釋納入 Open Image Extended 數(shù)據(jù)集

文章出處:【微信號:yingjiansanrenxing,微信公眾號:硬件三人行】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦

    貿(mào)澤電子田吉平榮膺產(chǎn)業(yè)特別貢獻人物

    平女士榮獲《國際電子商情》40周年“產(chǎn)業(yè)特別貢獻人物”大獎。該獎項旨在表彰推動中國電子產(chǎn)業(yè)創(chuàng)新發(fā)展的標桿人物,田吉平女士憑借前瞻的戰(zhàn)略眼光、卓越領(lǐng)導(dǎo)才能及對產(chǎn)業(yè)生態(tài)建設(shè)的突出貢獻,獲此殊榮。 ? ? 田吉平女士表示:“收獲這份
    發(fā)表于 03-28 14:39 ?129次閱讀
      貿(mào)澤電子田吉平榮膺產(chǎn)業(yè)特別貢獻<b class='flag-5'>人物</b>獎

    如何使用POT準確檢查器?

    :95:0.00% 分辨率視覺對象等級挑戰(zhàn) (VOC) 數(shù)據(jù)未經(jīng)英特爾驗證。如 Yolo-v4-tf 文檔 中所提到,英特爾已使用上下文中常見的對象 (COCO) 數(shù)據(jù)驗證了準確
    發(fā)表于 03-06 08:04

    無法將自定義COCO數(shù)據(jù)導(dǎo)入到OpenVINO? DL Workbench怎么解決?

    JSON包含以下格式注釋的文件:{ \"images\": [], \"annotations\": [] } 創(chuàng)建自定義 COCO 數(shù)據(jù)。 無法將自定義 COCO
    發(fā)表于 03-05 06:02

    領(lǐng)克汽車成都工廠引入優(yōu)必選無人物流方案

    近日,領(lǐng)克汽車成都工廠在智能制造領(lǐng)域邁出了重要一步,引入了優(yōu)必選智慧物流子公司UQI優(yōu)奇的全棧式無人物流解決方案。這一創(chuàng)新舉措標志著領(lǐng)克汽車在提升生產(chǎn)效率、優(yōu)化物流流程方面取得了新的突破。
    的頭像 發(fā)表于 01-24 14:26 ?473次閱讀

    Open-E JovianDSS Up31增強的功能和新特性

    我們非常高興地宣布發(fā)布 Open-E JovianDSS Up31 版本,該版本包含多項強大的增強功能和新特性,旨在提高數(shù)據(jù)存儲基礎(chǔ)架構(gòu)的性能、安全和集成能力。以下是最新更新的詳細概述
    的頭像 發(fā)表于 01-24 11:20 ?308次閱讀

    Arm與阿斯頓·馬丁沙特阿美一級方程式賽車車隊達成合作

    公平包容性是 Arm DEI(多樣、公平包容性)戰(zhàn)略的核心支柱之一,對公司內(nèi)外的業(yè)務(wù)發(fā)展與文化建設(shè)具有深遠影響。在今年的國際消費類
    的頭像 發(fā)表于 01-13 11:13 ?385次閱讀

    AMC1200BDUBR在工作時引入了112MHz和132MHz的EMC噪聲,怎么消除?

    請問前輩,我用的TI芯片:AMC1200BDUBR 在工作時引入了112MHz和132MHz的EMC 噪聲。請問電路要怎么改進才能消除這個噪聲?望前輩能幫忙推薦解決方法 不勝感激!
    發(fā)表于 12-23 07:31

    沙特阿拉伯發(fā)布《利雅得宣言》 共筑包容性、創(chuàng)新和有影響力的人工智能未來

    政府、私營部門、非營利部門、企業(yè)家與創(chuàng)新者在數(shù)字領(lǐng)域的國際合作。 沙特通信與信息技術(shù)大臣阿卜杜拉?斯瓦哈(H.E. Abdullah Alswaha) 表示,《利雅得宣言》得到了沙特王儲兼首相的支持與授權(quán)?!独诺眯浴分攸c聚焦于人工智能的包容性、創(chuàng)新和影響力。
    的頭像 發(fā)表于 12-18 09:56 ?302次閱讀

    Cogent DataHub: 高效實現(xiàn)風電場數(shù)據(jù)集中管理與自動化

    某跨國電力公司利用宏Cogent DataHub軟件集中管理美國西南部多個風電場的數(shù)據(jù)采集與控制,整合和實時傳輸OPC 服務(wù)器數(shù)據(jù),提升了系統(tǒng)集成度,確保了
    的頭像 發(fā)表于 11-07 10:20 ?407次閱讀
    宏<b class='flag-5'>集</b>Cogent DataHub: 高效實現(xiàn)風電場<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集中</b>管理與自動化

    TIDP.SAA接口怎么實現(xiàn)I2C Read Extended功能?

    我想要支持I2C Read Extended功能,如上圖所示,讀出00FF數(shù)據(jù),但是接口代碼中的I2C_Read_Generic和 Read_Extended_Word并不能和TI的軟件一樣支持讀出
    發(fā)表于 09-27 06:33

    求助,為什么噪聲很小的信號通過一階有源低通濾波器后反而引入了高頻噪聲?

    為什么噪聲很小的信號通過一階有源低通濾波器后反而引入了高頻噪聲?(信號從左邊輸入先經(jīng)放大后再濾波,放大后的信號還是噪聲非常小的)
    發(fā)表于 09-10 08:02

    DP83TC811:Open Alliance規(guī)范合規(guī)測試所用的配置

    電子發(fā)燒友網(wǎng)站提供《DP83TC811:Open Alliance規(guī)范合規(guī)測試所用的配置.pdf》資料免費下載
    發(fā)表于 08-27 09:50 ?0次下載
    DP83TC811:<b class='flag-5'>Open</b> Alliance規(guī)范合規(guī)<b class='flag-5'>性</b>測試所用的配置

    AMC1200BDUBR在工作時引入了112MHz和132MHz的EMC噪聲,請問電路要怎么改進才能消除這個噪聲?

    請問前輩,我用的TI芯片:AMC1200BDUBR 在工作時引入了112MHz和132MHz的EMC 噪聲。請問電路要怎么改進才能消除這個噪聲?望前輩能幫忙推薦解決方法 不勝感激!
    發(fā)表于 08-22 06:26

    PyTorch如何訓練自己的數(shù)據(jù)

    PyTorch是一個廣泛使用的深度學習框架,它以其靈活性、易用和強大的動態(tài)圖特性而聞名。在訓練深度學習模型時,數(shù)據(jù)是不可或缺的組成部分。然而,很多時候,我們可能需要使用自己的數(shù)據(jù)
    的頭像 發(fā)表于 07-02 14:09 ?2952次閱讀

    微軟MSN天氣服務(wù)引入全新AI模型

    微軟在天氣預(yù)測領(lǐng)域取得了突破的進展,為MSN天氣服務(wù)引入了全新的AI預(yù)測模型。該模型由微軟Start團隊精心研發(fā),并基于他們在arXiv上發(fā)表的最新論文。這一創(chuàng)新模型結(jié)合了五種不同的人工智能模型和三種深度學習架構(gòu),形成了一個強
    的頭像 發(fā)表于 05-07 09:25 ?762次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品