0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenGVLab開源平臺推動通用AI技術(shù)的規(guī)模化應(yīng)用

商湯科技SenseTime ? 來源:商湯科技SenseTime ? 作者:商湯科技SenseTime ? 2022-03-08 16:14 ? 次閱讀

下面這幾張圖的內(nèi)容分別是什么?你或許一眼就能看出是打麻將、競速摩托、香檳、熊貓。

人工智能不一定可以。

雖然人工智能已經(jīng)強(qiáng)大到可以識別萬物,但很多AI模型只能完成單一的任務(wù),比如識別單一的物體,或者識別風(fēng)格較為統(tǒng)一的照片,如果換一種類型或者風(fēng)格,就愛莫能助。

現(xiàn)在,有一位“書生”,對于這不同類型的圖,它都能較為準(zhǔn)確地識別出其中的內(nèi)容,包括圖畫。

這需要有獨(dú)特的模型訓(xùn)練及標(biāo)簽體系,也要求模型具有一定的通用性,這樣才能對不同類型的圖片做出準(zhǔn)確的描述。

這位“書生”正是去年11月,由上海人工智能實(shí)驗(yàn)室聯(lián)合商湯科技、香港中文大學(xué)、上海交通大學(xué),聯(lián)合發(fā)布的通用視覺技術(shù)體系“書生”(INTERN)。

今天,為了幫助業(yè)界更好地探索通用視覺AI技術(shù),基于“書生”技術(shù)體系的通用視覺平臺OpenGVLab正式發(fā)布并開源。

OpenGVLab開放的內(nèi)容包括其超高效預(yù)訓(xùn)練模型,和千萬級精標(biāo)注、十萬級標(biāo)簽量的公開數(shù)據(jù)集,為全球開發(fā)者提升各類下游視覺任務(wù)模型訓(xùn)練提供重要支持。

同時(shí),OpenGVLab還同步開放業(yè)內(nèi)首個(gè)針對通用視覺模型的評測基準(zhǔn),便于開發(fā)者對不同通用視覺模型的性能進(jìn)行橫向評估和持續(xù)調(diào)優(yōu)。

目前OpenGVLab開源平臺(opengvlab.shlab.org.cn)已正式上線,供各界研究人員訪問和使用,后續(xù)項(xiàng)目還將開通在線推理功能,供所有對人工智能視覺技術(shù)感興趣的社會人士自由體驗(yàn)。

超高性能模型,展現(xiàn)極強(qiáng)的通用性

OpenGVLab繼承了“書生”體系的技術(shù)優(yōu)勢,其開源的預(yù)訓(xùn)練模型具有超高的性能和通用性。

具體而言,相較于當(dāng)前最強(qiáng)開源模型(OpenAI 于2021年發(fā)布的CLIP),OpenGVLab的模型可全面覆蓋分類、目標(biāo)檢測、語義分割、深度估計(jì)四大視覺核心任務(wù),在準(zhǔn)確率和數(shù)據(jù)使用效率上均取得大幅提升。

基于同樣的下游場景數(shù)據(jù),開源模型在分類、目標(biāo)檢測、語義分割及深度估計(jì)四大任務(wù)26個(gè)數(shù)據(jù)集上,平均錯誤率分別降低了40.2%、47.3%、34.8%和9.4%。

開源模型在分類、檢測、分割和深度估計(jì)中,僅用10%的下游訓(xùn)練數(shù)據(jù)就超過了現(xiàn)有其他開源模型。

使用此模型,研究人員可以大幅降低下游數(shù)據(jù)采集成本,用極低的數(shù)據(jù)量,即可快速滿足多場景、多任務(wù)的AI模型訓(xùn)練。

OpenGVLab還提供多種不同參數(shù)量、不同計(jì)算量的預(yù)訓(xùn)練模型,以滿足不同場景的應(yīng)用。模型庫中列出了多個(gè)模型,其在ImageNet的微調(diào)結(jié)果和推理資源、速度,相比于之前的公開模型均有不同程度的性能提升。

開放千萬級精標(biāo)注數(shù)據(jù)集

高性能的模型,離不開豐富數(shù)據(jù)集的訓(xùn)練。

除了預(yù)訓(xùn)練模型,以百億數(shù)據(jù)總量為基礎(chǔ),上海人工智能實(shí)驗(yàn)室構(gòu)建了超大量級的精標(biāo)注數(shù)據(jù)集,近期將進(jìn)行數(shù)據(jù)開源工作。

超大量級的精標(biāo)注數(shù)據(jù)集不僅整合了現(xiàn)有的開源數(shù)據(jù)集,還通過大規(guī)模數(shù)據(jù)圖像標(biāo)注任務(wù),實(shí)現(xiàn)了對圖像分類、目標(biāo)檢測以及圖像分割等任務(wù)的覆蓋,數(shù)據(jù)總量級近七千萬。開源范圍涵蓋千萬級精標(biāo)注數(shù)據(jù)集和十萬級標(biāo)簽體系。

目前,圖像分類任務(wù)數(shù)據(jù)集已率先開源,后續(xù)還將開源目標(biāo)檢測任務(wù)等更多數(shù)據(jù)集。

此外,此次開源的超大標(biāo)簽體系,不僅幾乎覆蓋了所有現(xiàn)有開源數(shù)據(jù)集,并在此基礎(chǔ)上擴(kuò)充了大量細(xì)粒度標(biāo)簽,涵蓋各類圖像中的屬性、狀態(tài)等,極大豐富了圖像任務(wù)的應(yīng)用場景,顯著降低下游數(shù)據(jù)的采集成本。

研究人員還可以通過自動化工具添加更多標(biāo)簽,對數(shù)據(jù)標(biāo)簽體系進(jìn)行持續(xù)擴(kuò)展和延伸,不斷提高標(biāo)簽體系的細(xì)粒度,共同促進(jìn)開源生態(tài)繁榮發(fā)展。

首個(gè)通用視覺評測基準(zhǔn)

伴隨OpenGVLab的發(fā)布,上海人工智能實(shí)驗(yàn)室還開放了業(yè)內(nèi)首個(gè)針對通用視覺模型的評測基準(zhǔn),彌補(bǔ)通用視覺模型評測領(lǐng)域的空白。

當(dāng)前,行業(yè)中已有的評測基準(zhǔn)主要針對單一任務(wù)、單一視覺維度設(shè)計(jì),無法反映通用視覺模型的整體性能,難以用于橫向比較。

全新的通用視覺評測基準(zhǔn)憑借在任務(wù)、數(shù)據(jù)等層面的創(chuàng)新設(shè)計(jì),可以提供權(quán)威的評測結(jié)果,推動統(tǒng)一標(biāo)準(zhǔn)上的公平和準(zhǔn)確評測,加快通用視覺模型的產(chǎn)業(yè)化應(yīng)用步伐。

在任務(wù)設(shè)計(jì)上,OpenGVLab提供的通用視覺評測基準(zhǔn)創(chuàng)新地引入了多任務(wù)評測體系,可以從分類、目標(biāo)檢測、語義分割、深度估計(jì)、行為識別等5類任務(wù)方向,對模型的通用性能進(jìn)行整體評估。

不僅如此,該評測基準(zhǔn)新加了僅用測試數(shù)據(jù)集10%數(shù)據(jù)量的評測設(shè)定,可以有效評估通用模型在真實(shí)數(shù)據(jù)分布下的小樣本學(xué)習(xí)能力。在測試后,評測基準(zhǔn)還會根據(jù)模型的評測結(jié)果給出相應(yīng)的總分,方便使用者對不同的模型進(jìn)行橫向評測。

隨著人工智能與產(chǎn)業(yè)融合的不斷深入,行業(yè)對人工智能的需求逐漸從單一任務(wù)向復(fù)雜的多任務(wù)協(xié)同發(fā)展,亟需構(gòu)建開源、開放的體系,以滿足趨于碎片化和長尾化的海量應(yīng)用需求。

OpenGVLab的開源,將幫助開發(fā)者顯著降低通用視覺模型的開發(fā)門檻,用更低成本快速開發(fā)用于成百上千種視覺任務(wù)、視覺場景的算法模型,高效實(shí)現(xiàn)對長尾場景的覆蓋,推動通用AI技術(shù)的規(guī)?;瘧?yīng)用。

歡迎大家加入OpenGVLab,一起構(gòu)筑通用AI生態(tài)。

原文標(biāo)題:通用視覺研究利器來了!OpenGVLab平臺正式開源

文章出處:【微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47484

    瀏覽量

    239162
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3379

    瀏覽量

    42600
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3277

    瀏覽量

    48964

原文標(biāo)題:通用視覺研究利器來了!OpenGVLab平臺正式開源

文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    廣汽埃安攜手小馬智行打造Robotaxi規(guī)?;?/b>量產(chǎn)車型

    近日,廣汽埃安與小馬智行在廣汽集團(tuán)番禺總部舉行Robotaxi戰(zhàn)略合作簽約儀式。根據(jù)協(xié)議,雙方將進(jìn)一步合作打造具備商業(yè)運(yùn)營競爭力的Robotaxi規(guī)?;?/b>量產(chǎn)車型,共同推動全無人Robotaxi量產(chǎn)商業(yè)落地。
    的頭像 發(fā)表于 12-12 13:47 ?170次閱讀

    蔚來能源武漢制造中心規(guī)?;?/b>量產(chǎn)

    近日,中國光谷迎來了蔚來能源武漢制造中心的一個(gè)重要里程碑——第100座換電站正式下線。這一事件標(biāo)志著蔚來能源全球最大的能源產(chǎn)品生產(chǎn)基地已經(jīng)正式邁入規(guī)?;?/b>量產(chǎn)的新階段。 蔚來能源武漢制造中心占地面積約
    的頭像 發(fā)表于 12-06 11:38 ?628次閱讀

    把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)推動端側(cè)AI規(guī)模化拓展

    當(dāng)前,AI大模型走向端側(cè)已經(jīng)是大勢所趨,端側(cè)AI的發(fā)展將推動人工智能成為影響世界的第四次工業(yè)革命。與傳統(tǒng)的云端大模型相比,端側(cè)大模型擁有更小的參數(shù)體量和更垂直的訓(xùn)練數(shù)據(jù)。對于終端產(chǎn)品而言,端側(cè)
    的頭像 發(fā)表于 11-26 01:00 ?188次閱讀
    把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)<b class='flag-5'>推動</b>端側(cè)<b class='flag-5'>AI</b><b class='flag-5'>規(guī)?;?/b>拓展

    把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)推動端側(cè)AI規(guī)?;?/b>拓展

    當(dāng)前,AI大模型走向端側(cè)已經(jīng)是大勢所趨,端側(cè)AI的發(fā)展將推動人工智能成為影響世界的第四次工業(yè)革命。與傳統(tǒng)的云端大模型相比,端側(cè)大模型擁有更小的參數(shù)體量和更垂直的訓(xùn)練數(shù)據(jù)。對于終端產(chǎn)品而言,端側(cè)
    的頭像 發(fā)表于 11-25 16:45 ?304次閱讀
    把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)<b class='flag-5'>推動</b>端側(cè)<b class='flag-5'>AI</b><b class='flag-5'>規(guī)?;?/b>拓展

    AI高性能計(jì)算平臺是什么

    AI高性能計(jì)算平臺不僅是AI技術(shù)發(fā)展的基石,更是推動AI應(yīng)用落地、加速產(chǎn)業(yè)升級的重要工具。以下,
    的頭像 發(fā)表于 11-11 09:56 ?232次閱讀

    智慧農(nóng)業(yè)平臺推動農(nóng)業(yè)現(xiàn)代的科技力量

    隨著信息技術(shù)的飛速發(fā)展,智慧農(nóng)業(yè)平臺正逐步成為推動農(nóng)業(yè)現(xiàn)代、提高農(nóng)業(yè)生產(chǎn)效率和質(zhì)量的重要力量。智慧農(nóng)業(yè)平臺集成了物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人
    的頭像 發(fā)表于 10-15 16:25 ?341次閱讀

    南方測繪亮相中國國際北斗規(guī)?;?/b>應(yīng)用博覽會

    7月18日-20日,中國國際北斗規(guī)?;?/b>應(yīng)用博覽會在成都世紀(jì)城新國際會展中心舉辦。本屆展會與第九屆中國(成都)智慧產(chǎn)業(yè)國際博覽會(以下簡稱“智慧產(chǎn)業(yè)博覽會”)同期舉辦,有效推動了北斗產(chǎn)業(yè)產(chǎn)需對接
    的頭像 發(fā)表于 07-22 10:55 ?929次閱讀

    IBM加速AI規(guī)模化應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力

    今天,由北京市貿(mào)促會主辦、以“吸收外資,助力北京高水平對外開放”為主題的北京國際投資貿(mào)易洽談(京洽會)會在國家會議中心成功舉行。IBM 大中華區(qū)董事長、總經(jīng)理陳旭東應(yīng)邀參會,并以“加速 AI 規(guī)模化應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力”為題作主旨演講。
    的頭像 發(fā)表于 07-16 09:46 ?579次閱讀
    IBM加速<b class='flag-5'>AI</b><b class='flag-5'>規(guī)?;?/b>應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力

    IBM陳旭東:攜手IBM加速 AI 規(guī)模化應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力

    、總經(jīng)理陳旭東應(yīng)邀參會,并以"加速 AI 規(guī)?;?/b>應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力"為題作主旨演講。 他認(rèn)為,在企業(yè)規(guī)?;?/b>應(yīng)用AI的路徑中,最關(guān)鍵的是如何把企業(yè)數(shù)據(jù)轉(zhuǎn)化為
    的頭像 發(fā)表于 07-15 16:13 ?333次閱讀
    IBM陳旭東:攜手IBM加速 <b class='flag-5'>AI</b> <b class='flag-5'>規(guī)模化</b>應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力

    科華數(shù)據(jù)攜手希姆計(jì)算,推動國產(chǎn)RISC-V開源AI算力快速發(fā)展

    近日,科華數(shù)據(jù)與希姆計(jì)算簽署戰(zhàn)略合作協(xié)議。依據(jù)協(xié)議,雙方將利用各自的技術(shù)優(yōu)勢和資源,打造先進(jìn)的國產(chǎn)AI智算中心,配備先進(jìn)的硬件設(shè)備和軟件系統(tǒng),支持大規(guī)模
    的頭像 發(fā)表于 06-30 08:36 ?607次閱讀
    科華數(shù)據(jù)攜手希姆計(jì)算,<b class='flag-5'>推動</b>國產(chǎn)RISC-V<b class='flag-5'>開源</b><b class='flag-5'>AI</b>算力快速發(fā)展

    科華數(shù)據(jù)攜手希姆計(jì)算,推動國產(chǎn)RISC-V開源AI算力快速發(fā)展

    近日,科華數(shù)據(jù)與希姆計(jì)算簽署戰(zhàn)略合作協(xié)議。依據(jù)協(xié)議,雙方將利用各自的技術(shù)優(yōu)勢和資源,打造先進(jìn)的國產(chǎn)AI智算中心,配備先進(jìn)的硬件設(shè)備和軟件系統(tǒng),支持大規(guī)模
    的頭像 發(fā)表于 06-26 08:36 ?576次閱讀
    科華數(shù)據(jù)攜手希姆計(jì)算,<b class='flag-5'>推動</b>國產(chǎn)RISC-V<b class='flag-5'>開源</b><b class='flag-5'>AI</b>算力快速發(fā)展

    IBM開源AI模型,推動AI企業(yè)應(yīng)用

    IBM近日宣布,將把一系列先進(jìn)的人工智能模型以開源軟件的形式發(fā)布,此舉標(biāo)志著人工智能技術(shù)在企業(yè)應(yīng)用上的新篇章。公司表示,隨著watsonx平臺推出滿一年,該平臺將迎來重大更新,新增的數(shù)
    的頭像 發(fā)表于 05-22 09:25 ?500次閱讀

    比斯特自動|新能源行業(yè)降本攻堅(jiān):從自動升級推動規(guī)?;?/b>生產(chǎn)新篇章

    隨著全球環(huán)保意識的不斷加強(qiáng),新能源行業(yè)的發(fā)展勢頭日益迅猛。然而,在快速發(fā)展的同時(shí),新能源行業(yè)也面臨著巨大的降本壓力。為了應(yīng)對這一挑戰(zhàn),規(guī)模化生產(chǎn)成為了行業(yè)的迫切需求,而自動升級則是實(shí)現(xiàn)規(guī)?;?/b>生產(chǎn)的關(guān)鍵一步。
    的頭像 發(fā)表于 05-09 09:43 ?401次閱讀
    比斯特自動<b class='flag-5'>化</b>|新能源行業(yè)降本攻堅(jiān):從自動<b class='flag-5'>化</b>升級<b class='flag-5'>推動</b><b class='flag-5'>規(guī)?;?/b>生產(chǎn)新篇章

    聲通科技:高標(biāo)準(zhǔn)及可擴(kuò)展的產(chǎn)品能力,助力公司實(shí)現(xiàn)規(guī)?;?/b>經(jīng)營

    高標(biāo)準(zhǔn)及可擴(kuò)展的產(chǎn)品能力對企業(yè)發(fā)展具有重要意義,有助于企業(yè)提高運(yùn)營效率、增強(qiáng)市場競爭力,并推動企業(yè)實(shí)現(xiàn)規(guī)?;?/b>發(fā)展。上海聲通信息科技股份有限公司(下文稱:聲通科技或公司)作為我國領(lǐng)先的企業(yè)級全棧
    的頭像 發(fā)表于 04-16 15:51 ?357次閱讀

    螞蟻集團(tuán)AI研發(fā)部門開源AI Infra技術(shù),助力大模型訓(xùn)練效率提升

    螞蟻集團(tuán)AI創(chuàng)新研發(fā)部門NextEvo近日宣布,他們將全面開源AI Infra技術(shù),以推動AI
    的頭像 發(fā)表于 02-04 10:01 ?1115次閱讀