0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌 | AI再突破,Efficientnets有望成為計(jì)算機(jī)視覺任務(wù)的新基礎(chǔ)!

DR2b_Aiobservat ? 來源:YXQ ? 2019-06-04 15:28 ? 次閱讀

谷歌人工智能研究部門的科學(xué)家認(rèn)為Efficientnets通過寬度、深度、分辨率三個(gè)維度的復(fù)合擴(kuò)展,展現(xiàn)出比現(xiàn)行的CNN更高的精度和效率,將成為未來計(jì)算機(jī)視覺任務(wù)的新基礎(chǔ)。

卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為人工神經(jīng)網(wǎng)絡(luò)的一種,是當(dāng)下語音分析和圖像識(shí)別領(lǐng)域的研究熱點(diǎn)。

它的人工神經(jīng)元可以響應(yīng)一部分覆蓋范圍內(nèi)的周圍單元,所以對(duì)于大型圖像處理有出色表現(xiàn),但是如果要某一點(diǎn)上提高準(zhǔn)確性,就需要進(jìn)行較為繁瑣的優(yōu)化調(diào)整。

針對(duì)這一現(xiàn)象,谷歌人工智能研究部門的科學(xué)家正在研究一種“更結(jié)構(gòu)化”的方式,用以“縮放”CNN,期望獲得更好的精度和效率。

最近,他們?cè)贏rxiv.org上發(fā)表的一篇論文(EfficientNet : Rethinking Model Scaling for Convolutional Neural Networks)并附帶了一篇博客文章中對(duì)其進(jìn)行描述。他們聲稱,這個(gè)被稱為“Efficientnets”的AI系統(tǒng),超過了最先進(jìn)的精度,并且提升了10倍的效率。

這篇論文的作者工程師Mingxing Tan 和谷歌人工智能首席科學(xué)家Quocv.le都來自谷歌大腦。

他們認(rèn)為,模型縮放的傳統(tǒng)做法是任意增加CNN的深度或?qū)挾?,或者使用更大的輸入圖像分辨率進(jìn)行訓(xùn)練和評(píng)估。區(qū)別于傳統(tǒng)方法,他們采用了一組固定的縮放系數(shù)來均勻縮放每個(gè)尺寸。

圖中最右側(cè)就是他們的方案,在寬度、深度、分辨率三個(gè)維度進(jìn)行復(fù)合擴(kuò)展。單一調(diào)整一個(gè)維度能夠獲得精度提升,但是隨著參數(shù)調(diào)的越大,精度增益越平滑,改進(jìn)將會(huì)不明顯。而聯(lián)合調(diào)整就能夠獲得相對(duì)更好的精度增益曲線。

那么,它是如何做到的呢?

首先,在固定的資源約束下,通過進(jìn)行柵欄搜索,識(shí)別基線網(wǎng)絡(luò)不同維度之間的關(guān)系。例如,增加兩倍的FLOPS。這決定了每一個(gè)維度適當(dāng)?shù)目s放系數(shù),將應(yīng)用于基線網(wǎng)絡(luò)縮放至需要的模型尺寸或者計(jì)算預(yù)算。為了進(jìn)一步提高性能,科研人員提出了一種新的基線網(wǎng)絡(luò),即MBConv,可以為EfficientNets模型體系提供種子。

在測(cè)試的過程中,Efficientnets展現(xiàn)出比現(xiàn)行的CNN更高的精度和效率,將參數(shù)大小和FLOPS減少了一個(gè)數(shù)量級(jí)。

其中,Efficientnet-B7比CNNgpipe小8.4倍,快6.1倍,分別在imagenet中上達(dá)到了Top-1(84.4%)和Top-5(97.1%)的精度。與resnet-50相比,EfficientNet-B4使top-1精度從ResNet-50的76.3%提高至82.6%。

EfficientNets在其他數(shù)據(jù)集的表現(xiàn)也很好。在5/8的廣泛使用的轉(zhuǎn)移學(xué)習(xí)數(shù)據(jù)集中,EfficientNets都達(dá)到了最先進(jìn)的精度,并且減少了21個(gè)參數(shù)。例如,CIFAR-100(91.7%)和Flowers(98.8%),這也表明EfficientNets有很好地轉(zhuǎn)移。

兩位作者表示,通過對(duì)模型效率的顯著改進(jìn),EfficientNets有可能成為未來計(jì)算機(jī)視覺活動(dòng)的新基礎(chǔ)。他們開源了所有EfficientNet模型,希望這些模型可以使機(jī)器學(xué)習(xí)社區(qū)受益。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6176

    瀏覽量

    105678
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31262

    瀏覽量

    269631
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1699

    瀏覽量

    46050

原文標(biāo)題:谷歌AI再突破,Efficientnets有望成為計(jì)算機(jī)視覺任務(wù)的新基礎(chǔ)!

文章出處:【微信號(hào):Aiobservation,微信公眾號(hào):人工智能觀察】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動(dòng)了多個(gè)行業(yè)的變革,也帶來了諸多優(yōu)勢(shì),但同時(shí)也伴隨著一些挑戰(zhàn)和局限性。以下是對(duì)
    的頭像 發(fā)表于 08-14 09:49 ?1053次閱讀

    計(jì)算機(jī)視覺技術(shù)的AI算法模型

    計(jì)算機(jī)視覺技術(shù)作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實(shí)現(xiàn)這一目標(biāo),計(jì)算機(jī)視覺技術(shù)依賴于
    的頭像 發(fā)表于 07-24 12:46 ?1003次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺有什么區(qū)別

    。機(jī)器視覺的研究目標(biāo)是讓機(jī)器具有類似人類的視覺能力,能夠自動(dòng)、準(zhǔn)確地完成各種視覺任務(wù)。 計(jì)算機(jī)視覺
    的頭像 發(fā)表于 07-16 10:23 ?573次閱讀

    計(jì)算機(jī)視覺的五大技術(shù)

    計(jì)算機(jī)視覺作為深度學(xué)習(xí)領(lǐng)域最熱門的研究方向之一,其技術(shù)涵蓋了多個(gè)方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對(duì)計(jì)算機(jī)視覺五大技術(shù)的詳細(xì)解析,包括圖像分類、對(duì)象檢測(cè)、目標(biāo)跟蹤、語義分割
    的頭像 發(fā)表于 07-10 18:26 ?1462次閱讀

    計(jì)算機(jī)視覺的工作原理和應(yīng)用

    計(jì)算機(jī)視覺(Computer Vision,簡(jiǎn)稱CV)是一門跨學(xué)科的研究領(lǐng)域,它利用計(jì)算機(jī)和數(shù)學(xué)算法來模擬人類視覺系統(tǒng)對(duì)圖像和視頻進(jìn)行識(shí)別、理解、分析和處理。其核心目標(biāo)在于使
    的頭像 發(fā)表于 07-10 18:24 ?2163次閱讀

    計(jì)算機(jī)視覺與人工智能的關(guān)系是什么

    引言 計(jì)算機(jī)視覺是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域的知識(shí)。人工智能則是研究如何使計(jì)算
    的頭像 發(fā)表于 07-09 09:25 ?705次閱讀

    計(jì)算機(jī)視覺與智能感知是干嘛的

    引言 計(jì)算機(jī)視覺(Computer Vision)是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域,是人工智能的重要組成部分。智能
    的頭像 發(fā)表于 07-09 09:23 ?996次閱讀

    計(jì)算機(jī)視覺和機(jī)器視覺區(qū)別在哪

    計(jì)算機(jī)視覺和機(jī)器視覺是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 一、定義 計(jì)算機(jī)視覺 計(jì)算機(jī)
    的頭像 發(fā)表于 07-09 09:22 ?486次閱讀

    計(jì)算機(jī)視覺和圖像處理的區(qū)別和聯(lián)系

    計(jì)算機(jī)視覺和圖像處理是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 1. 基本概念 1.1 計(jì)算機(jī)視覺 計(jì)算機(jī)視覺
    的頭像 發(fā)表于 07-09 09:16 ?1392次閱讀

    計(jì)算機(jī)視覺屬于人工智能嗎

    屬于,計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個(gè)重要分支。 引言 計(jì)算機(jī)視覺是一門研究如何使計(jì)算機(jī)具有視覺
    的頭像 發(fā)表于 07-09 09:11 ?1360次閱讀

    深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用

    深度學(xué)習(xí)技術(shù)的引入,極大地推動(dòng)了計(jì)算機(jī)視覺領(lǐng)域的發(fā)展,使其能夠處理更加復(fù)雜和多樣化的視覺任務(wù)。本文將詳細(xì)介紹深度學(xué)習(xí)在計(jì)算機(jī)
    的頭像 發(fā)表于 07-01 11:38 ?881次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺的區(qū)別

    在人工智能和自動(dòng)化技術(shù)的快速發(fā)展中,機(jī)器視覺(Machine Vision, MV)和計(jì)算機(jī)視覺(Computer Vision, CV)作為兩個(gè)重要的分支領(lǐng)域,都扮演著至關(guān)重要的角色。盡管它們?cè)?/div>
    的頭像 發(fā)表于 06-06 17:24 ?1378次閱讀

    計(jì)算機(jī)視覺的主要研究方向

    計(jì)算機(jī)視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一個(gè)重要分支,致力于使計(jì)算機(jī)能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學(xué)習(xí)、大數(shù)據(jù)等技術(shù)的快速發(fā)展,計(jì)算機(jī)
    的頭像 發(fā)表于 06-06 17:17 ?1032次閱讀

    計(jì)算機(jī)視覺的十大算法

    視覺技術(shù)的發(fā)展起到了重要的推動(dòng)作用。一、圖像分割算法圖像分割算法是計(jì)算機(jī)視覺領(lǐng)域的基礎(chǔ)算法之一,它的主要任務(wù)是將圖像分割成不同的區(qū)域或?qū)ο蟆3R姷膱D像分割算法包括基
    的頭像 發(fā)表于 02-19 13:26 ?1286次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>的十大算法

    機(jī)器視覺、工業(yè)視覺計(jì)算機(jī)視覺這三者的關(guān)系

    機(jī)器視覺、工業(yè)視覺計(jì)算機(jī)視覺這三者的關(guān)系
    的頭像 發(fā)表于 01-24 10:51 ?1367次閱讀
    機(jī)器<b class='flag-5'>視覺</b>、工業(yè)<b class='flag-5'>視覺</b>和<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>這三者的關(guān)系