0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

VtWH_馭勢未 ? 來源:djl ? 2019-09-19 11:02 ? 次閱讀

給定目標(biāo)硬件,如何確定最優(yōu)的速度-精度折衷邊界?換言之:給定推斷延時的限制,模型能達到的最高精度是多少?給定精度要求,模型所需的最短延時是多少?

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

為此,馭勢科技AI研究院聯(lián)合新加坡國立大學(xué)提出了偏序關(guān)系剪枝(Partial Order Pruning)方法,直接考慮模型在目標(biāo)硬件上的延時,利用偏序關(guān)系假設(shè)對搜索空間進行剪枝,平衡模型的寬度與深度,以提高速度-精度折衷的邊界。應(yīng)用該方法所得的東風(fēng)(DF)骨干網(wǎng)絡(luò),取得了目標(biāo)硬件(TX2)上的最優(yōu)速度-精度折衷。應(yīng)用該方法于語義分割網(wǎng)絡(luò)Decoder的結(jié)構(gòu)搜索,所得的東風(fēng)分割網(wǎng)絡(luò)(DF-Seg)也取得了TX2/1080Ti上最優(yōu)的速度-精度折衷。

在實際運用當(dāng)中,具備多重實用價值,主要體現(xiàn)在以下幾個方面:

(一)DF/DF-Seg網(wǎng)絡(luò)的實用價值

(1)DF網(wǎng)絡(luò)取得了目標(biāo)硬件(TX2)上最優(yōu)的速度-精度折衷。

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

(2)DF網(wǎng)絡(luò)節(jié)約顯存。以DF2A網(wǎng)絡(luò)為例,其精度介于ResNet50/101之間,而僅需1/3至1/2的顯存(以BVLC Caffe測試)。

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

(3)DF網(wǎng)絡(luò)結(jié)構(gòu)簡單,僅使用基本的殘差模塊,相當(dāng)于更“精耕細(xì)作”的ResNet。

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

(4)DF-Seg網(wǎng)絡(luò)是TX2/1080Ti/Titan X(Maxwell)上速度-精度折衷最好的分割網(wǎng)絡(luò)。

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

省時間、省顯存、結(jié)構(gòu)簡單,使得DF/DF-Seg網(wǎng)絡(luò)有助于在嵌入式設(shè)備TX2上部署高精度、低延時、多路圖像并行處理的CNN模型;有助于高端GPU上的視頻處理、大規(guī)模圖像數(shù)據(jù)處理等任務(wù)的部署;有助于科研人員,尤其是計算資源不足的科研人員,節(jié)省計算資源,實現(xiàn)更復(fù)雜的算法。

(二)偏序關(guān)系剪枝算法的實用價值

DF網(wǎng)絡(luò)更適合GPU平臺,我們也利用偏序關(guān)系剪枝算法,在驍龍845 CPU平臺上進行了骨干網(wǎng)絡(luò)結(jié)構(gòu)與分割網(wǎng)絡(luò)Decoder結(jié)構(gòu)的搜索,所得語義分割網(wǎng)絡(luò)得到了目前CPU平臺上最好速度-精度折衷。

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

以下為該論文內(nèi)容翻譯:

一、偏序關(guān)系剪枝算法

(一)搜索空間設(shè)計與模型結(jié)構(gòu)編碼

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

圖2(a)為本文的模型搜索空間,圖2(b)為本文使用的殘差模塊結(jié)構(gòu)。網(wǎng)絡(luò)由6個Stage構(gòu)成,Stage1~5均通過設(shè)步長為2降低輸入特征的分辨率,Stage6通過全局池化與全連接層產(chǎn)生分類結(jié)果。本文的模型搜索不搜索基本模塊的結(jié)構(gòu),而是在基本殘差模塊的基礎(chǔ)上,對網(wǎng)絡(luò)整體的寬度與深度進行平衡。在Stage3~5,模型分別包含L/M/N個殘差模塊,Stage s中的第i個殘差模塊的寬度記為,因此本文將一個結(jié)構(gòu)表示為:

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

(二)模型延時估計與子搜索空間

圖2(a)所表達的搜索空間記為s,實踐中我們僅關(guān)心延時在中的子集,即。為估計各網(wǎng)絡(luò)的延時,我們使用TensorRT提供的性能分析工具,在目標(biāo)硬件TX2上,測量了不同的殘差模塊所需的延時,并建立一個查找表

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

。這里,分別是輸入輸出特征的通道數(shù),而

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

是相應(yīng)的空間尺寸。利用該查找表將各殘差模塊延時進行加和記為對一個網(wǎng)絡(luò)延時的估計。在圖3(a)中,我們對若干網(wǎng)絡(luò)的估計延時與實際延時進行了比較,可見估計延時與實際延時基本一致。

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

(三)偏序關(guān)系假設(shè)

我們借用集合論中的偏序(Partial Order)關(guān)系來描述模型結(jié)構(gòu)之間的聯(lián)系:集合中的元素為不同的模型結(jié)構(gòu)(見圖2(a)),集合中的二元關(guān)系定義為:若x比y更淺且更窄,則稱x是y的前序,記為。如此,整個搜索空間中的模型結(jié)構(gòu)就滿足了嚴(yán)格偏序關(guān)系,包括反自反性、反對稱行、傳遞性。圖4給出了若干模型結(jié)構(gòu)間偏序關(guān)系的示意圖。偏序關(guān)系假設(shè)為:若x是y的前序(意味著x比y更淺且更窄),則x的速度更快,精度更低。這可以寫為:

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

在圖3(b)中,我們基于已訓(xùn)練的模型,對偏序關(guān)系假設(shè)的合理性進行了驗證,其中,

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

??梢?,在本實驗所關(guān)心的模型子空間中,偏序關(guān)系假設(shè)是合理的。

(四)偏序關(guān)系剪枝

基于偏序關(guān)系假設(shè),我們可以在模型搜索中對搜索空間進行剪枝。圖5是該剪枝過程的一個示意圖。集合為已訓(xùn)練的模型結(jié)構(gòu),集合中的模型代表了當(dāng)前迭代中所能達到的最優(yōu)速度-精度折衷邊界。對于一個非邊界模型

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

,其任意前序模型

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

,應(yīng)有:

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

而我們已有速度-精度折衷更好的邊界點:

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

因此w的部分前序元素,延時將比高,而精度將比低,也即處于圖5的陰影部分。這些中的模型結(jié)構(gòu)無法提供更好的速度-精度折衷,可以據(jù)此對搜索空間進行剪枝:。如此反復(fù)迭代,在迭代中不斷對搜索空間進行剪枝,直至速度-精度折衷的邊界趨于穩(wěn)定,如算法1所描述。

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

(五)語義分割網(wǎng)絡(luò)的Decoder設(shè)計

本文中語義分割網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計如圖6所示,在Stage 5中加入了pyramid pooling module,使用圖6(b)所示的Fusion node融合不同分辨率的特征,其中Channel Controller(CC)為1x1卷積,用以控制Decoder在不同分辨率下的寬度。不同的,構(gòu)成了不同復(fù)雜度的Decoder結(jié)構(gòu)。這些Decoder結(jié)構(gòu)之間也存在著偏序關(guān)系假設(shè),因此也可以使用偏序關(guān)系剪枝算法對搜索空間進行剪枝。

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

二、實驗數(shù)據(jù)

(一)TX2上的骨干網(wǎng)絡(luò)搜索

我們在TX2上進行骨干網(wǎng)絡(luò)的搜索,最終選取3個最有代表性的網(wǎng)絡(luò),記為3個東風(fēng)(DF)骨干網(wǎng)絡(luò)。如圖7與表1所示,DF網(wǎng)絡(luò)取得了TX2上最好的速度-精度折衷。

DF1網(wǎng)絡(luò)FLOPs明顯高于MobileNet于ShuffleNet等,但在TX2上實際延時更低。這是因為FLOPs作為間接指標(biāo),僅考慮了浮點計算量而沒有考慮內(nèi)存訪問的延時。以ShuffleNetV2與DF1為例,其內(nèi)存訪問代價(也即中間層的特征),分別為4.9M與2.9M。

NASNet與PNASNet在網(wǎng)絡(luò)結(jié)構(gòu)搜索中均未考慮模型延時,所得模型結(jié)構(gòu)復(fù)雜,內(nèi)存訪問量大,實際延時較高。有一些同期工作(ProxylessNAS/FBNet)也在模型搜索中考慮了模型延時,DF網(wǎng)絡(luò)在速度-精度折衷上也優(yōu)于這些模型。這是因為:一、這些模型未針對TX2平臺進行模型搜索;二、這些網(wǎng)絡(luò)均基于MobileNetV2的inverted bottleneck模塊,相比本文使用的殘差模塊,內(nèi)存訪問量更高。

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

(二)TX2/1080Ti上的Decoder網(wǎng)絡(luò)結(jié)構(gòu)搜索

基于TX2上搜索的東風(fēng)骨干網(wǎng)絡(luò),我們也在TX2/1080Ti上分別進行了Decoder結(jié)構(gòu)搜索。如表3所示,東風(fēng)分割網(wǎng)絡(luò)(DF-Seg)是目前1080Ti上速度-精度折衷最好的語義分割網(wǎng)絡(luò)。DF-Seg網(wǎng)絡(luò)的速度(FPS)與精度(mIoU)均在1024x2048的分辨率下,使用TensorRT提供的性能分析工具在1080Ti上進行測試。為與ICNet公平對比,在FPS(Caffe)欄中使用“Caffe Time”工具,在Titan X(Maxwell)上進行速度測試。表4與表5分別為Titan X(Maxwell)/TX2上的速度測試,DF-Seg的速度大幅優(yōu)于現(xiàn)有結(jié)果,能夠在TX2上實現(xiàn)對720P分辨率圖像的30FPS的語義分割。

回顧馭勢聯(lián)合新加坡國立大學(xué)推出東風(fēng)網(wǎng)絡(luò)的理解

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4624

    瀏覽量

    93110
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7586

    瀏覽量

    89011
  • 結(jié)構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    117

    瀏覽量

    21615
收藏 人收藏

    評論

    相關(guān)推薦

    新加坡云服務(wù)器網(wǎng)絡(luò)中斷的常見原因有哪些

    新加坡云服務(wù)器網(wǎng)絡(luò)中斷的常見原因包括以下幾方面: 硬件故障,網(wǎng)絡(luò)設(shè)備故障:數(shù)據(jù)中心內(nèi)部的路由器、交換機等網(wǎng)絡(luò)設(shè)備出現(xiàn)故障,會導(dǎo)致云服務(wù)器無法正常連接
    的頭像 發(fā)表于 01-13 17:03 ?72次閱讀

    清華大學(xué)深圳國際研究生院、新加坡國立大學(xué):研發(fā)新型的超材料生物傳感器件最新設(shè)計制備

    研究背景 隨著交通運輸?shù)目焖侔l(fā)展和汽車數(shù)量的激增,交通安全問題日益受到關(guān)注。根據(jù)統(tǒng)計數(shù)據(jù),人類因素如嗜睡、疲勞等每年導(dǎo)致美國約10萬起交通事故,嚴(yán)重影響了公眾的生命安全和社會穩(wěn)定。因此,研究如何提高駕駛安全性,尤其是通過監(jiān)測駕駛員的生理狀態(tài),成為了一個重要的研究領(lǐng)域。在這一背景下,生物傳感器技術(shù)作為一種新興的監(jiān)測手段,引起了科學(xué)家的廣泛關(guān)注。 生物傳感器是能夠檢測生物標(biāo)志物并提供實時反饋的設(shè)備,主要用于監(jiān)
    的頭像 發(fā)表于 01-02 18:14 ?204次閱讀
    清華<b class='flag-5'>大學(xué)</b>深圳國際研究生院、<b class='flag-5'>新加坡</b><b class='flag-5'>國立大學(xué)</b>:研發(fā)新型的超材料生物傳感器件最新設(shè)計制備

    東風(fēng)日產(chǎn)與Momenta合作推出高階智駕方案

    日前,東風(fēng)日產(chǎn)官宣攜手全球領(lǐng)先的自動駕駛公司Momenta,聯(lián)合打造基于端到端智駕大模型的行業(yè)領(lǐng)先高階智駕方案。東風(fēng)日產(chǎn)與Momenta的合作,是東風(fēng)日產(chǎn)智能化轉(zhuǎn)型的關(guān)鍵一步,標(biāo)志其正
    的頭像 發(fā)表于 11-22 16:56 ?621次閱讀

    新加坡到深圳:南洋理工大學(xué)(NTU)與VoiceAI的深度對話

    近日,來自新加坡南洋理工大學(xué)的數(shù)十名師生到訪聲揚科技深圳總部,與聲揚科技“硬核科研團”展開深度交流。公司聯(lián)合創(chuàng)始人、總經(jīng)理張偉彬博士出席交流會,與新加坡南洋理工
    的頭像 發(fā)表于 11-13 14:29 ?420次閱讀
    從<b class='flag-5'>新加坡</b>到深圳:南洋理工<b class='flag-5'>大學(xué)</b>(NTU)與VoiceAI的深度對話

    【廈門同昌源】受邀參加中國-新加坡健康電子先進材料雙邊論壇(S3AM-2024)

    (IMRE)執(zhí)行院長羅賢俊院士、廈門大學(xué)柔性電子(未來技術(shù))研究院(廈大IFE)常務(wù)副院長霍峰蔚教授、新加坡國立大學(xué)劉小鋼院士擔(dān)任大會主席。廈門同昌源電子受邀參加本次
    的頭像 發(fā)表于 11-12 01:06 ?340次閱讀
    【廈門同昌源】受邀參加中國-<b class='flag-5'>新加坡</b>健康電子先進材料雙邊論壇(S3AM-2024)

    Commvault與Pure Storage聯(lián)合推出網(wǎng)絡(luò)就緒解決方案

    混合云網(wǎng)絡(luò)彈性和數(shù)據(jù)保護解決方案的領(lǐng)先提供商Commvault(納斯達克代碼:CVLT)宣布與Pure Storage聯(lián)合推出一項網(wǎng)絡(luò)就緒解決方案。該解決方案能夠在幫助企業(yè)遵守不斷變化的嚴(yán)格法規(guī)方面發(fā)揮關(guān)鍵作用。
    的頭像 發(fā)表于 10-15 09:16 ?510次閱讀

    比亞迪騰D9登陸新加坡,正式進軍右舵國家市場

    10月11日最新消息,比亞迪騰汽車于昨日在新加坡市場正式亮相,標(biāo)志著其正式進軍右舵駕駛國家。   昨日,右舵版騰D9在新加坡正式發(fā)布,其售價區(qū)間為296,888新元至341,
    的頭像 發(fā)表于 10-11 17:07 ?953次閱讀

    中科數(shù)受邀出席中國科學(xué)院大學(xué)校友論壇

    近日,第五屆中國科學(xué)院大學(xué)校友創(chuàng)新論壇正式舉行,本次論壇聚焦科技前沿領(lǐng)域,旨在搭建高端對話平臺,促進產(chǎn)學(xué)研深度融合。在大算力時代——AI技術(shù)前沿沙龍上,中科數(shù)高級副總裁、CTO盧文巖博士受邀
    的頭像 發(fā)表于 09-29 09:45 ?342次閱讀

    中科數(shù)分析DPU在云原生網(wǎng)絡(luò)與智算網(wǎng)絡(luò)中的實際應(yīng)用

    CCF Chip 2024,精彩不能停!7月21日下午,中科數(shù)在第二屆中國計算機學(xué)會(CCF)芯片大會的“數(shù)專屬時刻”仍在繼續(xù),數(shù)組織承辦“DPU技術(shù)趨勢和應(yīng)用——DPU在云原生與智算網(wǎng)
    的頭像 發(fā)表于 08-02 11:21 ?740次閱讀

    同星智能贊北京理工大學(xué)東風(fēng)日產(chǎn)方程式賽車隊(BITFSAE)

    BITFSAE東風(fēng)日產(chǎn)方程式賽車隊北京理工大學(xué)東風(fēng)日產(chǎn)方程式賽車隊(BITFSAE)成立于2009年,是一支由賽車技術(shù)興趣愛好者及汽車相關(guān)專業(yè)人才組成的學(xué)生科技創(chuàng)新隊伍,連續(xù)13年參加中國汽車
    的頭像 發(fā)表于 06-18 08:21 ?413次閱讀
    同星智能贊北京理工<b class='flag-5'>大學(xué)</b><b class='flag-5'>東風(fēng)</b>日產(chǎn)方程式賽車隊(BITFSAE)

    科技與高通推出成行平臺全新智能駕駛解決方案

    深圳市卓科技(卓科技)與高通技術(shù)公司宣布深化技術(shù)合作,共同推動汽車行業(yè)的智能駕駛技術(shù)革新。此次合作,雙方利用Snapdragon Ride平臺,推出了全新的智能駕駛產(chǎn)品。
    的頭像 發(fā)表于 05-06 14:26 ?718次閱讀

    新加坡國立大學(xué)醫(yī)院將于2025年上半年啟用AI消化系統(tǒng)健康中心

    新中心將配置計算機輔助檢測、診斷及質(zhì)量控制三大AI系統(tǒng)。據(jù)介紹,這三套系統(tǒng)協(xié)同工作,有望更有效地識別早期胃腸病變,并實現(xiàn)對這些病變的實時量化評分癌癥診斷。
    的頭像 發(fā)表于 05-06 14:13 ?537次閱讀

    Living Well Digitally:由新加坡國立大學(xué)可信互聯(lián)網(wǎng)和社區(qū)中心發(fā)起并由 DQ 提供支持的全球倡議

    新加坡2024年4月20日 /美通社/ -- 2024年4月17日,新加坡國立大學(xué)?(NUS) 可信互聯(lián)網(wǎng)與社區(qū)中心?(CTIC) 啟動了一項開創(chuàng)性的新計劃,"Living Well
    的頭像 發(fā)表于 04-21 23:12 ?372次閱讀
    Living Well Digitally:由<b class='flag-5'>新加坡</b><b class='flag-5'>國立大學(xué)</b>可信互聯(lián)網(wǎng)和社區(qū)中心發(fā)起并由 DQ 提供支持的全球倡議

    在CPU芯片領(lǐng)域,中國將迎來新型服務(wù)器的發(fā)展機遇,

    ? 傳感新品 【新加坡國立大學(xué): 開發(fā)多功能超寬帶、多波長壓縮成像傳感器】 為了尋求一種能夠適應(yīng)多種波長同時保持高分辨率的一體化成像傳感器,新加坡國立大學(xué)劉小鋼教授團隊提出了一種普適性
    的頭像 發(fā)表于 03-21 17:23 ?564次閱讀
    在CPU芯片領(lǐng)域,中國將迎來新型服務(wù)器的發(fā)展機遇,

    數(shù)聯(lián)動百川,發(fā)布首批大模型聯(lián)合解決方案,推動中國大模型價值落地

    近日,行業(yè)領(lǐng)先的數(shù)據(jù)智能產(chǎn)品提供商北京數(shù)云創(chuàng)科技有限公司(以下簡稱“數(shù)科技”)和國內(nèi)通用大模型廠商北京百川智能科技有限公司(以下簡稱“百川”)聯(lián)合發(fā)布大模型數(shù)據(jù)分析垂直領(lǐng)域應(yīng)用解決方案。本次發(fā)布
    的頭像 發(fā)表于 02-28 11:40 ?501次閱讀
    數(shù)<b class='flag-5'>勢</b>聯(lián)動百川,發(fā)布首批大模型<b class='flag-5'>聯(lián)合</b>解決方案,推動中國大模型價值落地