0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

針對(duì)智能駕駛應(yīng)用,深度學(xué)習(xí)應(yīng)該如何落地呢?

高工智能汽車 ? 來源:未知 ? 作者:李倩 ? 2018-07-03 16:53 ? 次閱讀

本文由前向啟創(chuàng)&CTO張暉介紹了前向啟創(chuàng)在TI TDA芯片上,使用深度學(xué)習(xí)方法,解決智能駕駛感知問題的一些經(jīng)驗(yàn)。

深度學(xué)習(xí)以其強(qiáng)大的特征表示能力,已經(jīng)在許多應(yīng)用領(lǐng)域中體現(xiàn)出了不俗的性能。而針對(duì)智能駕駛應(yīng)用,深度學(xué)習(xí)應(yīng)該如何落地呢?

前向啟創(chuàng)&CTO張暉認(rèn)為,主要存在有兩大技術(shù)挑戰(zhàn):一是主芯片的選型,二則是針對(duì)特定芯片的深度學(xué)習(xí)算法的設(shè)計(jì)與實(shí)現(xiàn)。

前向啟創(chuàng)&CTO張暉,2004年畢業(yè)于華中科技大學(xué),獲雙學(xué)士學(xué)位;2004-2005年就職于美國(guó)安凱微電子,任算法工程師;005-2013年就職于美國(guó)ZORAN(CSR/Qualcomm)公司,任算法研發(fā)經(jīng)理;近15年算法芯片化與產(chǎn)品化經(jīng)驗(yàn);在ACCV、ICPR等國(guó)際會(huì)議上發(fā)表學(xué)術(shù)論文多篇;擁有多項(xiàng)中美發(fā)明專利。

TI智能駕駛ASIC

針對(duì)智能駕駛產(chǎn)品主處理器芯片進(jìn)行選型,應(yīng)該將汽車智能駕駛產(chǎn)品的主要訴求——高可靠性與低成本,作為主要參考依據(jù)。

從業(yè)界角度來看,智能駕駛主芯片可分兩大流派,一派為ASIC,將特定的算法計(jì)算引擎芯片化,代表企業(yè)有如TI、Mobileye、nVidia、Ambarella等;另一派則為FPGA,代表企業(yè)有如Xilinx,Altera等。

而ASIC以其定制性,在成本、功耗、算力、彈性、車規(guī)、功能安全等級(jí)以及量產(chǎn)周期上達(dá)到了更好的平衡。

TI(Texas Instuments)自2010年起開始提供針對(duì)智能駕駛的ASIC芯片TDA(TIDriverAssist)系列,至今已經(jīng)迭代到了第四代。

經(jīng)過多年的演進(jìn),TI已經(jīng)將多項(xiàng)針對(duì)智能駕駛的算法逐步芯片化、引擎化,其功能安全等級(jí),也達(dá)到了ASIL-C級(jí)。

TI的ASIC芯片TDA(TIDriverAssist)系列

TI的智能駕駛芯片以其優(yōu)異的性價(jià)比,已被全球超過15家Tier1、25家OEM主機(jī)廠所采用,成功在近100款車型中量產(chǎn),已累積出貨近4千萬片。目前前向啟創(chuàng)也采用TI ASIC芯片。

深度網(wǎng)絡(luò)設(shè)計(jì)

網(wǎng)絡(luò)模型設(shè)計(jì)是深度學(xué)習(xí)應(yīng)用的關(guān)鍵,如何設(shè)計(jì)一個(gè)能滿足產(chǎn)品化要求的智能駕駛感知網(wǎng)絡(luò)呢?

張暉認(rèn)為,主要存在著兩大關(guān)鍵點(diǎn),第一需要貼近任務(wù)和系統(tǒng)需求,即必須針對(duì)智能駕駛系統(tǒng)應(yīng)用對(duì)感知層的需求來進(jìn)行網(wǎng)絡(luò)設(shè)計(jì),切不可為了使用深度學(xué)習(xí)而選擇深度神經(jīng)網(wǎng)絡(luò);

第二需要考慮到芯片嵌入式平臺(tái)算力受限系統(tǒng),必須因芯設(shè)計(jì),切不可盲目的進(jìn)行網(wǎng)絡(luò)堆砌,導(dǎo)致運(yùn)算量過大,而造成無法部署到芯片上的問題。

從智能駕駛的任務(wù)來看,Level2–Level3系統(tǒng)對(duì)感知提出了更高的要求,例如AEB-Cross需要檢測(cè)車輛側(cè)面狀態(tài),TJA(TrafficJamAssistance)更需要識(shí)別出可通行區(qū)域,即FreeSpace,等等。

針對(duì)車輛側(cè)面檢測(cè),前向啟創(chuàng)重新設(shè)計(jì)了一套FINet網(wǎng)絡(luò),將傳統(tǒng)的2D-BoundingBox擴(kuò)展到了3D-BoundingBox,可以對(duì)車輛的多個(gè)表面進(jìn)行檢測(cè)。

前向啟創(chuàng)針對(duì)車輛側(cè)面檢測(cè)設(shè)計(jì)的FINet網(wǎng)絡(luò)

而針對(duì)FreeSpace任務(wù),前向啟創(chuàng)重新設(shè)計(jì)了的FINet可將此任務(wù)分解為,對(duì)Flat平坦可通行區(qū)域;Step路沿臺(tái)階;以及Obstacle障礙物三大類目標(biāo)進(jìn)行分割。

前向啟創(chuàng)針對(duì)FreeSpace任務(wù),F(xiàn)INet分解為三大類目標(biāo)

深度網(wǎng)絡(luò)優(yōu)化

常見的深度學(xué)習(xí)網(wǎng)絡(luò)都對(duì)主芯片的算力提出了比較高的要求。

常見網(wǎng)絡(luò)在對(duì)720P@30fps圖像進(jìn)行推理時(shí),對(duì)算力的要求

由上圖可看出,大部分網(wǎng)絡(luò)對(duì)算力的要求超過了1Tops,而類似TITDA2x這類低功耗芯片目前達(dá)不到1Tops算力要求。所以在網(wǎng)絡(luò)基礎(chǔ)模型設(shè)計(jì)好后,為了大幅降低模型的GMACS以適應(yīng)算力受限的芯片平臺(tái),就需要針對(duì)芯片進(jìn)行網(wǎng)絡(luò)的細(xì)調(diào)整(FineTuning)及優(yōu)化。

針對(duì)TIASIC的芯片架構(gòu),前向啟創(chuàng)主要采用了兩大方法進(jìn)行網(wǎng)絡(luò)優(yōu)化,第一卷積稀疏化,第二8-BIT量化技術(shù)。

第一,卷積稀疏化方法是通過調(diào)整損失函數(shù),對(duì)權(quán)重小于動(dòng)態(tài)閾值的卷積核中的系數(shù)進(jìn)行歸零處理,再將此稀疏度的張量重新進(jìn)行調(diào)優(yōu)訓(xùn)練,對(duì)已歸零處理后的系數(shù)不再進(jìn)行反向傳播更新,最后以達(dá)到在保證稀疏度的情況下,訓(xùn)練精度沒有明顯的下降。

兩種不同稀疏度的目標(biāo)函數(shù)下,通過調(diào)優(yōu)訓(xùn)練出來的濾波器的核

第二,動(dòng)態(tài)8-BIT量化技術(shù),動(dòng)態(tài)指的是在8-BIT的最大位寬的前提下,盡量高地提高張量的量化精度,即有符號(hào)與否,定標(biāo)值是多少,都隨張量的范圍而進(jìn)行動(dòng)態(tài)調(diào)整。

在完成以上兩步優(yōu)化后,前向啟創(chuàng)的FINet網(wǎng)絡(luò)在精度下降不到1%的情況下,整體提速了近10倍。

芯片級(jí)部署與實(shí)現(xiàn)

針對(duì)智能駕駛應(yīng)用,TI的TDA系列芯片采用了多核異構(gòu)的芯片架構(gòu)來達(dá)到算力與功耗平衡,而其中的子處理器是可配置的,如DSP和EVE等子處理器單元數(shù)可以選擇,以求針對(duì)系統(tǒng)要求,達(dá)到更合適的性價(jià)比。

整體芯片架構(gòu)如圖所示

多核異構(gòu)架構(gòu)的最大優(yōu)點(diǎn)就是能夠?qū)⒉煌愋偷挠?jì)算或控制任務(wù)異核化,TITDA系列芯片的設(shè)計(jì)初衷中,視覺感知的中低層計(jì)算任務(wù)主要被集中到了DSP和EVE這兩類子處理器上:

TITDA系列芯片的設(shè)計(jì)

EVE作為TI針對(duì)智能駕駛應(yīng)用而專門設(shè)計(jì)的向量硬件加速器,在同等功耗下,相比于現(xiàn)有其它智能駕駛芯片,每個(gè)EVE核能夠達(dá)到8倍的計(jì)算性能的提升。

每個(gè)EVE核能夠達(dá)到8倍的計(jì)算性能的提升

針對(duì)深度神經(jīng)網(wǎng)絡(luò)中最耗時(shí)的卷積運(yùn)算部分,在部署階段,前向啟創(chuàng)主要使用了其中的EVE核來進(jìn)行計(jì)算,利用EVE中的SIMD特性,可以將FINet中的卷積運(yùn)算部分提速8倍左右。

完成在TI芯片上的部署后,前向啟創(chuàng)FINet網(wǎng)絡(luò)整體上能夠達(dá)到實(shí)時(shí)感知的系統(tǒng)性能要求。

在TITDA這類成熟的ASIC上,通過網(wǎng)絡(luò)設(shè)計(jì)、網(wǎng)絡(luò)優(yōu)化以及芯片部署這三大步,就能基本實(shí)現(xiàn)深度神經(jīng)網(wǎng)絡(luò)的初步框架。

在后續(xù)的產(chǎn)品化過程中,還需根據(jù)實(shí)際的系統(tǒng)需求,對(duì)這三步進(jìn)行閉環(huán)式的迭代,以求達(dá)到系統(tǒng)性能與算力的最佳平衡。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:智能駕駛感知產(chǎn)品化:基于TI ASIC深度神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)與實(shí)現(xiàn) | GGAI經(jīng)驗(yàn)談

文章出處:【微信號(hào):ilove-ev,微信公眾號(hào):高工智能汽車】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Nanopi深度學(xué)習(xí)之路(1)深度學(xué)習(xí)框架分析

    學(xué)習(xí),也就是現(xiàn)在最流行的深度學(xué)習(xí)領(lǐng)域,關(guān)注論壇的朋友應(yīng)該看到了,開發(fā)板試用活動(dòng)中有【NanoPi K1 Plus試用】的申請(qǐng),介紹中NanopiK1plus的高大上優(yōu)點(diǎn)之一就是“可運(yùn)行
    發(fā)表于 06-04 22:32

    百度深度學(xué)習(xí)研究院科學(xué)家深度講解人工智能

    的研發(fā)經(jīng)驗(yàn)。在過去的工作中,他發(fā)表過論文十余篇,申請(qǐng)中國(guó)專利超過100項(xiàng),其中已經(jīng)授權(quán)的有95項(xiàng)。他曾任職百度深度學(xué)習(xí)研究院,負(fù)責(zé)人臉識(shí)別方向,曾經(jīng)多次帶領(lǐng)團(tuán)隊(duì)在主流的人臉檢測(cè)、人臉識(shí)別競(jìng)賽上取得
    發(fā)表于 07-19 10:01

      華為云深度學(xué)習(xí)服務(wù),讓企業(yè)智能從此不求人

    深度學(xué)習(xí)服務(wù)的發(fā)布,大幅降低了企業(yè)深度學(xué)習(xí)訓(xùn)練的技術(shù)門檻、性能門檻和數(shù)據(jù)量門檻,因此,華為云深度學(xué)習(xí)
    發(fā)表于 08-02 20:44

    硅谷組建團(tuán)隊(duì)、L3產(chǎn)品落地,想法多多的騰訊自動(dòng)駕駛

    `日前有消息顯示,騰訊在領(lǐng)英發(fā)布招聘廣告,表示其在加利福尼亞州帕洛阿爾托的汽車駕駛研發(fā)團(tuán)隊(duì)需要招聘至少九類工程師職位,其中包括移動(dòng)規(guī)劃,傳感器匯合,車輛智能和機(jī)器學(xué)習(xí)等方面。根據(jù)公開信息顯示,這些
    發(fā)表于 11-13 11:33

    人工智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)深度學(xué)習(xí)的關(guān)系

    人工智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)深度學(xué)習(xí)之間,主要有什么關(guān)系?
    發(fā)表于 03-16 11:35

    深度學(xué)習(xí)是什么

    創(chuàng)客們的最酷“玩具”  智能無人機(jī)、自主機(jī)器人、智能攝像機(jī)、自動(dòng)駕駛……今年最令硬件創(chuàng)客們著迷的詞匯,想必就是這些一線“網(wǎng)紅”了。而這些網(wǎng)紅的背后,幾乎都和計(jì)算機(jī)視覺與深度
    發(fā)表于 07-19 06:17

    智能駕駛的狂想與現(xiàn)實(shí)落地 精選資料分享

    編輯導(dǎo)讀:隨著人工智能的技術(shù)發(fā)展,很多領(lǐng)域開始了革命式創(chuàng)新,智能駕駛就是其中的一個(gè)典型代表。本篇文章中作者介紹了智能駕駛的發(fā)展歷程以及行業(yè)現(xiàn)
    發(fā)表于 07-27 07:45

    智能駕駛域控制器的SoC芯片選型

    1、智能駕駛域控制器的SoC芯片選型隨著智能駕駛行業(yè)的發(fā)展,智能駕駛功能日益復(fù)雜,領(lǐng)航高速輔助、
    發(fā)表于 08-11 15:55

    人工智能深度學(xué)習(xí)未來應(yīng)該如何發(fā)展的詳細(xì)概述

    深度學(xué)習(xí)從12、13年甚囂塵上,到如今的塵埃落地,浪潮一再的退去。面對(duì)疲軟的風(fēng)口,養(yǎng)肥的豬,人工智能將何去何從?
    的頭像 發(fā)表于 06-02 10:00 ?4124次閱讀
    人工<b class='flag-5'>智能</b><b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>未來<b class='flag-5'>應(yīng)該</b>如何發(fā)展的詳細(xì)概述

    探討深度學(xué)習(xí)在自動(dòng)駕駛中的應(yīng)用

    深度強(qiáng)化學(xué)習(xí)的理論、自動(dòng)駕駛技術(shù)的現(xiàn)狀以及問題、深度強(qiáng)化學(xué)習(xí)在自動(dòng)駕駛技術(shù)當(dāng)中的應(yīng)用及基于
    的頭像 發(fā)表于 08-18 10:19 ?5188次閱讀

    基于魔視智能先進(jìn)的嵌入式深度學(xué)習(xí)技術(shù)的輔助自動(dòng)駕駛產(chǎn)品正式量產(chǎn)落地

    深度學(xué)習(xí)有效的推動(dòng)了人工智能技術(shù)飛躍,但是算法復(fù)雜性對(duì)于芯片算力的依賴始終困擾著整車產(chǎn)品工程。如何在低成本低功耗的硬件芯片局限下實(shí)現(xiàn)高度智能和實(shí)時(shí)的復(fù)雜神經(jīng)網(wǎng)絡(luò),一直是困擾人工
    的頭像 發(fā)表于 10-18 17:12 ?3499次閱讀

    深度學(xué)習(xí)技術(shù)與自動(dòng)駕駛設(shè)計(jì)的結(jié)合

    在過去的十年里,自動(dòng)駕駛汽車技術(shù)取得了越來越快的進(jìn)步,主要得益于深度學(xué)習(xí)和人工智能領(lǐng)域的進(jìn)步。作者就自動(dòng)駕駛中使用的
    發(fā)表于 10-28 16:07 ?2043次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>技術(shù)與自動(dòng)<b class='flag-5'>駕駛</b>設(shè)計(jì)的結(jié)合

    深度學(xué)習(xí):搜索和推薦中的深度匹配問題

    深度匹配問題,非常solid的綜述,針對(duì)里面的一些方法,尤其是feature-based的深度學(xué)習(xí)方法增加了近期一些相關(guān)paper。推薦系統(tǒng)和搜索
    的頭像 發(fā)表于 11-05 09:47 ?4143次閱讀

    深度學(xué)習(xí)算法在自動(dòng)駕駛規(guī)控中的應(yīng)用解讀

    雖然目前公開的自動(dòng)駕駛規(guī)控算法相關(guān)資料大都是針對(duì)基于規(guī)則的算法的,但筆者打開招聘軟件卻經(jīng)常能看到自動(dòng)駕駛企業(yè)招聘規(guī)控算法工程師時(shí)會(huì)要求候選人懂深度學(xué)
    的頭像 發(fā)表于 11-16 09:57 ?1303次閱讀

    深度學(xué)習(xí)在自動(dòng)駕駛中的關(guān)鍵技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,自動(dòng)駕駛技術(shù)作為其中的重要分支,正逐漸走向成熟。在自動(dòng)駕駛系統(tǒng)中,深度學(xué)習(xí)技術(shù)發(fā)揮著至關(guān)重要的作用。它通過模擬人
    的頭像 發(fā)表于 07-01 11:40 ?832次閱讀