圖像識別和GPU相輔相成,特別是在使用深度神經(jīng)網(wǎng)絡(luò)(DNN)時。基于GPU的DNN在圖像識別領(lǐng)域的優(yōu)勢已經(jīng)在過去幾年在ImageNet大規(guī)模視覺識別挑戰(zhàn)(ILSVRC)中的成功得到了明確的證明,DNN最近實現(xiàn)了與訓(xùn)練有素的人類相媲美的分類準確性,如圖1顯示。新的低功耗圖像識別挑戰(zhàn)(LPIRC)突出了移動和嵌入式設(shè)備上圖像識別的重要性。
具有卷積層的DNN是具有生物啟發(fā)性的人工神經(jīng)網(wǎng)絡(luò)。這些網(wǎng)絡(luò)可能有五層或更多層,每層都有許多神經(jīng)元。類似于突觸的鏈接連接層,將信息轉(zhuǎn)發(fā)到下一層。培訓(xùn)過程調(diào)整鏈接上的權(quán)重,提高網(wǎng)絡(luò)對呈現(xiàn)給它的信息進行分類的能力。用于訓(xùn)練DNN的數(shù)據(jù)越多,其分類性能就越好。這種大數(shù)據(jù)需求導(dǎo)致了GPU的大量使用,因為GPU在高度并行計算(如深度學(xué)習(xí)中使用的那些計算)上的高吞吐量設(shè)計。
ImageNet是一個很好的圖像資源,它擁有一個根據(jù)描述性名詞層次組織的大型圖像數(shù)據(jù)庫。ImageNet每年都會舉辦ILSVRC,為此參賽者開發(fā)了用于準確識別圖像中物體的算法。ImageNet提供了來自1000個不同對象類別的超過120萬張圖像的大型圖像集,用于訓(xùn)練識別算法。學(xué)術(shù)界和工業(yè)界的參與者表現(xiàn)強勁,近年來與Google,斯坦福大學(xué),加州大學(xué)伯克利分校和Adobe等競爭對手表現(xiàn)強勁。
低功耗挑戰(zhàn)
為了促進低功耗設(shè)備的圖像識別,普渡大學(xué)電氣和計算機工程副教授Yung-Hsiang Lu和UNC Chapel Hill計算機科學(xué)助理教授Alex Berg正在組織低功耗圖像識別挑戰(zhàn)(LPIRC),這是一場專注于識別圖像識別和節(jié)能最佳技術(shù)的競賽。LPIRC的注冊現(xiàn)已開放。
實現(xiàn)高性能同時保持低功耗可能具有挑戰(zhàn)性,因為這兩個參數(shù)經(jīng)常一起增加。去年,NVIDIA發(fā)布了Jetson TK1開發(fā)套件,這是一款非常適合圖像處理和計算機視覺應(yīng)用的低功耗GPU加速計算平臺。Jetson TK1的低功耗要求和圖像處理能力將使其成為LPIRC競爭對手的熱門平臺。
用于LPIRC的示例性任務(wù)包括在圖像中定位和分類對象,包括識別多個對象。許多ILSVRC團隊在年度ImageNet競賽中使用CNN,他們很可能是為LPIRC部署的機器學(xué)習(xí)體系結(jié)構(gòu)之一。訪問LPIRC網(wǎng)站了解有關(guān)重要日期和競賽任務(wù)的信息。
免費Jetson TK1參與團隊開發(fā)工具包
Jetson TK1將成為本次比賽團隊的一項重要資產(chǎn),峰值功率需求低于12.5瓦。Jetson TK1支持CUDA,cuDNN,OpenCV和流行的深度學(xué)習(xí)框架,如Caffe和Torch。Jetson本質(zhì)上是一個微型超級計算機,可以直接與顯示器,鍵盤和鼠標或通過ssh連接使用,它預(yù)裝了Ubuntu Linux,因此入門很容易。
作為LPIRC的贊助商,NVIDIA為參賽車隊提供免費的Jetson TK1開發(fā)工具包,每位獲勝者將獲得NVIDIA GPU。如果您的團隊想要為LPIRC使用Jetson TK1,請填寫此申請表。NVIDIA將審查提案并為選定的申請人提供TK1 DevKits。
我的Jetson TK1深度學(xué)習(xí)設(shè)置
將訓(xùn)練有素的網(wǎng)絡(luò)移植到Jetson TK1并進行分類很容易。圖1顯示了我的設(shè)置。對于額外的磁盤空間,我添加了一個外部硬盤驅(qū)動器并使用SATA接口連接它。我使用4端口USB 3.0集線器通過鼠標和鍵盤以及更多硬盤直接連接。
運行Caffe網(wǎng)絡(luò)演示的我的Jetson TK1設(shè)置。
我在我的Jetson TK1上制作了Caffe,所以我可以將它用于分類。Caffe的網(wǎng)絡(luò)演示例子是一個簡單而簡單的測試方法。Web演示在Jetson TK1上運行Web服務(wù)器,并且需要包含預(yù)訓(xùn)練網(wǎng)絡(luò)的BVLC參考CaffeNet輔助數(shù)據(jù)。一旦建立并運行,使用Jetson TK1的IP地址端口500(例如192.168.1.5:5000)從本地網(wǎng)絡(luò)上的任何設(shè)備訪問演示。您可以使用以下-g標志以GPU加速運行Web演示:
python examples / web_demo / app.py -g
如下表所示,我使用該演示對具有和不具有GPU加速功能的五個圖像進行分類,以便使用Tegra K1的GPU與其CPU進行分類,從而加快分類速度。
圖像分類GPU(毫秒)無GPU(毫秒)加速(x)斗雞眼貓131655534.2在海上運送101055715.5谷倉135157914.3小狗156856773.6海盜船138556514.1平均132656494.3今天注冊低功耗圖像識別挑戰(zhàn)!
LPIRC的注冊現(xiàn)已開放。比賽將于2015年6月7日在設(shè)計自動化大會上舉行,所以現(xiàn)在就組建一個團隊,并為您的團隊填寫免費的NVIDIA Jetson TK1開發(fā)板的應(yīng)用程序。
-
gpu
+關(guān)注
關(guān)注
28文章
4761瀏覽量
129136 -
圖像識別
+關(guān)注
關(guān)注
9文章
521瀏覽量
38308
發(fā)布評論請先 登錄
相關(guān)推薦
評論