Hot Chips——世界處理器行業(yè)的技術(shù)峰會(huì),ARM、Intel、NVIDIA、微軟等巨頭的舞臺(tái)。今年,一家來自于中國(guó)的深度學(xué)習(xí)創(chuàng)業(yè)公司得到了全世界處理器行業(yè)專家的認(rèn)可,登上了Hot Chips的演講臺(tái),向全世界介紹兩項(xiàng)最新的針對(duì)于深度學(xué)習(xí)的DPU核心體系結(jié)構(gòu)設(shè)計(jì)——針對(duì)于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的Aristotle架構(gòu)和針對(duì)于稀疏深度神經(jīng)網(wǎng)絡(luò)(DNN)與循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的Descartes架構(gòu)。這所公司正是深鑒科技,而深鑒科技及CEO姚頌,也成為了Hot Chips歷史上最年輕的公司與最年輕的主講人。深鑒科技的報(bào)告榮獲本屆Hot Chips的Best Presentation殊榮。
歷史悠久的處理器行業(yè)技術(shù)峰會(huì)Hot Chips已經(jīng)走過了28年。芯片架構(gòu)設(shè)計(jì)領(lǐng)域每年都涌現(xiàn)大量新生代,但其中只有約20款最新的處理器架構(gòu)設(shè)計(jì)能夠在這個(gè)平臺(tái)進(jìn)行展示,這使得該峰會(huì)成為世界芯片巨頭的必爭(zhēng)之地,每年的發(fā)表席位大多被ARM、高通、Intel、AMD等處理器巨頭占據(jù)。Hot Chips會(huì)議每年夏天在美國(guó)加州舉辦,今年會(huì)議地點(diǎn)則選在了位于Cupertino的Flint Center,而該中心之前也長(zhǎng)期用于蘋果公司各項(xiàng)發(fā)布會(huì)。就在今年的峰會(huì)上,微軟首次公開了為Hololens設(shè)計(jì)的HPU處理器;NVIDIA則公開了下一代Tegra系列SoC。
得益于深鑒創(chuàng)始人團(tuán)隊(duì)在深度學(xué)習(xí)硬件加速領(lǐng)域的深厚積累與公司卓越的技術(shù)實(shí)力,深鑒得到各大巨頭公司的一致認(rèn)可。這家Hot Chips史上最年輕的公司,在會(huì)上展示了其核心技術(shù),身為深鑒CEO的姚頌也成為了Hot Chips史上最年輕的主講人。姚頌提到,深度學(xué)習(xí)專用處理平臺(tái)必須適應(yīng)最新的算法,如CNN中卷積核越來越小、LSTM中的矩陣尺寸越來越大。而深鑒之所以選擇FPGA作為其DPU的載體,正是因?yàn)槠湓试S較短的TTM(Time To Market)與架構(gòu)的迭代,同時(shí)能夠提供合適的性能與功耗、較高的片上存儲(chǔ)帶寬。
姚頌在Hot Chips做主題演講
姚頌介紹了深鑒已經(jīng)實(shí)現(xiàn)的一鍵編譯技術(shù)。首先,對(duì)于神經(jīng)網(wǎng)絡(luò)層面進(jìn)行深度壓縮,去除算法連接關(guān)系上的冗余;之后,再進(jìn)行數(shù)據(jù)量化,去除單個(gè)數(shù)值在精度要求上的冗余;最后,根據(jù)深鑒設(shè)計(jì)的Aristotle與Descartes架構(gòu)指令集,當(dāng)對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行編譯,而不進(jìn)行重新訓(xùn)練時(shí),僅需要半分鐘即可完成從算法模型到可執(zhí)行指令的全套編譯流程。
在此次Hot Chips會(huì)議上,姚頌也首次公開了公司所設(shè)計(jì)的兩款深度學(xué)習(xí)專用處理架構(gòu):針對(duì)于CNN的Aristotle架構(gòu),以及針對(duì)于稀疏DNN/RNN-LSTM的Descartes架構(gòu)。
Aristotle架構(gòu)專為基于CNN的深度學(xué)習(xí)應(yīng)用設(shè)計(jì),為小尺寸卷積核優(yōu)化,高效支持1x1,3x3等卷積操作;支持卷積、Pooling、ReLU、Concat、Batch Normalization等多種層,不限制網(wǎng)絡(luò)層數(shù)、規(guī)模;支持R-FCN等多種物體檢測(cè)框架;Aristotle搭載于Zynq 7020 FPGA上,可取得比NVIDIA Tegra K1 GPU好一個(gè)數(shù)量級(jí)的能效比;如果映射到相應(yīng)的芯片工藝上,毫無疑問可以取得進(jìn)一步明顯的能效提升。Aristotle架構(gòu)可以廣泛應(yīng)用于無人機(jī)、安防監(jiān)控、機(jī)器人、自動(dòng)駕駛等圖像相關(guān)的各大領(lǐng)域中。
姚頌介紹深鑒Aristotle架構(gòu)
Descartes架構(gòu)則專為稀疏DNN/RNN-LSTM設(shè)計(jì),支持LSTM中多個(gè)矩陣操作的復(fù)雜調(diào)度,支持各種稀疏率、矩陣尺寸,以及多種非線性函數(shù),搭載與KU系列FPGA,可以實(shí)現(xiàn)比GPU超過一個(gè)數(shù)量級(jí)的能效提升,可以廣泛用于語音識(shí)別、翻譯、OCR等多種應(yīng)用領(lǐng)域。
姚頌介紹Descartes架構(gòu)
會(huì)場(chǎng)之外,深鑒科技創(chuàng)始人之一、首席科學(xué)家韓松也被邀請(qǐng)進(jìn)行Poster展示,深鑒科技團(tuán)隊(duì)也在Poster Session展示了Live Demo供參會(huì)專家體驗(yàn)點(diǎn)評(píng)。深鑒團(tuán)隊(duì)場(chǎng)內(nèi)的報(bào)告與場(chǎng)外展示的呼應(yīng),也成為了本屆Hot Chips的一大亮點(diǎn)。
值得一提的是,姚頌也在會(huì)上首次介紹了基于Aristotle架構(gòu)的深度學(xué)習(xí)處理平臺(tái)“雨燕”,該平臺(tái)將在10月實(shí)現(xiàn)批量供貨?!坝暄唷逼脚_(tái)基于Xilinx Zynq FPGA,支持各類神經(jīng)網(wǎng)絡(luò)、多種物體檢測(cè)框架,并且集成了HOG、KCF等物體追蹤常用模塊,能夠廣泛用于無人機(jī)、機(jī)器人、ADAS等領(lǐng)域。這也代表著深度學(xué)習(xí)專用處理平臺(tái)真正從學(xué)術(shù)走向了市場(chǎng)。世界,向深度學(xué)習(xí)無處不在的時(shí)代,又邁近了一步。
基于Aristotle架構(gòu)的“雨燕”深度學(xué)習(xí)處理平臺(tái)
-
循環(huán)神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
0文章
38瀏覽量
2987 -
深度神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
0文章
61瀏覽量
4546 -
深鑒科技
+關(guān)注
關(guān)注
0文章
36瀏覽量
5496
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論