近日,浪潮宣布為可重構(gòu)AI計算發(fā)展計劃參與者提供最新FPGA加速卡支持。參與該計劃的高校將FPGA開源AI框架TF2應(yīng)用于AI科研或應(yīng)用并取得創(chuàng)新成果,并承諾將優(yōu)化后代碼反饋回TF2開源社區(qū),即可獲贈最新FPGA加速卡。同時,參與該計劃的商業(yè)用戶也可獲得較大程度的FPGA加速卡購買優(yōu)惠。該計劃可在TF2開源社區(qū)(網(wǎng)址:https://github.com/TF2-Engine/TF2)進(jìn)行申請。目前南開大學(xué)等知名高校已加入該計劃。
FPGA技術(shù)具有可定制性、低延遲和高性能功耗比等優(yōu)勢,已成為諸多AI用戶部署推理應(yīng)用的選擇。但FPGA技術(shù)進(jìn)入到大規(guī)模AI業(yè)務(wù)部署仍舊存在軟件編寫門檻高、性能優(yōu)化受限、功耗難以控制等諸多挑戰(zhàn)。為了應(yīng)對這些挑戰(zhàn),浪潮推出了開源的TF2框架。
TF2是全球首個完整方案的FPGA高效AI計算開源框架,可對模型進(jìn)行壓縮、裁剪、量化等優(yōu)化轉(zhuǎn)換以減少模型計算量,將模型文件自動轉(zhuǎn)化為FPGA目標(biāo)運行文件,降低FPGA的AI軟件實現(xiàn)門檻,通過創(chuàng)新的DNN移位計算技術(shù)大幅提升FPGA做推理計算的性能,并有效降低其實際運行功耗,幫助用戶快速實現(xiàn)FPGA線上推理。在浪潮F10A FPGA卡上采用FaceNet模型對TF2進(jìn)行的測試(BatchSize=1)表明,運行TF2后單張圖片的計算耗時為0.612ms,提速12.8倍。目前,TF2開源社區(qū)已吸引第四范式、快手、上海大學(xué)、華大智造、遠(yuǎn)鑒科技、睿視智覺、華展匯元等多家領(lǐng)先公司或機(jī)構(gòu)加入。
TF2計算加速流程
為了推動TF2社區(qū)建設(shè),浪潮推出了可重構(gòu)AI計算發(fā)展計劃,為參與者提供F10A、F37X等最新FPGA加速卡支持,鼓勵參與者將創(chuàng)新性成果反饋至社區(qū),共同促進(jìn)FPGA技術(shù)的開源開放合作發(fā)展,降低高性能AI計算技術(shù)門檻,加速AI應(yīng)用落地。浪潮F10A是目前業(yè)界支持OpenCL的最高性能密度的FPGA加速卡,每瓦特性能達(dá)到42GFlops,已實現(xiàn)大規(guī)模應(yīng)用部署,適用于數(shù)據(jù)中心AI推理、邊緣高密計算及桌面端應(yīng)用加速等多種計算環(huán)境;浪潮F37X是全球首款集成HBM2的FPGA加速卡,可在75W典型功耗條件下,提供28.1TOPS INT8計算性能。此外,浪潮還將提供針對性的技術(shù)培訓(xùn)和服務(wù)支持,并定期舉行開發(fā)者會議和線上公開課,分享最新技術(shù)進(jìn)展和經(jīng)驗成果。
浪潮AI&HPC總經(jīng)理劉軍表示:“視覺、語音識別以及文本、語義理解等人工智能技術(shù)正在與各行業(yè)融合,以FPGA為代表的可重構(gòu)計算將在各類線上推理場景中得到更廣泛的應(yīng)用。浪潮希望通過可重構(gòu)AI計算發(fā)展計劃促進(jìn)TF2開源社區(qū)發(fā)展,同時增進(jìn)開發(fā)者對最新FPGA計算加速技術(shù)的熟悉和了解,最大化釋放FPGA的計算潛力,加速產(chǎn)業(yè)AI化進(jìn)程?!?/p>
浪潮是人工智能計算的領(lǐng)導(dǎo)品牌,AI服務(wù)器中國市場份額保持50%以上。并與人工智能領(lǐng)先科技公司保持在系統(tǒng)與應(yīng)用方面的深入緊密合作,幫助AI客戶在語音、語義、圖像、視頻、搜索、網(wǎng)絡(luò)等方面取得數(shù)量級的應(yīng)用性能提升。
-
FPGA
+關(guān)注
關(guān)注
1629文章
21748瀏覽量
603909 -
浪潮
+關(guān)注
關(guān)注
1文章
462瀏覽量
23880 -
AI
+關(guān)注
關(guān)注
87文章
30998瀏覽量
269304
發(fā)布評論請先 登錄
相關(guān)推薦
評論