啟動(dòng)人工智能應(yīng)用從來(lái)沒(méi)有像現(xiàn)在這樣容易!受益于像Xilinx Zynq UltraScale+ MPSoC 這樣的FPGA,AI現(xiàn)在也可以離線使用或在邊緣部署、使用。瑞蘇盈科核心板模塊結(jié)合Vitis AI開(kāi)發(fā)工具給用戶提供了便利工具,可用于開(kāi)發(fā)和部署用于實(shí)時(shí)推理的機(jī)器學(xué)習(xí)應(yīng)用,因此將AI集成到應(yīng)用中變得輕而易舉。圖像檢測(cè)或分類、模式或語(yǔ)音識(shí)別推動(dòng)了制造業(yè)、醫(yī)療、汽車和金融服務(wù)等產(chǎn)業(yè)的升級(jí)。
快速開(kāi)啟基于AI的FPGA應(yīng)用
ENCLUSTRA
人工智能正在占據(jù)越來(lái)越多的應(yīng)用和生活場(chǎng)景,例如圖像檢測(cè)和分類,翻譯和推薦系統(tǒng)等等?;跈C(jī)器學(xué)習(xí)技術(shù)的應(yīng)用數(shù)量龐大且還在不斷增長(zhǎng)。采用瑞蘇盈科結(jié)合FPGA和ARM處理器的核心板模塊,在離線和邊緣使用AI前所未有的容易。
人工智能(AI)歷史悠久,自1955年便被公認(rèn)為一門(mén)學(xué)科。人工智能是計(jì)算機(jī)模仿人類智能、從經(jīng)驗(yàn)中學(xué)習(xí)、適應(yīng)新信息并執(zhí)行類似人類活動(dòng)的能力。人工智能的應(yīng)用包括專家系統(tǒng)、自然語(yǔ)言處理(NLP)、語(yǔ)音識(shí)別和機(jī)器視覺(jué)。
AI的復(fù)興
ENCLUSTRA
在經(jīng)歷了幾波樂(lè)觀和失望之后,人們對(duì)人工智能產(chǎn)生了新的興趣,而且越來(lái)越感興趣。在過(guò)去15年左右的時(shí)間里,成千上萬(wàn)的人工智能初創(chuàng)公司成立了,而且速度在不斷增長(zhǎng)。這背后有幾個(gè)驅(qū)動(dòng)因素:可能最重要的一個(gè)是現(xiàn)在可以以承擔(dān)得起的價(jià)格獲得巨大的計(jì)算能力。不僅硬件更快,而且現(xiàn)在每個(gè)人都可以訪問(wèn)云中的超級(jí)計(jì)算機(jī)。這使得運(yùn)行人工智能所需的硬件平臺(tái)變得大眾化,使得初創(chuàng)企業(yè)得以大量涌現(xiàn)。
圖1:一種具有2個(gè)隱含層的前饋人工神經(jīng)網(wǎng)絡(luò)的簡(jiǎn)化視圖
ENCLUSTRA
人工神經(jīng)網(wǎng)絡(luò)(圖1)現(xiàn)在擴(kuò)展到幾十到幾百個(gè)隱藏層節(jié)點(diǎn)(圖2)。即使是有10000個(gè)隱藏層的網(wǎng)絡(luò)也已經(jīng)實(shí)現(xiàn)了。這種進(jìn)化正在增加神經(jīng)網(wǎng)絡(luò)的抽象能力,并使新的應(yīng)用成為可能。如今,神經(jīng)網(wǎng)絡(luò)可以在數(shù)萬(wàn)個(gè)CPU或GPU核上進(jìn)行訓(xùn)練,大大加快了開(kāi)發(fā)廣義學(xué)習(xí)模型的過(guò)程。
圖2:ImageNet識(shí)別挑戰(zhàn)獲勝者展示了在新的神經(jīng)網(wǎng)絡(luò)架構(gòu)中不斷增加的隱藏層
ENCLUSTRA
人們對(duì)人工智能興趣增加的另一個(gè)原因是近年來(lái)機(jī)器學(xué)習(xí)方面的突破性進(jìn)展。這有助于吸引科技投資和初創(chuàng)企業(yè)的興趣,進(jìn)一步加速人工智能的發(fā)展和完善。
機(jī)器如何學(xué)習(xí)
ENCLUSTRA
人工神經(jīng)網(wǎng)絡(luò)是一種受人腦啟發(fā)的計(jì)算模型。它由一個(gè)簡(jiǎn)單的處理單元相互連接的網(wǎng)絡(luò)組成,這些網(wǎng)絡(luò)可以通過(guò)修改它們的連接來(lái)學(xué)習(xí)經(jīng)驗(yàn)(圖1)。所謂的深度神經(jīng)網(wǎng)絡(luò)(DNN -具有許多隱藏層的神經(jīng)網(wǎng)絡(luò))目前為許多大型計(jì)算問(wèn)題提供了最佳解決方案。
目前應(yīng)用最廣泛的深度學(xué)習(xí)系統(tǒng)是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNNs)。這些系統(tǒng)使用前饋的人工神經(jīng)元網(wǎng)絡(luò)將輸入特征映射到輸出,他們使用反向饋入系統(tǒng)進(jìn)行學(xué)習(xí)(即訓(xùn)練),并產(chǎn)生一組權(quán)重來(lái)校準(zhǔn)CNN(反向傳播,圖3)。
圖片圖3:神經(jīng)網(wǎng)絡(luò)需要經(jīng)過(guò)訓(xùn)練來(lái)學(xué)習(xí)如何解決問(wèn)題或挑戰(zhàn)
ENCLUSTRA
機(jī)器學(xué)習(xí)中計(jì)算強(qiáng)度最大的過(guò)程是訓(xùn)練神經(jīng)網(wǎng)絡(luò)。對(duì)于一個(gè)最先進(jìn)的網(wǎng)絡(luò)來(lái)說(shuō),它可能需要數(shù)天到數(shù)周的時(shí)間,需要數(shù)十億的浮點(diǎn)計(jì)算和大量的訓(xùn)練數(shù)據(jù)(GByte到數(shù)百GByte),直到網(wǎng)絡(luò)達(dá)到所需的精度。幸運(yùn)的是,這個(gè)步驟在大多數(shù)情況下都不需要時(shí)間限制,并且可以轉(zhuǎn)移到云上。
當(dāng)網(wǎng)絡(luò)接受訓(xùn)練時(shí),它可以被輸入一個(gè)新的、未標(biāo)記的數(shù)據(jù)集,并根據(jù)它之前學(xué)習(xí)的數(shù)據(jù)對(duì)數(shù)據(jù)進(jìn)行分類。這一步稱為推斷,是開(kāi)發(fā)應(yīng)用的實(shí)際目標(biāo)。
告訴我你看到了什么
ENCLUSTRA
輸入的分類可以在云中進(jìn)行,也可以在邊緣(大部分是離線)進(jìn)行。雖然通過(guò)神經(jīng)網(wǎng)絡(luò)處理數(shù)據(jù)通常需要專用加速器(FPGA、GPU、DSP或ASIC),但額外的任務(wù)最好由CPU處理,CPU可以用傳統(tǒng)的編程語(yǔ)言編程。這就是帶有集成CPU(所謂的片上系統(tǒng)(SoC))的FPGA的優(yōu)勢(shì)所在,尤其是在邊緣。SoC將推理加速器(FPGA陣列)和CPU組合在一塊芯片中。CPU運(yùn)行控制算法和數(shù)據(jù)流管理。同時(shí),與基于GPU或ASIC的解決方案相比,F(xiàn)PGA提供了許多優(yōu)勢(shì),其中包括易于集成多個(gè)接口和傳感器,以及適應(yīng)新神經(jīng)網(wǎng)絡(luò)架構(gòu)的靈活性(圖4)。
圖4:人工智能推理應(yīng)用的不同技術(shù)的比較
ENCLUSTRA
FPGA固有的可重構(gòu)性也使其能夠利用不斷演化的神經(jīng)網(wǎng)絡(luò)拓?fù)洹⒏碌膫鞲衅黝愋秃团渲?,以及更新的軟?a target="_blank">算法。使用SoC可以在需要時(shí)保證低而確定的延遲,例如,用于實(shí)時(shí)對(duì)象檢測(cè)。同時(shí),SoC也非常節(jié)能。從FPGA中獲得最佳性能的主要挑戰(zhàn)是在不失去精度的情況下將浮點(diǎn)模型有效地映射到定點(diǎn)FPGA實(shí)現(xiàn)(圖5),這就是供應(yīng)商工具的作用所在。
圖5:將浮點(diǎn)模型有效映射到定點(diǎn)FPGA實(shí)現(xiàn)的過(guò)程稱為壓縮
選擇合適的工具
ENCLUSTRA
現(xiàn)在有很多工具可以幫助我們降低實(shí)現(xiàn)第一個(gè)AI項(xiàng)目的門(mén)檻。例如,VitisAI開(kāi)發(fā)工具為用戶提供了在FPGA上開(kāi)發(fā)和部署用于實(shí)時(shí)推理的機(jī)器學(xué)習(xí)應(yīng)用程序的工具。它們支持許多常見(jiàn)的機(jī)器學(xué)習(xí)框架,如Caffe和TensorFlow,PyTorch支持也將很快推出。它們使最先進(jìn)的神經(jīng)網(wǎng)絡(luò)能夠有效適應(yīng)FPGA,用于嵌入式人工智能應(yīng)用(圖5)。
ENCLUSTRA
結(jié)合標(biāo)準(zhǔn)的核心板模塊(SoM),如瑞蘇盈科的火星XU3(圖6)(基于Xilinx Zynq UltraScale+ MPSoC),插入火星ST3底板,人工智能應(yīng)用可以比以往更快地實(shí)現(xiàn)(圖7)。
圖7:已被業(yè)界證實(shí)的人工智能應(yīng)用解決方案,基于Xilinx Zynq UltraScale+ MPSoC
ENCLUSTRA
為了展示這種組合的性能和快速上市能力,瑞蘇盈科在短短幾天內(nèi)開(kāi)發(fā)了一個(gè)基于人工智能的圖像識(shí)別系統(tǒng)。這些圖像是用一個(gè)連接到火星ST3底板的標(biāo)準(zhǔn)USB攝像頭拍攝的。如需更高的性能,可使用底板上的MIPI接口。
該神經(jīng)網(wǎng)絡(luò)以低延遲的方式對(duì)圖像進(jìn)行分類、在火星XU3核心板模塊上運(yùn)行。該系統(tǒng)支持流行的神經(jīng)網(wǎng)絡(luò)如ResNet-50和DenseNet,兩者分別用于圖像分類和實(shí)時(shí)人臉檢測(cè)。
單個(gè)FPGA模塊不僅可以運(yùn)行神經(jīng)網(wǎng)絡(luò)推理,還可以并行處理許多其他任務(wù),如與主機(jī)PC和其他外圍設(shè)備通信。而且,同時(shí)控制各種高動(dòng)態(tài)驅(qū)動(dòng)器是FPGA技術(shù)發(fā)揮其優(yōu)勢(shì)的地方。例如,添加瑞蘇盈科通用驅(qū)動(dòng)控制器IP核來(lái)控制無(wú)刷直流電機(jī)或步進(jìn)電機(jī)將是輕而易舉的事。在邊緣利用AI的力量從未如此容易,所以,即刻開(kāi)啟您的項(xiàng)目吧!
-
FPGA
+關(guān)注
關(guān)注
1630文章
21782瀏覽量
604982 -
模塊
+關(guān)注
關(guān)注
7文章
2730瀏覽量
47637 -
AI
+關(guān)注
關(guān)注
87文章
31395瀏覽量
269785 -
人工智能
+關(guān)注
關(guān)注
1793文章
47588瀏覽量
239465
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論