0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

賽靈思未來競爭的關(guān)鍵點(diǎn):硬件實現(xiàn)軟件算法時對整個算法質(zhì)量的極大提升

Xilinx賽靈思官微 ? 來源:djl ? 作者:賽靈思 ? 2019-07-29 16:46 ? 次閱讀

背景:

快速傅里葉變換(FFT)在雷達(dá)、通信電子對抗等領(lǐng)域有廣泛應(yīng)用。近年來隨著現(xiàn)場可編程門陣列(FPGA)的飛速發(fā)展,與DSP技術(shù)相比,由于其并行信號處理結(jié)構(gòu),使得FPGA能夠很好地適用于高速信號處理系統(tǒng),但是,由于Altera公司研制的FFT IP核,價錢昂貴,不適合大規(guī)模應(yīng)用,在特定領(lǐng)域中,設(shè)計適合于自己領(lǐng)域需要的FFT處理器是較為實際的選擇,下面將關(guān)注一些關(guān)于流水級FFT處理器的一些最新發(fā)展。

SDF FFT Core → FPGA DSP slice:

近期,在IEEE VLSI系統(tǒng)專欄學(xué)報處有一篇12頁的題為“Efficient FPGA Mapping of Pipeline SDF FFT Cores”的新論文即將被發(fā)表(在IEEE Xplore可見)。而在這篇論文中作者就如何將一個SDF(single-path delay feedback單路延遲反饋)FFT核映射到Xilinx的全可編程芯片內(nèi)部的DSP48 slices的可編程邏輯及其他可用的存儲資源上進(jìn)行了深入周密的細(xì)節(jié)性討論。盡管這篇論文主要是針對Virtex-4和Virtex-6系列FPGA進(jìn)行討論的,但是作者也明確指出,由于Xilinx 7系列和UltraScale/UltraScale+ 系列FPGA與Virtex-6使用相同的slice 架構(gòu),所以這種映射其實很容易被推廣的。

在論文中,作者詳細(xì)闡述了Xilinx的產(chǎn)品,主要是從Virtex-4 FPGA開始到Xilinx后來的所有全可編程芯片等多代產(chǎn)品內(nèi)部的DSP48 slices的一個發(fā)展過程:首先,Virtex-4 FPGA系列包含一18X18bit乘法器和48bit累加器的XtremeDSP(DSP48);之后的Virtex-6系列FPGA加入了25x18bit乘法器和48bit累加器的DSP48 slices ;較新的7系列FPGA和Zynq-7000系列SoC則內(nèi)嵌了25x18bit乘法器和48bit累加器的DSP48 slices;而最強(qiáng)的UltraScale/UltraScale+系列FPGA則包括了27x18bit乘法器和48bit加法器的DSP48E2。除此之外,在Xilinx每一代FPGA的DSP48 slices的發(fā)展中都有很多額外的改進(jìn),比如時鐘率具有較穩(wěn)定的提高,也正是這么多代產(chǎn)品的不斷迭代,才使得現(xiàn)在的DSP48E2 功能更加強(qiáng)大。下圖是論文中作者提到的關(guān)于DSP48E2 功能實現(xiàn)的細(xì)節(jié)。

賽靈思未來競爭的關(guān)鍵點(diǎn):硬件實現(xiàn)軟件算法時對整個算法質(zhì)量的極大提升

圖1 DSP48E2 功能細(xì)節(jié)

同時,在這片IEEE的論文中還討論了如何將此FFT核蝶形轉(zhuǎn)換到較少的LUT單元中,而如何有效轉(zhuǎn)換關(guān)系到是否可以實現(xiàn)DSP48 preadders的蝶形地址,在實現(xiàn)過程中,通過將有效的數(shù)據(jù)映射和轉(zhuǎn)換因子存儲到BRAM 及分布式存儲資源中,有效地完成 radix-2k算法轉(zhuǎn)換因子的共享,此外采用重新定時和流水的方式來縮短實現(xiàn)時間。

雖然這篇博客展示的任何技術(shù)都是來自于論文中,讀者也可以從IEEE論文網(wǎng)站得到,但是還是會給出論文中的一些結(jié)論(以便可以提起您去檢索并閱讀全文的興趣):“報告的實現(xiàn)結(jié)果表明,相比于之前的有關(guān)實現(xiàn)而言,通過利用Virtex-4和Virtex-6內(nèi)部的DSP48實現(xiàn)一個FFT核,可以使其性能分別提高350%到400%,同時,還可以獲得一個更高的混合時鐘頻率,并且整個實現(xiàn)過程只需要更少的存儲資源。這也正好如以前發(fā)表過的最好的報告結(jié)果一樣,都是使用完全一樣的架構(gòu),使用同Virtex-4完全一樣的算法,也體現(xiàn)出這種轉(zhuǎn)換的優(yōu)勢十分明顯,所以,為提高性能,可以嘗試將架構(gòu)映射到FPGA硬件結(jié)構(gòu)中來實現(xiàn)。

總結(jié):

在目前的市場中,尤其是一些互聯(lián)網(wǎng)公司,都開始利用FPGA做硬件加速的實現(xiàn),不僅是因為FPGA的可用性,更主要的是各大公司都看中了硬件實現(xiàn)軟件算法時對整個算法質(zhì)量的極大提升,這類市場也恰好是我們Xilinx未來競爭的關(guān)鍵點(diǎn)所在。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4629

    瀏覽量

    93234
  • 硬件
    +關(guān)注

    關(guān)注

    11

    文章

    3380

    瀏覽量

    66401
  • 軟件
    +關(guān)注

    關(guān)注

    69

    文章

    5007

    瀏覽量

    87980
收藏 人收藏

    評論

    相關(guān)推薦

    采用FPGA實現(xiàn)DisplayPort詳細(xì)教程【內(nèi)部資料】

    ) 的靈活可編程 VESADisplayPort v.1.1a 解決方案。該 IP 可隨時提供給的客戶,但在用戶展開設(shè)計之前,建議先了解與該標(biāo)準(zhǔn)的部分關(guān)鍵功能有關(guān)的其它背景信息,
    發(fā)表于 03-01 11:10

    FPGA設(shè)計之浮點(diǎn)DSP算法實現(xiàn)工程師作品】

    FPGA設(shè)計之浮點(diǎn)DSP算法實現(xiàn),DSP算法是很多工程師在設(shè)計過程中都會遇到的問題,本文將從FPGA設(shè)計的角度來講解浮點(diǎn)DSP算法實現(xiàn)。F
    發(fā)表于 03-01 15:23

    公司亞太區(qū)銷售與市場副總裁給XILINX客戶的信

    推向一個又一個新的高度。與此同時,還將一如既往地不斷為您提供最好的產(chǎn)品、技術(shù)和支持,期待著在激烈的市場競爭中與您密切合作,借助
    發(fā)表于 03-22 15:17

    的開發(fā)環(huán)境ISE軟件下載地址

    剛開始學(xué)的FPGA,求他的ISE軟件下載地址,我在網(wǎng)上沒搜到。謝謝了
    發(fā)表于 08-02 09:52

    【AD新聞】新CEO訪華繪藍(lán)圖,7nm ACAP平臺要讓CPU/GPU難企及

    系列,為用戶從端點(diǎn)到邊緣再到云端多種不同技術(shù)的快速創(chuàng)新提供支持。 Peng的戰(zhàn)略包括三大要點(diǎn): “數(shù)據(jù)中心加速”提為發(fā)展新重點(diǎn): 正在加強(qiáng)與關(guān)鍵數(shù)據(jù)中心客戶、生態(tài)系統(tǒng)合作伙
    發(fā)表于 03-23 14:31

    【PYNQ-Z2申請】基于PYNQ-Z2平臺的圖像實時力學(xué)測量

    PYNQ-Z2平臺完善該項目的開源設(shè)計,并進(jìn)一步提升性能。項目計劃①根據(jù)文檔,對賽PYNQ-Z2快速入門②通過學(xué)習(xí)
    發(fā)表于 01-09 14:49

    基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)設(shè)計

    計算集群。因此,亟需一種能夠加速算法又不會顯著增加功耗的處理平臺。在這樣的背景下,F(xiàn)PGA 似乎是一種理想的選擇,其固有特性有助于在低功耗條件下輕松啟動眾多并行過程。讓我們來詳細(xì)了解一下如何在
    發(fā)表于 06-19 07:24

    為什么說已經(jīng)遠(yuǎn)遠(yuǎn)領(lǐng)先于Altera?

    Altera和20年來都在FPGA這個窄眾市場激烈的競爭者,然而Peter Larson基于對兩個公司現(xiàn)金流折現(xiàn)法的研究表明,
    發(fā)表于 09-02 06:04

    推出ISE 12軟件設(shè)計套件

    推出ISE 12軟件設(shè)計套件  全球可編程平臺領(lǐng)導(dǎo)廠商
    發(fā)表于 05-05 09:49 ?755次閱讀

    FPGA設(shè)計流程看懂FPGA設(shè)計

    系統(tǒng) 汽車級 Zynq UltraScale+ MPSoC 系列面世 不僅服務(wù)硬件工程師,2018年如何布局AI? 2017人工智能熱詞 TOP10,第一竟然不是AI
    發(fā)表于 02-20 20:32 ?1.6w次閱讀
    從<b class='flag-5'>賽</b><b class='flag-5'>靈</b><b class='flag-5'>思</b>FPGA設(shè)計流程看懂FPGA設(shè)計

    不僅服務(wù)硬件工程師_2018年如何布局AI

    系統(tǒng) 汽車級 Zynq UltraScale+ MPSoC 系列面世 不僅服務(wù)硬件工程師,2018年如何布局AI? 2017人工智能熱詞 TOP10,第一竟然不是AI
    發(fā)表于 02-20 20:35 ?1300次閱讀

    推出高級設(shè)計工具,能大幅簡化無線電算法的設(shè)計生產(chǎn)力

    推出業(yè)界領(lǐng)先的高級設(shè)計工具System Generator for DSP 2015.3版,該工具可讓系統(tǒng)工程師運(yùn)用
    發(fā)表于 08-20 10:13 ?935次閱讀

    關(guān)于FPGA簡述

    還有最近 最近推出的又一力作 Module Composer,極大地提高了算法仿真速度,并降低了在FPGA上
    的頭像 發(fā)表于 07-27 10:57 ?6129次閱讀

    推出首個基于機(jī)器學(xué)習(xí)優(yōu)化算法 FPGA EDA 工具套件

    的 Vivado HLx 版本相比,Vivado ML 版將復(fù)雜設(shè)計的編譯時間縮短了 5 倍,同時還提供了突破性的平均達(dá) 10% 的結(jié)果質(zhì)量( QoR )提升
    的頭像 發(fā)表于 06-24 11:42 ?2090次閱讀

    Vivado ML版優(yōu)化應(yīng)用設(shè)計

    近日宣布推出 Vivado ML 版,這是業(yè)內(nèi)首個基于機(jī)器學(xué)習(xí)(ML )優(yōu)化算法以及先進(jìn)的面向團(tuán)隊協(xié)作的設(shè)計流程打造的 FPGA EDA 工具套件,可以顯著節(jié)省設(shè)計時間與成本,與
    的頭像 發(fā)表于 07-02 16:40 ?2810次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>靈</b><b class='flag-5'>思</b>Vivado ML版優(yōu)化應(yīng)用設(shè)計