0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度解析FPGA時序的進(jìn)位鏈

454398 ? 來源: 科學(xué)計算 technomania ? 作者:貓叔 ? 2020-11-16 16:35 ? 次閱讀

FPGA中我們寫的最大的邏輯是什么?相信對大部分朋友來說應(yīng)該是計數(shù)器,從最初板卡的測試時我們會閃爍LED,到復(fù)雜的AXI總線中產(chǎn)生地址或者last等信號,都會用到計數(shù)器,使用計數(shù)器那必然會用到進(jìn)位鏈。

可能很多剛開始接觸FPGA的同學(xué)沒聽過進(jìn)位鏈,也就是Carry Chain,我們這里再回顧一下。FPGA的三個主要資源為:

1. 最低邏輯單元

可配置邏輯單元(CLB)

存儲單元

運(yùn)算單元(DSP48)

2. 一流的I / O資源

3. 布線資源

其中,CLB在FPGA中最豐富,在7系列的FPGA中,一個CLB中有兩個Slice,Slice中包含4個LUT6、3個數(shù)據(jù)選擇器MUX,兩個獨(dú)立進(jìn)位鏈(Carry4,Ultrascale是CARRY8)和8個主軸。

首先,我們來看下Carry Chain的結(jié)構(gòu)原理,其輸入輸出接口如下:

其中,

CI是上一個CARRY4的進(jìn)位輸出,位寬為1;

CYINT是進(jìn)位的初始化值,位寬為1;

DI是數(shù)據(jù)的輸入(兩個加數(shù)的任意一個),位寬為4;

SI是兩個加數(shù)的異或,位寬為4;

O是加法結(jié)果輸出,位寬為4;

CO是進(jìn)位輸出,位寬為4;(為什么進(jìn)位輸出是4bit?后面有解釋)

Carry4的內(nèi)部結(jié)構(gòu)如下圖所示:

這里我們要先解釋一下FPGA中利用卡里鏈(Carry Chain)實(shí)現(xiàn)加法的原理,比如兩個加數(shù)分別為a = 4'b1000和b=4'b1100,其結(jié)果應(yīng)該是8+12=20。

a = 4'b1000;
b = 4'b1100;

S = a ^ b = 4'b0100;
D = b = 4'b1100;          //D取a也可以
CIN = 0;                  //沒有上一級的進(jìn)位輸入
CYINIT = 0;               //初始值為0
// 下面為CARRY4的計算過程,具體的算法跟上圖中過程一樣
S0 = 0;                  //S的第0位
O0 = S0 ^ 0 = 0 ^ 0 = 0;
CO0 = DI0 = 0;            //上圖中的MUXCY,S0為0時,選擇1,也就是DI0,S0為1是選擇2
S1 = 0;
O1 = S1 ^ CO0 = 0 ^ 0 = 0;
CO1 = DI1 = 0;
S2 = 1;
O2 = S2 ^ CO1 = 0 ^ 1 = 1;
CO2 = CO1 = 0;
S3 = 0;
O3 = S3 ^ CO2 = 0 ^ 0 = 0;
CO3 = DI3 = 1;

加法最終的輸出結(jié)果為:{CO3,O3,O2,O1,O0} = 5'b10100 =20。進(jìn)位輸出在CARRY4的內(nèi)部也使用到了,因此有4個位的進(jìn)位輸出CO,但輸出給下一級的只是CO [3]。

再來看完下面的例子就更清晰了。Example的代碼如下:

module top(

 input clk,
 input [7:0] din_a,
 input [7:0] din_b,
 output reg[7:0] dout
    );

 always @ ( posedge clk )
 begin
    dout <= din_a + din_b;
 end  
endmodule

綜合之后的電路如下:

在本程序中,加數(shù)為din_a和din_b,圖中

1 表示CARRY4的進(jìn)位輸出到下一級的進(jìn)入輸入;

2 表示輸入的一個加數(shù)din_a(換成din_b也是可以的);

3 表示第二級輸入的DI端口,因?yàn)榈诙塁ARRY是通過第一級的進(jìn)位輸出進(jìn)行累加,因此該接口為0;

4 表示輸入兩個加數(shù)的異或結(jié)果。

可以拋光,當(dāng)進(jìn)行兩個兩個bit的數(shù)據(jù)進(jìn)行加法操作時,會使用兩個CARRY4級聯(lián),那如果是對48位的數(shù)據(jù)進(jìn)行相加,那就會用到12個的CARRY4的級聯(lián),這樣(此處需要注意的是,在Vivado的設(shè)置下,如果進(jìn)行的是12bit以下的數(shù)據(jù)加1'b1的操作,那么Vivado綜合的結(jié)果并不會使用CARYY4,或者使用LUT來實(shí)現(xiàn)加法器)。

那如何解決這種問題呢?我們可以把加法操作進(jìn)行拆解,比如拆解成3個16bit的計數(shù)器,那這樣就會只有4個CARRY4的級聯(lián),時序情況就好了很多。

對比程序如下:

module top(

 input clk,
 input [47:0] din1,
 input [47:0] din2,
 output reg[47:0] dout1,
 output    [47:0] dout2
 );

 always @ ( posedge clk )
 begin
    dout1 <= din1 + 1'b1;
 end  

 genvar i;
 generate
 for(i = 0;i < 3;i=i+1) begin:LOOP
    wire carry_co;
    reg [15:0] carry_o=0;
    wire ci;
    if(i==0)  begin
        always @ ( posedge clk )
         begin
            carry_o <= din2[i*16+:16] + 1'b1;
         end
     end //if
     else begin
        always @ (posedge clk) begin
            if(LOOP[i-1].carry_co == 1)
                carry_o <= carry_o + 1'b1;
        end
     end //else
    assign LOOP[i].carry_co = (LOOP[i].carry_o==16'hffff)?1'b1:1'b0;
    assign dout2[i*16+:16] = LOOP[i].carry_o;

 end //for

 endgenerate

endmodule

:綜合后的schematic后可以發(fā)現(xiàn),在dout2的輸出中,每4個CARRY4后都會有一級的觸發(fā),這樣時序就會好很多,但造成的代價是LUT會增加。

編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1629

    文章

    21744

    瀏覽量

    603666
  • 計數(shù)器
    +關(guān)注

    關(guān)注

    32

    文章

    2256

    瀏覽量

    94614
收藏 人收藏

    評論

    相關(guān)推薦

    FPGA驅(qū)動AD芯片之實(shí)現(xiàn)與芯片通信

    概述:?利用FPGA實(shí)現(xiàn)AD芯片的時序,進(jìn)一步實(shí)現(xiàn)與AD芯片數(shù)據(jù)的交互,主要熟悉FPGA時序圖的實(shí)現(xiàn),掌握時序圖轉(zhuǎn)換Verilog硬件描述
    的頭像 發(fā)表于 12-17 15:27 ?261次閱讀
    <b class='flag-5'>FPGA</b>驅(qū)動AD芯片之實(shí)現(xiàn)與芯片通信

    FPGA加速深度學(xué)習(xí)模型的案例

    FPGA(現(xiàn)場可編程門陣列)加速深度學(xué)習(xí)模型是當(dāng)前硬件加速領(lǐng)域的一個熱門研究方向。以下是一些FPGA加速深度學(xué)習(xí)模型的案例: 一、基于FPGA
    的頭像 發(fā)表于 10-25 09:22 ?237次閱讀

    高速ADC與FPGA的LVDS數(shù)據(jù)接口中避免時序誤差的設(shè)計考慮

    電子發(fā)燒友網(wǎng)站提供《高速ADC與FPGA的LVDS數(shù)據(jù)接口中避免時序誤差的設(shè)計考慮.pdf》資料免費(fèi)下載
    發(fā)表于 10-15 09:50 ?5次下載
    高速ADC與<b class='flag-5'>FPGA</b>的LVDS數(shù)據(jù)接口中避免<b class='flag-5'>時序</b>誤差的設(shè)計考慮

    FPGA深度學(xué)習(xí)能走多遠(yuǎn)?

    ,共同進(jìn)步。 歡迎加入FPGA技術(shù)微信交流群14群! 交流問題(一) Q:FPGA深度學(xué)習(xí)能走多遠(yuǎn)?現(xiàn)在用FPGA深度學(xué)習(xí)加速成為一個熱
    發(fā)表于 09-27 20:53

    BQ79606A-Q1菊花通信時序

    電子發(fā)燒友網(wǎng)站提供《BQ79606A-Q1菊花通信時序.pdf》資料免費(fèi)下載
    發(fā)表于 09-26 11:41 ?1次下載
    BQ79606A-Q1菊花<b class='flag-5'>鏈</b>通信<b class='flag-5'>時序</b>

    FPGA電源時序控制

    電子發(fā)燒友網(wǎng)站提供《FPGA電源時序控制.pdf》資料免費(fèi)下載
    發(fā)表于 08-26 09:25 ?0次下載
    <b class='flag-5'>FPGA</b>電源<b class='flag-5'>時序</b>控制

    深度解析FPGA中的時序約束

    建立時間和保持時間是FPGA時序約束中兩個最基本的概念,同樣在芯片電路時序分析中也存在。
    的頭像 發(fā)表于 08-06 11:40 ?701次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>解析</b><b class='flag-5'>FPGA</b>中的<b class='flag-5'>時序</b>約束

    溫度補(bǔ)償振蕩器TG-3541CE的深度解析

    溫度補(bǔ)償振蕩器TG-3541CE的深度解析
    的頭像 發(fā)表于 07-18 17:48 ?330次閱讀

    FPGA時序課件下載

    方便FPGA愛好者學(xué)習(xí)
    發(fā)表于 07-12 11:45 ?2次下載

    FPGA 高級設(shè)計:時序分析和收斂

    今天給大俠帶來FPGA 高級設(shè)計:時序分析和收斂,話不多說,上貨。 這里超鏈接一篇之前的STA的文章,僅供各位大俠參考。 FPGA STA(靜態(tài)時序分析) 什么是靜態(tài)
    發(fā)表于 06-17 17:07

    加法進(jìn)位的手動約束

    在激光雷達(dá)中,使用FPGA實(shí)現(xiàn)TDC時需要手動約束進(jìn)位的位置。這里簡單記錄下。 在outflow下會生成一個.qplace文件?。用于指示布線的各個原語資源的分布位置 。 它的內(nèi)容主是 是原語
    的頭像 發(fā)表于 05-20 11:38 ?1314次閱讀
    加法<b class='flag-5'>進(jìn)位</b><b class='flag-5'>鏈</b>的手動約束

    FPGA工程的時序約束實(shí)踐案例

    詳細(xì)的原時鐘時序、數(shù)據(jù)路徑時序、目標(biāo)時鐘時序的各延遲數(shù)據(jù)如下圖所示。值得注意的是數(shù)據(jù)路徑信息,其中包括Tco延遲和布線延遲,各級累加之后得到總的延遲時間。
    發(fā)表于 04-29 10:39 ?781次閱讀
    <b class='flag-5'>FPGA</b>工程的<b class='flag-5'>時序</b>約束實(shí)踐案例

    深入理解 FPGA 的基礎(chǔ)結(jié)構(gòu)

    FPGA 的兩個最基本的部分是組合邏輯以及時序邏輯,分別實(shí)現(xiàn)這兩個基本部分的結(jié)構(gòu)就是 FPGA 的基本單元。組合邏輯部分一般采用查找表(Look-Up-Table,LUT)的形式,時序
    發(fā)表于 04-03 17:39

    FPGA深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈鶪PU

    現(xiàn)場可編程門陣列 (FPGA) 解決了 GPU 在運(yùn)行深度學(xué)習(xí)模型時面臨的許多問題 在過去的十年里,人工智能的再一次興起使顯卡行業(yè)受益匪淺。英偉達(dá) (Nvidia) 和 AMD 等公司的股價也大幅
    發(fā)表于 03-21 15:19

    fpga時序仿真和功能仿真的區(qū)別

    FPGA時序仿真和功能仿真在芯片設(shè)計和驗(yàn)證過程中各自扮演著不可或缺的角色,它們之間存在明顯的區(qū)別。
    的頭像 發(fā)表于 03-15 15:28 ?2283次閱讀