0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

隊列管理電路-下篇

jf_78858299 ? 來源:芯工阿文 ? 作者:芯工阿文 ? 2023-01-21 17:11 ? 次閱讀

前文聊了隊列管理的幾種典型電路,硬件邏輯簡單,代碼實現(xiàn)時容易操作。鏈表也是隊列管理的常用電路,相比前文的幾種結(jié)構(gòu),會稍微復(fù)雜一些。

1 什么是鏈表

在非連續(xù)、非順序的物理存儲結(jié)構(gòu)上,通過指針的方式記錄元素的順序關(guān)系。在硬件電路中,通常使用generate組建table,記錄每個entry的內(nèi)容,除了有效位和Payload之外,還有l(wèi)ink_next,可能有head/tail信息。head/tail信息也可以基于隊列進(jìn)行單獨記錄,而不在table體現(xiàn)。

圖片

使用NEXT標(biāo)注鏈表下一個元素的位置,也即table對應(yīng)的標(biāo)號。

圖片

2 鏈表操作

使用鏈表作為隊列管理電路,涉及到的邏輯主要包括查找空閑entry、添加元素和釋放元素,其中添加和釋放需要先獲取tail或head位置。除此之外,如有其余需求,則做相應(yīng)處理。

2.1 查找entry

新請求輸入至隊列,可放置在table任意位置,需查找到一個空閑的entry添加該請求至相關(guān)隊列的尾部。一般來說,從table的index 0處開始查找,獲取第一個可用的entry,使用如下代碼。

always @* begin : gen_idle_entry
  integer i;
  reg flag;
  flag = 1'b0;
  for ( i = 0; i < TABLE_DEPTH; i = i + 1) begin
    if (~flag & table_entry_idle[i]) begin
      table_entry_sel[i] = 1'b1;
      flag = 1'b0;
    end else begin
      table_entry_sel[i] = 1'b0;
    end
  end
end

在Spinal Lib提供了一種簡潔的方式,可以參考一下。

def first[T <: Data](that : T) : T = new Composite(that, "ohFirst"){
  val input = that.asBits.asUInt
  val masked = input & ~(input - 1)
  val value = cloneOf(that)
  value.assignFromBits(masked.asBits)
}.value

除此之外,還可以用其余的查找方式,其實就是一種調(diào)度邏輯,如定義一個計數(shù)器,需要查找時則計數(shù),檢查對應(yīng)entry是否空閑,但速度較慢。

2.2 添加元素

完成entry查找后,有兩方面內(nèi)容,一是將請求保存至entry內(nèi),二是更新上一元素的NEXT信號。

將請求保存至entry,較為簡單,根據(jù)查找邏輯得到的sel信號選擇對應(yīng)entry,更新其內(nèi)容及其head/tail信號。

更新上一元素的NEXT信號及其head/tail信號。若table內(nèi)采用了tail信號,相關(guān)處理代碼如下,其中table_next信號可使用不帶復(fù)位的寄存器。

assign table_next_update[index] = table_valid[index] & table_tail[index] & (table_queue_id[index] == req_queue_id);
always @ (posedge clk) if (table_next_update[index]) begin
  table_next[index] <= req_table_entry;
end
always @ (posedge clk or negedge rst_n) begin
  if(~rst_n)
    table_tail[index] <= 1'b0;
  else if (table_next_update[index])
    table_tail[index] <= 1'b0;
  else if (req_table_sel[index])
    table_tail[index] <= 1'b1;
end

2.3 釋放元素

鏈表通常用于記錄操作的先后順序,tail添加,head釋放;但也有用于管理credit的場景,tail添加,也在tail釋放。

在鏈表的head釋放,主要需要完成兩個操作,一是釋放Entry,對valid進(jìn)行清零,二是head信號傳遞。首先,通過調(diào)度邏輯選取需釋放的鏈表Entry,獲取其NEXT信號,并將其valid信號進(jìn)行清零;然后,將NEXT所指向Entry的head信號進(jìn)行置位。若存在時序緊張,可將NEXT信號進(jìn)行打拍,但要注意valid清零與head置位是否存在功能時序要求。

在鏈表的tail釋放,是類似的,區(qū)別是需置位tail信號,基于釋放的Entry匹配獲取鏈表的上一元素,代碼如下。對于這一場景,也可以考慮使用逆向鏈表,釋放邏輯就跟上面的head釋放是類似的了,但添加元素會有所區(qū)別。插入一個問題,存在雙向鏈表的數(shù)據(jù)結(jié)構(gòu),但從硬件來看,其實沒有必要,或者說硬件鏈表就是雙向鏈表,一側(cè)使用NEXT標(biāo)識,另一側(cè)使用NEXT匹配。

always @ (posedge clk or negedge rst_n) begin
  if (~rst_n)
    table_tail[index] <= 1'b0;
  else if (table_next_update[index])  // new entry added to tail
    table_tail[index] <= 1'b0;
  else if (req_table_sel[index])  // added as new entry
    table_tail[index] <= 1'b1;
  else if (release_grant & (table_next[index] == release_index))
    table_tail[index] <= 1'b1;
end

3 鏈表應(yīng)用

鏈表的特征是在無序的結(jié)構(gòu)內(nèi)記錄先后順序關(guān)系。理論來說,所有隊列管理電路都可以使用鏈表實現(xiàn),但其需要一些邏輯開銷,并不適用于所有場景。個人理解,存在多個隊列和亂序釋放的場景,可以考慮使用鏈表。

只有單個隊列,直接使用FIFO就足夠了;順序釋放元素,其存儲結(jié)構(gòu)相當(dāng)于是順序釋放的,使用鏈表的必要性也不大。在亂序釋放的場景中,必定會存在離散的空閑Entry,若需要提高table的利用率,鏈表則是一個較優(yōu)解。

舉一個鏈表使用的典型例子。AXI接口的不同ID存在亂序返回的場景,發(fā)送至不同目的側(cè)的延時存在差別,上游存在多個源頭,且不同源頭又期望順序返回響應(yīng)。需要使用數(shù)據(jù)結(jié)構(gòu)記錄ID的狀態(tài),可以使用鏈表維護ID的使用及其先后關(guān)系。新發(fā)出操作先從table獲取一個空閑的Entry,也即添加元素,使用該Entry的Index作為ID,基于源頭建立鏈表關(guān)系;操作返回后,則按順序釋放Entry,返回響應(yīng)。當(dāng)然,若僅存在一個源頭,或上游也無需順序返回響應(yīng),使用鏈表的意義不大。

4 類FIFO的偽鏈表

考慮一個場景,需要較大數(shù)量的Entry,如256,實現(xiàn)鏈表結(jié)構(gòu),可想而知,維護該鏈表所需的資源。另外,鏈表管理邏輯、Entry Payload 選取需要的MUX邏輯等等,在后端實現(xiàn)時,還可能出現(xiàn)Congestion風(fēng)險。

簡單的做法就是,將較大數(shù)量的Entry進(jìn)行分組,組內(nèi)按順序使用,不同組之間則使用鏈表NEXT指針。如將256分為16組,每組16個Entry,不同組之間基于鏈表維護,組內(nèi)Entry使用則按順序使用,同一組的16個Entry空閑或其空閑數(shù)量滿足要求后,可再分配使用?;诿拷M16個Entry進(jìn)行邏輯處理,不同組之間可添加寄存器打拍等等,降低Congestion風(fēng)險。

之前在做IP開發(fā)時,TLP轉(zhuǎn)AXI操作涉及到的ID分配和維護,就采用了這種偽鏈表的形式。每組32個Entry,例化了很多組,實現(xiàn)了AXI接口較大的Outstanding數(shù)量。將TLP轉(zhuǎn)化為AXI操作,需將較大的TLP報文切分為多個AXI操作,每個TLP報文作為一個隊列,由于TLP報文最大為4KByte,一個隊列最多只存在32個元素,多組之間就不再需要NEXT指針進(jìn)行維護了。每組內(nèi)進(jìn)行空閑Entry的搜索,找出連續(xù)且可用的最大數(shù)量的Entry,再供TLP轉(zhuǎn)換AXI時使用。

這一結(jié)構(gòu)相對簡單,存在的問題是會降低利用率。但是,從另一方面來看,在系統(tǒng)中,亂序是小概率的,順序是常見的,使用這一結(jié)構(gòu)可以達(dá)到期望的功能,在PPA方面也是較優(yōu)解。

5 小結(jié)

以上兩篇文章僅是簡單羅列了在過往工作中涉及到的隊列管理邏輯,未必全面,希望能對大家有一些啟發(fā)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 管理電路
    +關(guān)注

    關(guān)注

    0

    文章

    12

    瀏覽量

    6679
  • fifo
    +關(guān)注

    關(guān)注

    3

    文章

    388

    瀏覽量

    43685
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4788

    瀏覽量

    68625
收藏 人收藏

    評論

    相關(guān)推薦

    主動隊列管理建模及最優(yōu)控制策略

    主動隊列管理建模及最優(yōu)控制策略針對主動隊列管理(AQM)研究中缺乏系統(tǒng)的理論分析的問題,引入最優(yōu)控制理論進(jìn)行分析,得到了主動隊列管理的數(shù)學(xué)模型,該模型包括兩個差分方程,分別描述隊列長度
    發(fā)表于 06-14 00:14

    FreeRTOS學(xué)習(xí)筆記(六)——隊列管理

    FreeRTOS學(xué)習(xí)筆記(六)——隊列管理
    發(fā)表于 09-28 14:07

    FreeRTOS學(xué)習(xí)筆記(六)——隊列管理

    FreeRTOS學(xué)習(xí)筆記(六)——隊列管理
    發(fā)表于 10-21 20:40

    Agilent TCP和隊列管理

    TCP和隊列管理
    發(fā)表于 10-31 09:08

    簡單羅列幾種隊列管理邏輯電路

    ,寄存器數(shù)量為4096。5 小結(jié)隊列管理電路還有一個比較常見的實現(xiàn),鏈表。在亂序數(shù)據(jù)的重排序、資源管理等等方面,通常會用鏈表實現(xiàn),與上幾個結(jié)構(gòu)相比,鏈表會復(fù)雜一些。該部分將在下篇描述。
    發(fā)表于 08-29 14:23

    什么是鏈表?怎樣使用鏈表作為隊列管理電路

    前文聊了隊列管理的幾種典型電路,硬件邏輯簡單,代碼實現(xiàn)時容易操作。鏈表也是隊列管理的常用電路,相比前文的幾種結(jié)構(gòu),會稍微復(fù)雜一些。1 什么是鏈表在非連續(xù)、非順序的物理存儲結(jié)構(gòu)上,通過指
    發(fā)表于 08-29 14:26

    不同服務(wù)類型的隊列管理及性能比較

    為提高網(wǎng)絡(luò)利用率和數(shù)據(jù)包處理速度,針對不同應(yīng)用的網(wǎng)絡(luò)流量,在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的參數(shù)設(shè)置相同的情況下,使用NS2模擬器對瓶頸鏈路分別采用7種主動隊列管理機制進(jìn)行仿真,通過
    發(fā)表于 04-09 09:46 ?11次下載

    一種改進(jìn)的主動隊列管理算法

    主動隊列管理是實現(xiàn)網(wǎng)絡(luò)擁塞控制的重要技術(shù),但是多數(shù)主動隊列管理算法如隨機早期檢(RED)都存在對參數(shù)依賴性強的問題。針對RED算法中平均隊列長度不能完全反映網(wǎng)絡(luò)擁塞狀況的
    發(fā)表于 04-13 09:08 ?14次下載

    網(wǎng)絡(luò)中常用的隊列管理方法比較

    本文主要介紹了網(wǎng)絡(luò)中常用的兩種隊列管理方法:先進(jìn)先出(FIFO)和隨機提前檢測(RED),并且通過實驗比較了這兩種隊列管理方法在解決網(wǎng)絡(luò)擁塞控制方面的表現(xiàn),體現(xiàn)了研究
    發(fā)表于 05-25 11:24 ?9次下載

    主動隊列管理建模及最優(yōu)控制策略

    針對主動隊列管理(AQM)研究中缺乏系統(tǒng)的理論分析的問題,引入最優(yōu)控制理論進(jìn)行分析,得到了主動隊列管理的數(shù)學(xué)模型,該模型包括兩個差分方程,分別描述隊列長度和平均隊列
    發(fā)表于 05-25 21:44 ?17次下載

    一種基于速率的公平隊列管理算法

    針對主動隊列管理算法普遍存在的公平性問題,提出基于速率的公平隊列管理算法RFED。該算法根據(jù)分組的到達(dá)速率調(diào)節(jié)丟包率,將隊列的到達(dá)速率控制在鏈路的服務(wù)速率下,根據(jù)
    發(fā)表于 10-04 14:11 ?15次下載

    一種參數(shù)自適應(yīng)的主動隊列管理算法—自適應(yīng)BLUE

    BLUE算法是一種典型的主動隊列管理 (Active Queue Management,AQM) 算法,研究表明BLUE算法優(yōu)于RED算法。BLUE算法使用丟包事件和鏈路空閑事件控制網(wǎng)絡(luò)擁塞。但由于BLUE算法在參數(shù)設(shè)置方面
    發(fā)表于 11-24 14:19 ?10次下載

    面向網(wǎng)絡(luò)能效優(yōu)化的動態(tài)權(quán)重隊列管理算法

    針對流量傳輸過程中能效優(yōu)化的問題,提出一種面向網(wǎng)絡(luò)能效優(yōu)化的動態(tài)權(quán)重隊列管理算法DW_WFQ。該算法在加權(quán)公平隊列(WFQ)的基礎(chǔ)上通過動態(tài)地分配各類業(yè)務(wù)流的權(quán)重,以更加靈活的方式分配各類業(yè)務(wù)流
    發(fā)表于 12-20 09:27 ?0次下載
    面向網(wǎng)絡(luò)能效優(yōu)化的動態(tài)權(quán)重<b class='flag-5'>隊列管理</b>算法

    傳感器網(wǎng)絡(luò)隊列管理算法DQC

    為了在保證無線傳感器網(wǎng)絡(luò)時延要求的同時最小化功率消耗,提出一種基于占空比控制和時延保證的傳感器網(wǎng)絡(luò)隊列管理算法(DQC)。該算法根據(jù)不斷變化的網(wǎng)絡(luò)條件,為了更好地控制節(jié)點占空比和隊列閾值,采用一種
    發(fā)表于 01-10 17:13 ?0次下載

    隊列管理電路-上篇

    在數(shù)字芯片設(shè)計中,幾乎所有模塊都會涉及到隊列管理。輸入輸出的管理、不同數(shù)據(jù)流的調(diào)度、亂序數(shù)據(jù)的重排序、不同模塊的同步處理、資源管理,等等,均會涉及到隊列管理邏輯。如何選擇合適的硬件邏輯
    的頭像 發(fā)表于 01-21 16:49 ?718次閱讀
    <b class='flag-5'>隊列管理</b><b class='flag-5'>電路</b>-上篇