0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

處理器架構(gòu)探索的混合創(chuàng)新

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Deepak Shankar ? 2022-06-01 15:50 ? 次閱讀

架構(gòu)探索一直是產(chǎn)品設計的圣杯。它有可能徹底改變產(chǎn)品工程。研究和用例評估表明,在架構(gòu)探索期間可以實現(xiàn) 80% 的系統(tǒng)優(yōu)化和幾乎 100% 的性能/功耗權(quán)衡。

不幸的是,除了公司投入大量資源和時間的利基領域外,架構(gòu)探索未能起飛。架構(gòu)探索被高度誤解,并且已經(jīng)推出了聲稱架構(gòu)探索但圍繞現(xiàn)有產(chǎn)品(例如指令集模擬器、軟件時序分析器和硬件驗證)的產(chǎn)品。用一組類庫突出顯示語言不足以建立方法、輕松創(chuàng)建模型、針對基準進行驗證和性能系統(tǒng)優(yōu)化。

架構(gòu)探索的主要障礙是缺乏高端內(nèi)核、互連、緩存和內(nèi)存的架構(gòu)模型。有限的模型范圍往往適用于架構(gòu)探索不會增加顯著價值的低端處理器,每秒運行最多 1,000 條指令的周期精確模型,需要很長時間來安裝、學習和組裝,并在 IP 發(fā)貨后很好地發(fā)布。這些模型需要數(shù)周時間才能運行一個基準測試,并且對于比較驗證很有用。此外,它們不能跨內(nèi)核、SoC、系統(tǒng)和軟件進行擴展。

架構(gòu)模型往往是 IP 提供商和 EDA 供應商的低優(yōu)先級,因為他們必須提供 RTL 和軟件工具,例如編譯器、調(diào)試器和驗證 IP。此外,為大規(guī)模分發(fā)創(chuàng)建架構(gòu)模型需要特殊的技能,因為每個核心類型的流程都重新開始。組裝需要很長時間,需要多種資源,并且運行速度極慢。每個新的處理器內(nèi)核都有很多變化——緩存的讀/寫寬度、多線程、ISA 版本、可變流水線階段、用于將指令分派到執(zhí)行單元的調(diào)度邏輯以及指令緩沖區(qū)。

具有隨機性的傳統(tǒng)架構(gòu)模型被組裝大型系統(tǒng)和數(shù)據(jù)中心的公司使用。這些模型將模擬不同類型的請求和任務的延遲和功耗。

另一個主要問題是驗證過程。對于新處理器,用于驗證模型準確性的基準數(shù)據(jù)有限。這個問題對于功耗、高速緩存命中未命中率和內(nèi)存吞吐量而言更為嚴重。當然,FPGA 板可以通過使用舊版本的內(nèi)核以及更新的緩存、互連和內(nèi)存設置來減輕一些負載。測試新內(nèi)核正確性的最佳方法是仔細檢查每個可能的場景,包括并發(fā)執(zhí)行,運行緩存層次結(jié)構(gòu)和 DMA 的舊跟蹤,并生成確保絕對覆蓋的場景。

pYYBAGKXG02ALVAEAAIK9vGmGXM292.png

圖 1:基于 RISC-VARM 的 VisualSim 處理器架構(gòu)探索

Mirabilis Design 最近采用的一種方法是在具有圖形開發(fā)環(huán)境的離散事件模擬器上提供混合處理器架構(gòu)庫。這類架構(gòu)模型消除了早期方法的所有問題。這是一個通用的生成器,它使用電子表格來定義核心配置。內(nèi)部定序器通過消除不影響流正確性、性能和功率的邏輯來優(yōu)化仿真性能,并提供靈活的選項列表來定義不同的管道變體。這種方法的美妙之處在于可以快速構(gòu)建新的甚至不存在的內(nèi)核。

這種方法有多種好處,包括:

單個庫模塊可以將微控制器建模為高性能處理器。

處理器庫具有研究單個集群、多核集群組、片上系統(tǒng)和完整系統(tǒng)(如 ECU、雷達或超級計算機)的仿真性能。

這種方法提供了一個龐大的供應商內(nèi)核庫。

混合核心與隨機核心不同,具有運行軟件跟蹤的能力。

擴展庫具有使生成的內(nèi)核與緩存、動態(tài)系統(tǒng)緩存、TileLink、AMBA AXI、NoC、DDR、LPDDR、GDDR、DMA 和橋完全集成的所有連接性和方法。

這些使用混合處理器的模型可用于選擇時鐘速度、緩沖區(qū)大小、寬度和容量,同時提供拓撲、路由、flit 大小和設備連接性。在電源方面,系統(tǒng)模型可以確定最佳電源狀態(tài)集和最佳電源管理算法。在這個早期階段分析功率可以深入了解配電、電池容量、充電系統(tǒng)和熱要求?;旌夏P偷臏蚀_性使軟件性能調(diào)整和調(diào)度器和仲裁器的選擇成為可能。

需要為性能生成的所需指標是延遲、吞吐量、緩沖區(qū)占用率、命中率、流水線停頓、MIPS 和周期/指令。對平均和瞬時功率、能耗、每個任務和設備的功率以及能源管理算法的影響進行真正的功率分析指標。高級分析將涵蓋功能正確性、發(fā)生故障時的行為和服務質(zhì)量。

要在混合處理器中定義的屬性包括對執(zhí)行單元和延遲周期的 ISA 分配、浮點和整數(shù)單元的數(shù)量、每個集群的核心數(shù)、有序和無序的分布以及大/小數(shù)量核心。緩存配置可以涵蓋包含/排除、容量、關聯(lián)性、銀行計數(shù)、暫存器的使用以及各種替換和寫入策略。對于互連,吞吐量要求、緩沖區(qū)占用率、最有效的仲裁算法以及傳輸突發(fā)/閃存大小。在內(nèi)存中,該模型可以測量跟蹤、順序和隨機地址的帶寬、延遲和打開/關閉頁面。

在 SoC 級別,使用了 DMA 與 TCP 傳輸、張量操作探索和拆分鎖安排。必須對系統(tǒng)進行跨集群的任務分區(qū)、內(nèi)存控制器調(diào)度、路由器數(shù)量和設備連接性測試。隨著系統(tǒng)越來越接近客戶部署,可以擴展相同的模型以集成多處理器集成,最大限度地減少芯片到芯片的開銷,將應用程序分配到處理器以及存儲策略。

架構(gòu)師可以從供應商列表中選擇或在幾天內(nèi)創(chuàng)建一個新的。一旦處理器內(nèi)核被實例化,用戶就可以連接其他半導體 IP 以形成完整的 SoC。在短時間內(nèi),用戶可以擁有一個多核多集群、基于 NoC 的 SoC,帶有 GPU、TPU/AI 加速器、內(nèi)存、顯示控制器、以太網(wǎng)和其他接口。為了模擬這個模型,IO 由泊松分布和數(shù)據(jù)范圍生成的數(shù)據(jù)流觸發(fā),處理器執(zhí)行軟件跟蹤以執(zhí)行模擬。多個 SoC 可以通過連貫的 PCIe 或 CXL 組合,或與高速以太網(wǎng)或可靠的 OpenVPX 背板連接。

pYYBAGKXG1WAJS_mAAUrnpGHvbQ503.png

圖 2:具有高速緩存存儲器層次結(jié)構(gòu)的亂序處理器管道的系統(tǒng)級模型

新的混合處理器對加載/存儲行為具有指令感知,按順序/無序執(zhí)行,支持多指令獲取和分派,支持每個流水線階段的不同屬性,支持之間的流控制階段、任務發(fā)布隊列、跳轉(zhuǎn)流水線階段、流水線和緩存之間的緩沖、可變讀寫寬度和搶占支持?;旌戏椒梢詳U展到 20 個整數(shù)、浮點、向量、分支、加載和存儲類型的執(zhí)行單元。同時,每個執(zhí)行單元的流水線級數(shù)可以是可變的,最多可以定義為 20 個。

混合處理器的所有這些新功能都支持帶有緩存地址的執(zhí)行軟件跟蹤。為了準備在此處理器模型上執(zhí)行的軟件,全自動系統(tǒng)會生成指令序列、指令高速緩存地址和數(shù)據(jù)高速緩存地址以用于加載存儲。架構(gòu)模型與流量和軟件執(zhí)行的結(jié)合提供了一個有效的平臺來測試內(nèi)核、緩存、互連和內(nèi)存的準確性。該測試涵蓋了端到端設計的延遲和功耗,還測量了緩存命中率和內(nèi)存吞吐量。這種新的基準測試方法可以增強用戶的信心,并確保進行高質(zhì)量的權(quán)衡分析。

新的混合處理器可供使用 ARM 或 RISC-V 內(nèi)核開發(fā)定制 SoC 的系統(tǒng)公司、集成多個非異構(gòu)主設備、加速器、GPU 和其他處理單元的半導體公司,以及實施新應用程序和高級 AI/ML 工作負載的 AI 公司使用。 系統(tǒng)和半導體的競爭在所有市場上都很重要,新產(chǎn)品的時間安排正在縮短。由于半導體短缺,公司必須更長時間地使用現(xiàn)有 SoC,識別新應用并支持現(xiàn)有設備上增加的功能。進行廣泛的架構(gòu)覆蓋將提供對實際性能和容量的詳細視圖,從而為將產(chǎn)品集成到其環(huán)境中的客戶提供有價值的見解。

poYBAGKXG2CAZQ2tAAID4cFtaow949.png

圖 3:具有 Aaa65AE 的多集群多核處理器,用于汽車安全關鍵型應用

混合處理器的一個重要附帶好處是能夠運行軟件并準確查看目標配置上的軟件性能。當今的 SoC 配置非常復雜,以至于在 FPGA 上運行它會導致您錯過一致性、數(shù)據(jù)分配、跨集群的工作負載分配以及數(shù)據(jù)路徑和緩存之間復雜的通信。當一組軟件任務在多核架構(gòu)上同時運行時,軟件團隊可以及早了解時序和功耗。

類似地,每個內(nèi)核都提供了緩存層次結(jié)構(gòu)的變化以及與諸如回寫、寬度、塊大小、預取條件、存儲體、關聯(lián)性、私有與系統(tǒng)等項目的連接。然后是來自DDR、LPDDR、GDDR、HBM的內(nèi)存,以及商業(yè)內(nèi)存控制器中不同類型的調(diào)度器。最后,不同的互連選項:供應商特定的片上網(wǎng)絡、極小的 NoC、AMBA 變體和 Tilelink。為此添加 DMA、網(wǎng)橋、中斷、動態(tài)共享緩存單元、IO、以太網(wǎng)、CAN/CAN-FD 和 PCIe 以獲得完整的要求。

混合處理器是電子設計行業(yè)的一項重大創(chuàng)新。它為架構(gòu)師提供了更多的權(quán)力,并使團隊能夠在開發(fā)之前可視化系統(tǒng)行為。由于分析速度很快,真正的架構(gòu)覆蓋是可能的,并且可以涵蓋性能、功率、服務質(zhì)量、效率、可靠性和功能正確性。通過添加軟件性能分析和調(diào)整,所有系統(tǒng)團隊都可以在同一環(huán)境中參與。隨著設計人員參與新應用、小型工藝技術和不斷增加的功率要求,混合處理器是未來。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19293

    瀏覽量

    229965
  • 以太網(wǎng)

    關注

    40

    文章

    5427

    瀏覽量

    171790
  • soc
    soc
    +關注

    關注

    38

    文章

    4169

    瀏覽量

    218350
收藏 人收藏

    評論

    相關推薦

    對稱多處理器和非對稱多處理器的區(qū)別

    隨著計算需求的日益增長,單處理器系統(tǒng)已經(jīng)無法滿足高性能計算的需求。多處理器系統(tǒng)應運而生,它們通過將多個處理器集成到一個系統(tǒng)中來提高計算能力。在多處理器系統(tǒng)中,有兩種主要的
    的頭像 發(fā)表于 10-10 15:58 ?943次閱讀

    簡述微處理器的指令集架構(gòu)

    處理器的指令集架構(gòu)(Instruction Set Architecture,ISA)是計算機體系結(jié)構(gòu)中的核心組成部分,它定義了計算機能夠執(zhí)行的指令集合、數(shù)據(jù)類型、寄存、內(nèi)存訪問方式等,是連接
    的頭像 發(fā)表于 10-05 14:59 ?476次閱讀

    盛顯科技:在拼接處理器上配置混合矩陣的步驟是什么?

    相信大家都知道,在拼接處理器上配置混合矩陣,主要涉及到將混合矩陣的輸出與拼接處理器的輸入相連接,并通過拼接處理器的軟件或界面進行配置,以實現(xiàn)
    的頭像 發(fā)表于 09-26 18:09 ?336次閱讀

    ARM處理器和CISC處理器的區(qū)別

    ARM處理器和CISC(復雜指令集計算機)處理器在多個方面存在顯著的區(qū)別。這些區(qū)別主要體現(xiàn)在架構(gòu)原理、性能與功耗、設計目標、應用領域以及市場生態(tài)等方面。
    的頭像 發(fā)表于 09-10 11:10 ?464次閱讀

    盛顯科技:拼接處理器為什么要配置混合矩陣?

    拼接處理器混合矩陣作為視頻顯示與控制系統(tǒng)的關鍵組件,各自具有獨特的功能和優(yōu)勢。它們之間既存在區(qū)別又相互關聯(lián),共同為用戶提供了高效、靈活的視頻處理與顯示解決方案。在實際應用中,我們通常會把兩者搭配
    的頭像 發(fā)表于 09-06 11:23 ?337次閱讀
    盛顯科技:拼接<b class='flag-5'>處理器</b>為什么要配置<b class='flag-5'>混合</b>矩陣?

    X86架構(gòu)處理器有哪些優(yōu)點和缺點

    X86架構(gòu)處理器作為計算機領域的重要組成部分,具有多個顯著的優(yōu)點和一定的缺點。以下是對X86架構(gòu)處理器優(yōu)缺點的詳細分析。
    的頭像 發(fā)表于 08-22 11:25 ?2166次閱讀

    處理器的指令集架構(gòu)介紹

    處理器的指令集架構(gòu)(Instruction Set Architecture,ISA)是計算機體系結(jié)構(gòu)中至關重要的部分,它定義了微處理器能夠執(zhí)行的操作和指令的集合,以及這些指令如何被組織、存儲
    的頭像 發(fā)表于 08-22 10:53 ?1253次閱讀

    MSP430FE42xA混合信號微處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《MSP430FE42xA混合信號微處理器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-09 11:32 ?0次下載
    MSP430FE42xA<b class='flag-5'>混合</b>信號微<b class='flag-5'>處理器</b>數(shù)據(jù)表

    MSP430F2013-EP混合信號微處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《MSP430F2013-EP混合信號微處理器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-09 11:14 ?0次下載
    MSP430F2013-EP<b class='flag-5'>混合</b>信號微<b class='flag-5'>處理器</b>數(shù)據(jù)表

    MSP430xG461x混合信號微處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《MSP430xG461x混合信號微處理器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-03 09:40 ?0次下載
    MSP430xG461x<b class='flag-5'>混合</b>信號微<b class='flag-5'>處理器</b>數(shù)據(jù)表

    嵌入式微處理器的分類 嵌入式微處理器的種類和型號

    的分類可以從多個角度進行劃分,比如架構(gòu)、指令集、用途等。下面將從這些角度詳細介紹嵌入式微處理器的種類和型號。 一、架構(gòu)分類 嵌入式微處理器架構(gòu)
    的頭像 發(fā)表于 05-04 16:31 ?2273次閱讀

    嵌入式微處理器架構(gòu)可分為

    嵌入式微處理器架構(gòu)是指用于嵌入式系統(tǒng)的微處理器的設計和組織方式。嵌入式系統(tǒng)是指內(nèi)嵌在其他電子設備中的計算機系統(tǒng),它們通常用于實時控制、通信、處理數(shù)據(jù)等任務。嵌入式微
    的頭像 發(fā)表于 04-21 14:39 ?1191次閱讀

    嵌入式微處理器的基礎是什么

    要求的硬件和軟件技術。 在嵌入式微處理器的基礎上,我們可以考慮以下幾個方面進行詳細討論: 處理器架構(gòu)和指令集:嵌入式微處理器通常在特定的指令集架構(gòu)
    的頭像 發(fā)表于 04-21 14:34 ?1109次閱讀

    嵌入式微處理器有哪兩種架構(gòu)? 嵌入式微處理器技術的優(yōu)缺點

    嵌入式微處理器是一種專門設計用于嵌入式系統(tǒng)應用的微處理器,通常集成了計算、控制和通信等功能。目前市場上存在兩種主要的嵌入式微處理器架構(gòu),分別是CISC(復雜指令集計算機)和RISC(精
    的頭像 發(fā)表于 04-21 09:54 ?1076次閱讀

    嵌入式微處理器有哪兩種架構(gòu)?區(qū)別是什么?

    嵌入式微處理器是一種專門設計用于控制嵌入式系統(tǒng)的微處理器。它集成了處理器核心、存儲、輸入輸出接口等功能,可以實現(xiàn)對嵌入式系統(tǒng)的控制和運算。嵌入式微
    的頭像 發(fā)表于 04-21 09:41 ?678次閱讀