0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

優(yōu)化高性能CPU的ICG延遲設(shè)置

全棧芯片工程師 ? 來(lái)源:全棧芯片工程師 ? 2024-03-01 09:46 ? 次閱讀

優(yōu)化高性能CPUICG延遲設(shè)置

ee6cf1aa-d6f5-11ee-a297-92fbcf53809c.png

report_timing -path_type full_clock

ee848126-d6f5-11ee-a297-92fbcf53809c.png

請(qǐng)問(wèn)這里SDC為何約束到了ICG的CP端外,還約束了ICG的Q端?假設(shè)注釋掉Q端的約束,如下圖,會(huì)有什么問(wèn)題?

ee9d03b8-d6f5-11ee-a297-92fbcf53809c.png

去掉后,timing報(bào)告如下,明顯setup timing變差了很多。

eebc9e58-d6f5-11ee-a297-92fbcf53809c.png

report_timing -path_type full_clock

eece8226-d6f5-11ee-a297-92fbcf53809c.png

因此,約束ICG的latency為-400ps,目的是把ICG從reg拉開400ps,如果不約束ICG的Q,那么工具為了minimize skew,會(huì)默認(rèn)ICG后面所有的reg的CLK的latency和ICG是一樣的-400ps。此時(shí),時(shí)鐘還是是理想的。因此需要給ICG的Q端也約束上latency,此處約束為-50ps。不經(jīng)過(guò)這個(gè)ICG的CLK pin默認(rèn)latency為0。

注意,ICG本身容易setupviolation,默認(rèn)icg 和reg 越近越好。

2.5GHz頻率,12nm工藝,DVFS低功耗A72后端培訓(xùn)

01

12nm Cortex-A72后端實(shí)戰(zhàn)

本項(xiàng)目是真實(shí)項(xiàng)目實(shí)戰(zhàn)培訓(xùn),低功耗UPF設(shè)計(jì),后端參數(shù)如下:

工藝:12nm

頻率:2.5GHz

資源:2000_0000instances

低功耗:DVFS

為了滿足廣大學(xué)員的訴求,我們將12nm A72 TOP課程分為兩個(gè)版本:

1、基礎(chǔ)版(價(jià)格是知名機(jī)構(gòu)的1/5,全國(guó)最低價(jià))

2、進(jìn)階版(低功耗、hierarchy UPF、Stampling)!業(yè)界最先進(jìn)技術(shù)!

進(jìn)階版本的低功耗設(shè)計(jì)如下:7個(gè)power domain

eee2fbc0-d6f5-11ee-a297-92fbcf53809c.png

Stampling打起來(lái)真是高級(jí)手工藝術(shù),全網(wǎng)唯一:

eeff3cf4-d6f5-11ee-a297-92fbcf53809c.png

Flow:PartitionFlow

ef0d8e94-d6f5-11ee-a297-92fbcf53809c.png

時(shí)鐘結(jié)構(gòu)分析:

ef1fcf00-d6f5-11ee-a297-92fbcf53809c.png

復(fù)位結(jié)構(gòu)分析:

ef81b13e-d6f5-11ee-a297-92fbcf53809c.png

12nm 2.5GHz的A72實(shí)戰(zhàn)訓(xùn)練營(yíng)需要特別設(shè)置Latency,TOP結(jié)構(gòu)如下,參加過(guò)景芯SoC全流程訓(xùn)練營(yíng)的同學(xué)都知道CRG部分我們會(huì)手動(dòng)例化ICG來(lái)控制時(shí)鐘,具體實(shí)現(xiàn)參見40nm景芯SoC全流程訓(xùn)練項(xiàng)目,本文介紹下12nm 2.5GHz的A72實(shí)戰(zhàn)訓(xùn)練營(yíng)的Latency背景,歡迎加入實(shí)戰(zhàn)。

時(shí)鐘傳播延遲Latency,通常也被稱為插入延遲(insertion delay)。它可以分為兩個(gè)部分,時(shí)鐘源插入延遲(source latency)和時(shí)鐘網(wǎng)絡(luò)延遲(Network latency)。

ef944966-d6f5-11ee-a297-92fbcf53809c.png

大部分訓(xùn)練營(yíng)同學(xué)表示平時(shí)都直接將Latency設(shè)置為0了,那latency值有什么用呢?其實(shí)這相當(dāng)于一個(gè)target值,CTS的engine會(huì)根據(jù)你設(shè)置的latency值來(lái)插入buffer來(lái)實(shí)現(xiàn)你的latency target值。

下圖分為1st Level ICG和2nd Level ICG,請(qǐng)問(wèn)這些ICG為什么要分為兩層?

請(qǐng)問(wèn),為什么不全部把Latency設(shè)置為0?2nd Level ICG的latency應(yīng)該設(shè)置為多少呢?

efa3e48e-d6f5-11ee-a297-92fbcf53809c.png

latency大小直接影響clock skew的計(jì)算。時(shí)鐘樹是以平衡為目的,假設(shè)對(duì)一個(gè)root和sink設(shè)置了400ps的latency值,那么對(duì)另外的sink而言,就算沒(méi)有給定latency值,CTS為了得到較小的skew,也會(huì)將另外的sink做成400ps的latency。請(qǐng)問(wèn),為何要做短時(shí)鐘樹?因?yàn)檫^(guò)大的latency值會(huì)受到OCV和PVT等因素的影響較大,并有time derate的存在。

efb6ad94-d6f5-11ee-a297-92fbcf53809c.png

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10891

    瀏覽量

    212441

原文標(biāo)題:高性能CPU的ICG Latency設(shè)置

文章出處:【微信號(hào):全棧芯片工程師,微信公眾號(hào):全棧芯片工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    CPU和GPU頻率的查看及設(shè)置

    在嵌入式設(shè)備中為了降低功耗防止芯片發(fā)熱,廠商一般默認(rèn)都將CPU和GPU頻率為最小,為了提高性能,減少算法耗時(shí)需要手動(dòng)將CPU或者GPU頻率設(shè)到性能模式。
    發(fā)表于 09-21 14:42 ?9437次閱讀

    AutoKernel高性能算子自動(dòng)優(yōu)化工具

    1. 簡(jiǎn)介隨著人工智能的普及,深度學(xué)習(xí)網(wǎng)絡(luò)的不斷涌現(xiàn),為了讓各硬件(CPU, GPU, NPU,…)能夠支持深度學(xué)習(xí)應(yīng)用,各硬件芯片需要軟件庫(kù)去支持高性能的深度學(xué)習(xí)張量運(yùn)算。目前,這些高性能計(jì)算庫(kù)
    發(fā)表于 12-14 06:18

    怎樣去設(shè)置電腦電源的高性能模式呢

    控制面板。②選第一項(xiàng)設(shè)置硬件渲染,一共三個(gè)檔位,如果顯卡較好,可以設(shè)置成質(zhì)量?jī)?yōu)先或者不作修改,保持默認(rèn)設(shè)置。③選“管理3D設(shè)置”,將首選圖形處理器設(shè)
    發(fā)表于 12-31 07:03

    怎么把電源計(jì)劃設(shè)置高性能

    高性能呢?我們一起來(lái)看看吧。具體步驟:1、右鍵點(diǎn)擊桌面計(jì)算機(jī),在打開的菜單項(xiàng)中選擇屬性;Win11筆記本電源計(jì)劃怎么設(shè)置?Win11設(shè)置電源計(jì)劃為高性能的方法2、控制面板 - 所有控制
    發(fā)表于 12-31 08:17

    《現(xiàn)代CPU性能分析與優(yōu)化》---精簡(jiǎn)的優(yōu)化

    《現(xiàn)代CPU性能分析與優(yōu)化》是一本非常實(shí)用的書籍,對(duì)于從事性能關(guān)鍵型應(yīng)用程序開發(fā)和進(jìn)行系統(tǒng)底層優(yōu)化的技術(shù)人員來(lái)說(shuō)是不可或缺的。這本書也很適合
    發(fā)表于 04-18 16:03

    《現(xiàn)代CPU性能分析與優(yōu)化》--讀書心得筆記

    很榮幸拿到這本<<現(xiàn)代CPU性能分析與優(yōu)化>>,花了幾天的時(shí)間瀏覽了一遍,書比較單薄,正文只有不到200頁(yè),但是里面的內(nèi)容確是非常豐富的,一般
    發(fā)表于 04-24 15:31

    優(yōu)化BIOS設(shè)置提高系統(tǒng)性能

    BIOS設(shè)置對(duì)系統(tǒng)性能的影響非常大,優(yōu)化的BIOS設(shè)置,可大大提高PC整體性能,不恰當(dāng)?shù)?b class='flag-5'>設(shè)置會(huì)導(dǎo)
    發(fā)表于 10-10 14:27 ?43次下載

    WindowsXP加速優(yōu)化設(shè)置

    WindowsXP加速優(yōu)化設(shè)置 1、內(nèi)存性能優(yōu)化  Windows XP中有幾個(gè)選項(xiàng)可以優(yōu)化內(nèi)存性能
    發(fā)表于 02-24 11:38 ?1528次閱讀

    高性能CPU時(shí)鐘網(wǎng)絡(luò)設(shè)計(jì)

    討論了物理設(shè)計(jì)中時(shí)鐘網(wǎng)絡(luò)的設(shè)計(jì)技術(shù),并以現(xiàn)有的CPU時(shí)鐘網(wǎng)絡(luò)的為例,介紹了高性能CPU的時(shí)鐘網(wǎng)絡(luò)設(shè)計(jì)技術(shù)。
    發(fā)表于 12-27 15:28 ?46次下載
    <b class='flag-5'>高性能</b><b class='flag-5'>CPU</b>時(shí)鐘網(wǎng)絡(luò)設(shè)計(jì)

    高性能CPU的時(shí)鐘網(wǎng)絡(luò)設(shè)計(jì)

    高性能CPU的時(shí)鐘網(wǎng)絡(luò)設(shè)計(jì)
    發(fā)表于 10-30 15:28 ?23次下載
    <b class='flag-5'>高性能</b><b class='flag-5'>CPU</b>的時(shí)鐘網(wǎng)絡(luò)設(shè)計(jì)

    Linux CPU性能應(yīng)該如何優(yōu)化

    在Linux系統(tǒng)中,由于成本的限制,往往會(huì)存在資源上的不足,例如 CPU、內(nèi)存、網(wǎng)絡(luò)、IO 性能。本文,就對(duì) Linux 進(jìn)程和 CPU 的原理進(jìn)行分析,總結(jié)出 CPU
    的頭像 發(fā)表于 01-18 08:52 ?3403次閱讀

    CPU與內(nèi)存延遲的關(guān)系分析 影響CPU性能差距的因素

    小編聊到過(guò)內(nèi)存延遲這種參數(shù),對(duì)整個(gè)系統(tǒng)來(lái)說(shuō),內(nèi)存延遲的影響遠(yuǎn)不如容量、頻率等。不過(guò)有時(shí)候,內(nèi)存延遲可不僅和內(nèi)存條能力有關(guān),而且會(huì)明顯影響整個(gè)電腦的性能,這是腫么回事呢?有點(diǎn)看糊涂了的小
    的頭像 發(fā)表于 09-09 10:53 ?9140次閱讀
    <b class='flag-5'>CPU</b>與內(nèi)存<b class='flag-5'>延遲</b>的關(guān)系分析 影響<b class='flag-5'>CPU</b><b class='flag-5'>性能</b>差距的因素

    突破性能瓶頸,實(shí)現(xiàn)CPU與內(nèi)存高性能互連

    連接(hardwired)的“硬”互連技術(shù) 瀾起科技的高性能內(nèi)存接口芯片,可在內(nèi)存容量擴(kuò)大的同時(shí),減輕CPU接口的負(fù)載,提高單個(gè)內(nèi)存通道的速度和容量密度,改善信號(hào)完整性,實(shí)現(xiàn)低延遲、高速、大容量的內(nèi)存接口解決方案
    發(fā)表于 12-01 15:13 ?654次閱讀

    CPU程序幾個(gè)優(yōu)化程序性能的手段詳解

    要寫出高性能的代碼,首先需要對(duì)編譯器有基礎(chǔ)的了解,原因在于現(xiàn)代編譯器有很強(qiáng)的優(yōu)化能力,但有些代碼編譯器不能進(jìn)行優(yōu)化。對(duì)編譯器有了基礎(chǔ)的了解,才能寫出編譯器友好型高性能代碼。
    的頭像 發(fā)表于 11-21 09:46 ?651次閱讀
    <b class='flag-5'>CPU</b>程序幾個(gè)<b class='flag-5'>優(yōu)化</b>程序<b class='flag-5'>性能</b>的手段詳解

    華為云 X 實(shí)例 CPU 性能測(cè)試詳解與優(yōu)化策略

    分析 ? 3.2 CPU性能瓶頸分析 ? 4. CPU性能優(yōu)化策略 ? 4.1 優(yōu)化
    的頭像 發(fā)表于 12-30 14:52 ?144次閱讀
    華為云 X 實(shí)例 <b class='flag-5'>CPU</b> <b class='flag-5'>性能</b>測(cè)試詳解與<b class='flag-5'>優(yōu)化</b>策略