0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DVFS hierarchy低功耗A72后端實戰(zhàn)案例

全棧芯片工程師 ? 來源:全棧芯片工程師 ? 2024-04-08 09:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01

2.5GHz 12nm DVFS A72后端實戰(zhàn)

本培訓項目是真實項目,低功耗hierarchyUPF設計,價格是知名機構的1/3,全網(wǎng)最低價。DVFS hierarchy低功耗A72后端實戰(zhàn)內容簡介如下:

1) 根據(jù)低功耗需求,編寫UPF驗證UPF

掌握hierarchy UPF文件編寫,掌握Flatten UPF文件編寫。

本項目采用hierarchy UPF方式劃分了7個power domain、voltage domain,指定power switch cell,其中包括SWITCH TRICKLE、SWITCH HAMMER。掌握低功耗cell的用法,選擇合適的isolation cell、level shifter等低功耗cell。

f405a8da-f4f7-11ee-a297-92fbcf53809c.png

掌握Power gating,Clock gating設計技術。

掌握Multi-VT設計技術,本項目時鐘樹都是ULVT,動態(tài)功耗小,skew小。

掌握DVFS技術,ss0p9 2.5GHz、ss0p722.0GHz,,其中sram不支持ss0p63。要做ss0p63的話,給sram vddm單獨一個0p7v的電源即可。

掌握multibit cell的用法,本項目CPU里面的mb高達95%,選擇合適的multibitcell得到超高的CPU利用率。INNOVUS里面一般不做mb的merge和split。所以前后一樣的,一般綜合做multibit的merge split。

f40bc42c-f4f7-11ee-a297-92fbcf53809c.png

2) 根據(jù)top floorplan def進行CPU子系統(tǒng)的partition以及pin assignment。

Top的Power stripe的規(guī)劃及其push down。

SpecifyBlackBox,將CPU core鏡像partition。

手動manual cut the BlackBox的方法,掌握復雜的floorplan設計方法經(jīng)驗。

VerifyPowerDomain,檢查低功耗劃分以及UPF的正確性。

Pin assignment,根據(jù)timing的需求進行合理的pin腳排布,并解決congestion問題。

掌握Timing budget。

掌握利用Mixplace實戰(zhàn)CPU的自動floorplan,掌握AI的floorplan方法學。

f4163d1c-f4f7-11ee-a297-92fbcf53809c.png

3) 掌握Fusion compiler DCG,利用fusion compiler來完成DCG綜合,進一步優(yōu)化timing與congestion。

4) 掌握hierarchy ICG的設計方法學,實戰(zhàn)關鍵ICG的設置與否對timing的重大影響。

5) 掌握Stapling技術,實戰(zhàn)power switch cell的布局和特殊走線的方法學,掌握CPU子系統(tǒng)的powerplan規(guī)劃及實現(xiàn),保證CPU子系統(tǒng)和頂層PG的alignment。

6) 掌握CPU子系統(tǒng)和TOP的時序接口優(yōu)化。掌握TOPisolation cell的placement以及isolationcell input電學特性檢查。

7) 掌握TOP和CPU子系統(tǒng)的clocktree Balance優(yōu)化處理,common clock path處理。時鐘樹結構trace和時鐘樹評價。

8) DRC/LVS

CPU子系統(tǒng)的DRC/LVS檢查

TOP系統(tǒng)的DRC/LVS檢查

Hierarchy & Flatten LVS檢查原理及實現(xiàn)方法

9) 靜態(tài)時序分析&IR-Drop

DMSA flow

根據(jù)Foundry的SOD(signoff doc)的Timing signoff標準建立PT環(huán)境。

Star RC寄生抽取及相關項檢查

Timing exception分析,包括set_false_path、set_multicyle_path解析。

PT timing signoff的Hierarchical和Flatten Timing檢查

PT和PR timing的差異分析、Dummy insertion和with dummy的Timing分析

IR-Drop分析

Stampling打起來真是高級手工藝術,全網(wǎng)唯一:

f42898ea-f4f7-11ee-a297-92fbcf53809c.png

Flow:PartitionFlow

f432adb2-f4f7-11ee-a297-92fbcf53809c.png

時鐘結構分析:

f43c98b8-f4f7-11ee-a297-92fbcf53809c.png

復位結構分析:

f440d054-f4f7-11ee-a297-92fbcf53809c.png

12nm 2.5GHz的A72實戰(zhàn)訓練營需要特別設置Latency,TOP結構如下,參加過景芯SoC全流程訓練營的同學都知道CRG部分我們會手動例化ICG來控制時鐘,具體實現(xiàn)參見40nm景芯SoC全流程訓練項目,本文介紹下12nm 2.5GHz的A72實戰(zhàn)訓練營的Latency背景,歡迎加入實戰(zhàn)。

時鐘傳播延遲Latency,通常也被稱為插入延遲(insertion delay)。它可以分為兩個部分,時鐘源插入延遲(source latency)和時鐘網(wǎng)絡延遲(Network latency)。

f4545746-f4f7-11ee-a297-92fbcf53809c.png

大部分訓練營同學表示平時都直接將Latency設置為0了,那latency值有什么用呢?其實這相當于一個target值,CTS的engine會根據(jù)你設置的latency值來插入buffer來實現(xiàn)你的latency target值。

下圖分為1st Level ICG和2nd Level ICG,請問這些ICG為什么要分為兩層?

請問,為什么不全部把Latency設置為0?2nd Level ICG的latency應該設置為多少呢?

f45a3940-f4f7-11ee-a297-92fbcf53809c.png

latency大小直接影響clock skew的計算。時鐘樹是以平衡為目的,假設對一個root和sink設置了400ps的latency值,那么對另外的sink而言,就算沒有給定latency值,CTS為了得到較小的skew,也會將另外的sink做成400ps的latency。請問,為何要做短時鐘樹?因為過大的latency值會受到OCV和PVT等因素的影響較大,并有time derate的存在。

f45e3a2c-f4f7-11ee-a297-92fbcf53809c.png

分享個例子,比如,Cortex-A72低功耗設計,DBG domain的isolation為何用VDDS_maia_noncpu供電而不是TOP的VDD?

f465f500-f4f7-11ee-a297-92fbcf53809c.png

答:因為dbg的上一級是noncpu,noncpu下面分成dbg和兩個tbnk。

再分享個例子,比如,Cortex-A72低功耗設計,這個switch cell是雙開關嗎?答:不是,之所以分trickle和hammer,是為了解決hash current大電流,先開trickle,然后再開hammer。

f47f0c52-f4f7-11ee-a297-92fbcf53809c.png

再分享個例子,比如,Cortex-A72進階版本課程的低功耗例子:請問,如果iso cell輸出都要放parent,輸入放self,那么下面-applies_to_outputs對應的-location為何是self?

f48374ea-f4f7-11ee-a297-92fbcf53809c.png

答:這個需要了解CPU的內部設計架構,tbnk掉電 VDDS_maia_noncpu也必然掉電,pst如下,所以-applies_to_outputs對應的-location是可以的,那么注意下debug domain呢?

f48a8d84-f4f7-11ee-a297-92fbcf53809c.png

實際上,沒有tbnk到debug domain的信號,因此腳本如下:

f4927aee-f4f7-11ee-a297-92fbcf53809c.png

再分享個例子,比如,Cortex-A72進階版本課程的低功耗例子:為何non_cpu的SRAM的VDD VDDM都接的可關閉電源?SRAM的VDD VDDM分別是常開、和retention電源吧?

f4a5e89a-f4f7-11ee-a297-92fbcf53809c.png

答:本來是VDDM作為retention電源設計的,VDD關掉后 VDDM可以供電作為retention使用,但是此處沒有去做memory的雙電源,sram當成單電源使用,不然sram無法徹底斷電。

再分享個例子,比如,Cortex-A72基礎版課程有學員的Cortex-A72 maia_cpu LVS通過,但是MAIA頂層LVS比對不過,我們來定位一下。

以FE_OFN4326_cfgend_cpu1_o為例,點擊下圖FE_OFN4326_cfgend_cpu1_o:

f4abfd5c-f4f7-11ee-a297-92fbcf53809c.png

找到calibredrv錯誤坐標:(1949,139)

對應到innovus去看坐標:(1949,139)

看到maia_cpu的pin腳過于密集,造成頂層連接pin腳時候會無法繞線,從而導致innovus從maia_cpu上面走線,形成short。盡管maia_cpu帶了blockage,但是invs沒有足夠的連接pin的routing resource,也就只能在maia_cpu上面去try了。

f4b00802-f4f7-11ee-a297-92fbcf53809c.png

修改辦法很簡單,具體操作option參見知識星球。

f4cfd736-f4f7-11ee-a297-92fbcf53809c.png

保存db,重新LVS,比對通過。

f4e9ba3e-f4f7-11ee-a297-92fbcf53809c.png

02

28nm Cortex-A7后端實戰(zhàn)

此外,我們提供全網(wǎng)最低價的28nm A7后端設計,價格驚喜!打垮動輒1.5w-2.5w的后端培訓價格!

f4ed9e7e-f4f7-11ee-a297-92fbcf53809c.png

我們再來對比下A72與A7的資源。A72Gate數(shù)目是A7的13倍!如果都采用28nm制程,A72的面積應該是1180790um^2,實際A72采用12nm制程面積是486100um^2,1180790/486100=2.4,符合摩爾定律。

Cortex-A7單核:

Gates=240291Cells=118421

Cortex-A72單核:

Gates=3125649Cells=1207766

28nmCortex-A7單核:

Area=90830.1um^2

12nmCortex-A72單核:

Area=486100.9um^2

28nm A7后端設計課程采用的全國最低價格來推廣,本文不做過多介紹,本文重點介紹下先進的12nm A72進階版本課程。

03

12nm Cortex-A72—DFT實戰(zhàn)

開發(fā)完成,全國最低價!

04

景芯SoC—全芯片UPF后端實戰(zhàn)

景芯SoC培訓的全芯片UPF低功耗設計(含DFT設計)

f4f3754c-f4f7-11ee-a297-92fbcf53809c.png

景芯SoC訓練營培訓項目,低功耗設計前,功耗為27.9mW。

f4f70842-f4f7-11ee-a297-92fbcf53809c.png

低功耗設計后,功耗為0.285mW,功耗降低98.9%!

f4facf04-f4f7-11ee-a297-92fbcf53809c.png

f504fd6c-f4f7-11ee-a297-92fbcf53809c.png

f508ffac-f4f7-11ee-a297-92fbcf53809c.png

7天沖刺PR訓練營有同學問如何給IO添加PAD?請思考景芯SoC的IO和PAD如何實現(xiàn)最佳?

f510e69a-f4f7-11ee-a297-92fbcf53809c.png

7天沖刺PR訓練營有同學問,同樣的floorplan,有些同學很快跑完,有些同學則遇到大量DRC問題(EDA工具不停iteration)導致工具始終無法跑完,具體什么問題呢?

f5157c50-f4f7-11ee-a297-92fbcf53809c.png

首先,小編發(fā)現(xiàn)該同學的stripe把TM2定義為了horizontal,而熟悉景芯工藝的同學知道,TM2的preference direction是VERTICAL。

f519990c-f4f7-11ee-a297-92fbcf53809c.png

查詢景芯的lef庫文件也可以確認:

f5203e06-f4f7-11ee-a297-92fbcf53809c.png

用錯方向有多大影響呢?大家上景芯SoC的后端flow實踐一下吧,實踐出真知。

7天沖刺PR訓練營有同學問,為啥PR花了一天一夜24個小時完成布線還大量DRC錯誤?小編已經(jīng)將設計規(guī)模盡可能減小以加速PR設計,實際上2小時就可以跑完routing,為何這么慢?原因就是低功耗單元的走線。具體原因及解決辦法歡迎加入景芯訓練營討論。

f52453ec-f4f7-11ee-a297-92fbcf53809c.png

其錯誤主要集中在M4上,請思考如何解決。

f5281efa-f4f7-11ee-a297-92fbcf53809c.png

7天沖刺PR訓練營有同學問,power switch cell的secondPG pin(VDDG)從M1接出的,而不是M2, 請思考有什么問題?如何解決?

f52ed466-f4f7-11ee-a297-92fbcf53809c.png

7天沖刺PR訓練營有同學問,景芯SoC培訓營同學遇到Corner Pad LVS不過怎么處理?

f53302ac-f4f7-11ee-a297-92fbcf53809c.png

完成景芯SoC培訓的前端設計仿真、DFT后,我們來到后端flow,本教程教你一鍵式跑完數(shù)字后端flow。

f539f864-f4f7-11ee-a297-92fbcf53809c.png

生成腳本命令如下:

tclsh ./SCRIPTS/gen_flow.tcl -m flat all

f53e263c-f4f7-11ee-a297-92fbcf53809c.png

生成flow腳本之前需要配置setup.tcl等相關參數(shù),具體參見【全網(wǎng)唯一】【全棧芯片工程師】提供自研的景芯SoC前端工程、DFT工程、后端工程,帶你從算法、前端、DFT到后端全流程參與SoC項目設計。

景芯SoC訓練營的同學問,為何innovus讀取做好的floorplandef文件報Error?首先看log:

f5421ecc-f4f7-11ee-a297-92fbcf53809c.png

Reading floorplan file - ./data_in/DIGITAL_TOP.def (mem = 1595.0M).

#% Begin Load floorplan data ... (date=10/23 2201, mem=1579.3M)

**ERROR: (IMPFP-710): File version unknown is too old.

以前EDI的時期,我們可以通過定義fp_file的方式來加載floorplan:

set vars(fp_file) "./data_in/DIGITAL_TOP.def"

但是現(xiàn)在innovus升級并放棄了fp_file的加載方式,當然也可以用老版本的EDI9.1及以前版本來加入fp_file,然后轉存為新版本,這方式明顯沒有必要。正如下log提示所說,檢查log是非常好的工程師習慣。

Input floorplan file is too old and is not supported in EDI 10.1 and newer.

You can use EDI 9.1 and before to read it in, then save again to create new version.

小編的直覺告訴我,先去看看同學保存的def文件是哪個def版本?

f548a080-f4f7-11ee-a297-92fbcf53809c.png

同學保存方式如下:

f54c65da-f4f7-11ee-a297-92fbcf53809c.png

那么請問如何解決?請大家加入景芯訓練營實踐。

景芯SoC用了很多異步FIFO,關注異步RTL實現(xiàn)的同學,可以抓取異步FIFO出來看一下版圖連線:

f5576566-f4f7-11ee-a297-92fbcf53809c.png

查看下所有異步FIFO cell的面積;

dbget [dbget top.insts.pstatus unplaced -p].area

查下所有異步FIFO的cell的名字:

dbget [dbget top.insts.pstatus unplaced -p].name

審核編輯:黃飛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11069

    瀏覽量

    216752
  • UPF
    UPF
    +關注

    關注

    0

    文章

    50

    瀏覽量

    13839
  • DVFS
    +關注

    關注

    1

    文章

    18

    瀏覽量

    12184

原文標題:2.5GHz頻率 hierarchy DVFS低功耗A72實戰(zhàn)

文章出處:【微信號:全棧芯片工程師,微信公眾號:全棧芯片工程師】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    ARM新一代Cortex-A73架構解析 千元機也能有高端SoC

    現(xiàn)在廣泛采用的 ARM 公版 CPU 架構主要有 A53、A57、A72 三種,其中 A53 偏重低功耗,性能相對較差,
    發(fā)表于 06-06 11:39 ?8135次閱讀
    ARM新一代Cortex-<b class='flag-5'>A</b>73架構解析 千元機也能有高端SoC

    A72核心的8QM上測試Windows 10,可以測試嗎?

    查看 Windows 10 IoT 發(fā)行說明,在支持的 H/W 列表中找不到 8QM MEK。 有客戶想在A72核心的8QM上測試Windows 10,可以測試嗎?
    發(fā)表于 04-25 07:10

    ARM Cortex?-A72 MPCore處理器技術參考手冊

    Cortex-A72處理器是一款實現(xiàn)ARMv8-A架構的高性能、低功耗處理器。 它在帶有L1和L2緩存子系統(tǒng)的單處理器設備中具有一到四個核心。 下圖顯示了四核Cortex-A72處理器
    發(fā)表于 08-25 06:27

    動態(tài)電壓與頻率調節(jié)在降低功耗中的作用

    摘要 目前,為了降低功耗,越來越多的芯片支持動態(tài)電壓與頻率調節(jié)DVFS(Dynamic Voltage and Frequency Scaling)。本文列舉了基于軟件和硬件的DVFS實現(xiàn),驗證了
    發(fā)表于 03-29 15:14 ?3153次閱讀
    動態(tài)電壓與頻率調節(jié)在降<b class='flag-5'>低功耗</b>中的作用

    基于蘋果Cortex A72 核心的全新 5nm 芯片介紹

    此外,為了保證前期 iPhone 12 使用,蘋果追加了臺積電的訂單,以確保自己能獲得足夠的產(chǎn)能。按照臺積電官方數(shù)據(jù),相較于 7nm(第一代 DUV),基于 Cortex A72 核心的全新 5nm
    發(fā)表于 08-10 11:34 ?1625次閱讀

    最新泄漏的明星是三星Galaxy A72

    預計Galaxy A72將于2021年初正式上市。據(jù)說,據(jù)稱該手機具有塑料后面板和鋁制框架,其屏幕將為6.7英寸??梢钥吹椒胖们爸脭z像頭的屏幕中間發(fā)生了變化。
    的頭像 發(fā)表于 12-19 09:59 ?1786次閱讀

    三星Galaxy A72渲染圖、價格曝光

    繼Galaxy A71及其5G產(chǎn)品獲得成功后,三星有望跟進Galaxy A72。目前,該機的多張渲染圖已經(jīng)出現(xiàn)在網(wǎng)絡上,Geekbench跑分也泄露了出來。而近日,有外媒曝光了這款手機的外殼模具。
    的頭像 發(fā)表于 01-06 10:18 ?2473次閱讀

    三星即將推出的中端產(chǎn)品之一是Galaxy A72智能手機

    如果事實果真如此,那么在A72上看到相同的電池容量(4,500mAh)也就不足為奇了。例如,與早期的傳言相反,Galaxy A72大多采用四鏡頭設置。除其他外,主要鏡頭據(jù)說是像A71一樣的64MP相機傳感器。
    的頭像 發(fā)表于 01-26 09:58 ?2423次閱讀
    三星即將推出的中端產(chǎn)品之一是Galaxy <b class='flag-5'>A72</b>智能手機

    三星Galaxy A72 4G即將正式發(fā)布

    支持頁面上的列表沒有透露有關手機的許多詳細信息,但確認了SM-A725F / DS型號。三星Galaxy A72在最近幾周內多次泄漏。據(jù)說該手機有5G和4G版本。
    的頭像 發(fā)表于 01-28 15:57 ?2467次閱讀

    三星Galaxy A72 4G有望配備高通Snapdragon 720G處理器

    Galaxy A72是它們中最強大的,也可能是最受歡迎的之一,應該會在4G和5G版本中投放市場,而且知道新設備可能還不遙遠。三星已經(jīng)在其俄羅斯支持頁面上列出了Galaxy A72 4G
    的頭像 發(fā)表于 02-02 15:34 ?2584次閱讀

    三星有望很快推出中檔Galaxy A52和Galaxy A72

    三星印度已經(jīng)打開了兩個新設備的支持頁面-SM-A525F / DS和SM-A725F / DS。如果您還記得的話,這些是先前報道提供的Galaxy A52和A72 。該設備可能是4G的
    的頭像 發(fā)表于 02-24 16:33 ?2290次閱讀

    基于UPF的低功耗數(shù)字后端設計實訓課

    帶UPF的低功耗設計流程中包括了前端VCS-NLP功能仿真,后端VC LP靜態(tài)驗證,以及在DC綜合和ICC2布局布線中低功耗單元的插入,例如level shifter,isolation cell
    的頭像 發(fā)表于 02-26 09:48 ?2779次閱讀

    Cortex-A72應用實戰(zhàn)

    下面Cortex-A72培訓營VIP學員問:單核CPU PR做完后,怎么輸出數(shù)據(jù)到TOP去做多核的hierarchy集成?
    的頭像 發(fā)表于 01-24 10:17 ?1186次閱讀
    Cortex-<b class='flag-5'>A72</b>應用<b class='flag-5'>實戰(zhàn)</b>

    12nm Cortex-A72后端實戰(zhàn)

    進階版本的低功耗設計如下:7個power domain
    的頭像 發(fā)表于 02-20 10:48 ?1184次閱讀
    12nm Cortex-<b class='flag-5'>A72</b><b class='flag-5'>后端</b><b class='flag-5'>實戰(zhàn)</b>

    淺析SoC芯片的DVFS技術

    DVFS(Dynamic Voltage and Frequency Scaling)即動態(tài)電壓頻率調節(jié)技術,是一種高效的低功耗技術,它通過動態(tài)調整工作電壓和時鐘頻率,以達到降低功耗的目的。
    的頭像 發(fā)表于 04-05 09:52 ?3588次閱讀
    淺析SoC芯片的<b class='flag-5'>DVFS</b>技術

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品