作者:Ken Brock,Synopsys產(chǎn)品市場(chǎng)營(yíng)銷經(jīng)理
TSMC最近宣布其第四代主要16納米工藝,即16FFC(16納米FinFET緊湊版), 進(jìn)入批量生產(chǎn)。該工藝提供了一種簡(jiǎn)單的從28納米工藝進(jìn)行轉(zhuǎn)移的方式,它具有優(yōu)異的性能、功耗和面積方面的優(yōu)點(diǎn)。為了在該工藝上開(kāi)發(fā)最具競(jìng)爭(zhēng)力的片上系統(tǒng)(SOC),設(shè)計(jì)人員必須選擇優(yōu)化的基礎(chǔ)IP構(gòu)件(嵌入式存儲(chǔ)器和標(biāo)準(zhǔn)單元庫(kù)),以實(shí)現(xiàn)最高的SOC性能,以及最低的功耗和面積。通過(guò)將16FFC工藝和正確基礎(chǔ)IP組合,設(shè)計(jì)人員能夠?yàn)槎喾N應(yīng)用開(kāi)發(fā)SOC,從高端綠色服務(wù)器和網(wǎng)絡(luò)處理器到超低功耗移動(dòng)裝置、消費(fèi)產(chǎn)品、可穿戴產(chǎn)品,以及介于中間的任何產(chǎn)品。
在本文中,介紹了設(shè)計(jì)人員可采取的七種方式,采用它們,設(shè)計(jì)人員能夠利用這一新工藝的優(yōu)點(diǎn),以及最先進(jìn)的邏輯庫(kù)和存儲(chǔ)器編譯器技術(shù),對(duì)其SOC的性能、功耗和面積進(jìn)行優(yōu)化。
1、與28納米技術(shù)相比,利用16納米技術(shù)的摩爾定律縮小比例,設(shè)計(jì)人員能夠改善SOC的面積。
2、FinFET提供了較高的每單位面積飽和電流,這意味著可以通過(guò)不同的電路拓?fù)鋪?lái)改善性能,從而使用較小的邏輯單元來(lái)收斂關(guān)鍵定時(shí)路徑。
3、與28納米相比,F(xiàn)inFET的漏電流更低,但是,由于fin的輸入電容增加,消耗的動(dòng)態(tài)功耗相對(duì)較高。
4、標(biāo)準(zhǔn)單元架構(gòu)能夠利用創(chuàng)新的工藝技術(shù)(continuous poly),借助于使用與邏輯庫(kù)共同優(yōu)化的物理設(shè)計(jì)工具,產(chǎn)生最密集的布圖,以節(jié)省面積和功耗。
5、布線性好的高扇入標(biāo)準(zhǔn)單元,和具有多種延遲時(shí)間、多種建立時(shí)間和多位觸發(fā)器(MBFF)的時(shí)序單元,使得設(shè)計(jì)人員能夠優(yōu)化其處理器核的性能和功耗。
6、具有多種位元、多種外圍VT和創(chuàng)新的功耗管理特性的多種存儲(chǔ)器編譯器。
7、將創(chuàng)新的工藝技術(shù)、庫(kù)設(shè)計(jì)能力、最新的EDA工具創(chuàng)新和流程結(jié)合在一起,SOC設(shè)計(jì)人員能夠利用自己的設(shè)計(jì)技能,開(kāi)發(fā)出具有最高性能、最低硅片成本和最低功耗的設(shè)計(jì)。
工藝縮放
作為摩爾定律和經(jīng)典Dennard縮放的一部分,16FFC工藝提供了更小的晶體管間距(contacted poly pitch或CPP)和更小的互連金屬間距(線到線,過(guò)孔到線,以及過(guò)孔到過(guò)孔)以利于布線,提供了更小的位單元以減少面積。優(yōu)化的IP布圖創(chuàng)新能利用這些更小設(shè)計(jì)規(guī)則,同時(shí)還能處理16納米技術(shù)帶來(lái)的挑戰(zhàn),包括因更細(xì)導(dǎo)線而致的較高線電阻,以及信號(hào)線和電網(wǎng)的電遷移。必須在IP架構(gòu)和IP驗(yàn)證方面解決這些挑戰(zhàn)。如圖1所示,與28納米技術(shù)相比,使用優(yōu)化的基礎(chǔ)IP時(shí),16FFC能夠提供兩倍以上的面積收益和至少30%的性能改進(jìn)。
圖1:面積-性能,28納米-16納米,CPU
FinFET提供了較高的每單位面積飽和電流,這意味著可以通過(guò)不同的電路拓?fù)鋪?lái)改善性能,從而使用較小的邏輯單元來(lái)收斂關(guān)鍵定時(shí)路徑。
Reduced Gate Leakage but Increased Dynamic Power
16FFC提供了豐富的電壓閾值(VT)和溝道長(zhǎng)度,涵蓋廣泛的性能/漏電范圍。在圖2中,給出了邏輯門性能-漏電(對(duì)數(shù)尺度)圖,其中顯示了通過(guò)在多個(gè)VT/溝道長(zhǎng)度上使用針腳相容的標(biāo)準(zhǔn)單元來(lái)實(shí)現(xiàn)設(shè)計(jì)權(quán)衡。
圖2:每種VT和溝道長(zhǎng)度的相對(duì)性能-相對(duì)漏電,7.5軌(T)超高密度
許多移動(dòng)和物聯(lián)網(wǎng)(IOT)設(shè)備大多數(shù)時(shí)間處于待機(jī)或睡眠狀態(tài),這時(shí)唯一的功耗為漏電功耗。FinFET的一個(gè)主要優(yōu)點(diǎn)在于,它們能在很低的電壓下工作,當(dāng)然相關(guān)的性能也會(huì)降低。漏電流大體上與供電電壓成正比,漏電流節(jié)省在低電壓下很可觀。
總功耗由動(dòng)態(tài)功耗和漏電功耗組成。與28納米或其他節(jié)點(diǎn)相比,F(xiàn)inFET的漏電更低,但由于fin的輸入電容和飽和電流增加,它會(huì)消耗較高的動(dòng)態(tài)功耗。在28納米SOC的設(shè)計(jì)范例下,這類在相對(duì)漏電-動(dòng)態(tài)功耗方面的變化會(huì)產(chǎn)生較大差異。在圖3中,顯示了從180納米到16納米,漏電功耗占總SOC功耗的百分比。在16FFC,這會(huì)大大減少設(shè)計(jì)人員在減小漏電方面的壓力,但會(huì)將更多注意力放在降低動(dòng)態(tài)功耗方面。
圖3:從180納米到16納米漏電功耗占總SOC功耗的百分比
管理動(dòng)態(tài)功耗= CFV2
由于應(yīng)用規(guī)范對(duì)SOC性能具有強(qiáng)制要求,可由設(shè)計(jì)人員控制的動(dòng)態(tài)功耗源包括,通過(guò)積極使用時(shí)鐘門控來(lái)管理開(kāi)關(guān)頻率,將電容最小化,并將工作電壓將至最低。使用密集的優(yōu)化布圖和較短的走線,可將布線電容將至最低(通過(guò)使用在給定頻率給定功能下具有最佳單元高度的優(yōu)化庫(kù),可將輸入電容最小化)。標(biāo)準(zhǔn)單元可按照多種高度來(lái)構(gòu)建(3fin、4fin和5fin),從而在性能和可靠性方面與設(shè)計(jì)模塊的目標(biāo)頻率相匹配。在圖4中,顯示了三種不同軌道高度下(7.5T、9T、10.5T)1X驅(qū)動(dòng)反相器的輸入電容。其他單元具有類似趨勢(shì)。
圖4:各種標(biāo)準(zhǔn)單元架構(gòu)下1X反相器的輸入電容
對(duì)于同一個(gè)模塊,使用超高密度(UHD)7.5軌道庫(kù)時(shí),與高密度(HD)9軌道庫(kù)相比,并不具有最高的性能,但由于降低了器件電容,功耗會(huì)降低25%左右,具體情況取決于模塊的功能和頻率。此外,當(dāng)降低模塊的電壓時(shí),動(dòng)態(tài)功耗的降低因數(shù)為V2。在圖5中,給出了不同額定電壓下模塊的漏電功耗(虛線)和動(dòng)態(tài)功耗(實(shí)線)圖。低壓下降低的動(dòng)態(tài)功耗歸因于V2分量。
圖5:多個(gè)額定電壓下的性能-漏電和動(dòng)態(tài)功耗
顯著改善模塊性能、功耗和面積的邏輯庫(kù)設(shè)計(jì)
將新的TSMC 16FFC工藝與優(yōu)化布圖以及創(chuàng)新的邏輯庫(kù)電路設(shè)計(jì)結(jié)合在一起,可為通過(guò)綜合和布局布線從RTL創(chuàng)建數(shù)字邏輯模塊的設(shè)計(jì)工程師提供數(shù)項(xiàng)優(yōu)點(diǎn)。布線后的模塊密度對(duì)于降低硅片面積和節(jié)省功耗十分關(guān)鍵。
針對(duì)最小SOC面積和最低總功耗的高效布圖
標(biāo)準(zhǔn)單元設(shè)計(jì)是一個(gè)復(fù)雜的過(guò)程,其中,每一個(gè)電路元件、布圖特性或折中均會(huì)對(duì)性能、功耗、面積(PPA)和可制造性產(chǎn)生重大影響。充分利用工藝特性如CPODE(continuous poly on diffusion edge),與使用PODE(poly on diffusion edge)的設(shè)計(jì)相比,能夠使布線后模塊小5%,從而得到最小的布線后模塊面積和最小的總功耗。
組合單元
優(yōu)化寄存器-寄存器路徑需要豐富的標(biāo)準(zhǔn)單元庫(kù),包括合適的功能、驅(qū)動(dòng)強(qiáng)度和實(shí)現(xiàn)種類。一套豐富的優(yōu)化功能(NAND, NOR, AND, OR, inverter, buffers, XOR, XNOR, MUX, adders, compressors 等)對(duì)于綜合出優(yōu)化的電路而言十分必要。需使用優(yōu)化布圖技術(shù)以便最大程度利用最新的布線算法來(lái)消除阻塞。先進(jìn)的綜合和布局布線工具能夠利用豐富的驅(qū)動(dòng)強(qiáng)度集合,來(lái)對(duì)由設(shè)計(jì)拓?fù)浜蛦卧g物理距離產(chǎn)生的不同的扇出和負(fù)載進(jìn)行優(yōu)化處理。
時(shí)序單元
觸發(fā)器的建立時(shí)間加上延遲時(shí)間有時(shí)被稱為“死區(qū)”或“黑洞”時(shí)間。與時(shí)鐘不確定性類似,該時(shí)間會(huì)消耗每一時(shí)鐘周期內(nèi)的時(shí)間,而這些時(shí)間本應(yīng)用于執(zhí)行有用的計(jì)算工作。需要用到多套高性能觸發(fā)器,以便對(duì)這類死區(qū)時(shí)間進(jìn)行優(yōu)化管理。延遲時(shí)間優(yōu)化觸發(fā)器(多延遲時(shí)間觸發(fā)器)快速將信號(hào)送入關(guān)鍵路徑邏輯簇,建立時(shí)間優(yōu)化觸發(fā)器(多建立時(shí)間觸發(fā)器)捕獲寄存器,從而延長(zhǎng)可用時(shí)鐘周期。通過(guò)對(duì)綜合和布線優(yōu)化工具進(jìn)行有效約束,我們能夠使用這些多建立時(shí)間/多延遲時(shí)間觸發(fā)器集合來(lái)實(shí)現(xiàn)最大速度,從而獲得15-20%的性能提升。
顯著改善PPA的存儲(chǔ)器編譯器設(shè)計(jì)
DesignWare?存儲(chǔ)器編譯器針對(duì)低功耗、高性能和高密度進(jìn)行了優(yōu)化,它提供了多種先進(jìn)的功耗管理特性,如輕度睡眠、深度睡眠、關(guān)機(jī)、雙供電軌道、寫輔助等,使得設(shè)計(jì)人員能夠滿足當(dāng)今SOC嚴(yán)格的低功耗要求。DesignWare存儲(chǔ)器編譯器與DesignWare STAR Memory System?緊密結(jié)合在一起,提供了集成的嵌入式存儲(chǔ)器測(cè)試解決方案來(lái)檢測(cè)并修復(fù)制造故障,從而達(dá)到最高可能的良率,同時(shí)將對(duì)芯片面積的影響將至最低。DesignWare存儲(chǔ)器編譯器在數(shù)以十億計(jì)的量產(chǎn)芯片上得到了驗(yàn)證,這使得設(shè)計(jì)人員能夠降低風(fēng)險(xiǎn)并縮短面市時(shí)間。
圖6:用于各種應(yīng)用的多種DesignWare存儲(chǔ)器編譯器
總結(jié)
TSMC的16FFC工藝改進(jìn)了工藝規(guī)則和變異性,以實(shí)現(xiàn)更小的設(shè)計(jì)、更高的性能和更低的功耗。如果擁有充分利用這些新工藝能力的邏輯庫(kù)和嵌入式存儲(chǔ)器,領(lǐng)先的綜合和布局布線工具就能夠最大程度地利用這些工藝改進(jìn)來(lái)滿足嚴(yán)格的設(shè)計(jì)規(guī)范。Synopsys 的DesignWare邏輯庫(kù)和領(lǐng)先的EDA工具、存儲(chǔ)器編譯器以及齊全的接口IP采用了相應(yīng)設(shè)計(jì),使得SOC設(shè)計(jì)人員能夠挑戰(zhàn)性能、面積和功耗極限,并充分利用新工藝的能力來(lái)實(shí)現(xiàn)具有最小的面積和最高的兆赫/毫瓦的SOC。
評(píng)論
查看更多