芯片性能優(yōu)化真的是零和博弈嗎?在設(shè)計過程中,我們應(yīng)該賭注押在哪里才能獲得性能的最優(yōu)解決方案?
所謂零和博弈又稱零和游戲(Zero-sum game),與非零和博弈相對,是博弈論的一個概念,屬非合作博弈,指參與博弈的各方,在嚴(yán)格競爭下,一方的收益必然意味著另一方的損失,博弈各方的收益和損失相加總和永遠(yuǎn)為“零”。雙方不存在合作的可能。
從芯片中榨出最后一點(diǎn)性能聽起來是個不錯的主意,但這會增加風(fēng)險和成本,也延長了開發(fā)時間,降低了產(chǎn)量,甚至可能限制芯片的運(yùn)行環(huán)境。
然而,鑒于開發(fā)過程的每一步所附加的裕度,顯然我們可以做出很多改進(jìn)。 Plunify公司業(yè)務(wù)發(fā)展副總裁Kirvy Teo表示:“只要時間足夠,每個設(shè)計都可以進(jìn)行優(yōu)化,但時間是奢侈品。折衷是一種零和游戲,克服這種困難是一項挑戰(zhàn)。”
在實(shí)踐中,看似簡單的理論遠(yuǎn)沒有那么簡單。
Open-Silicon公司芯片工程總監(jiān)Sureshbabu Kosuru表示:“設(shè)計團(tuán)隊?wèi)?yīng)該始終以實(shí)際性能指標(biāo)為目標(biāo),并在設(shè)計的早期階段對其進(jìn)行定義。為了滿足緊張的日程安排而投機(jī)取巧,會增加芯片日后遇到性能問題的風(fēng)險。設(shè)計團(tuán)隊?wèi)?yīng)該通過遵守代工廠和IP供應(yīng)商的建議來開發(fā)和實(shí)踐最好的方法,把裕度建立到芯片中,并在未來的項目進(jìn)度中計入這些開銷?!?/p>
這里的關(guān)鍵是,期望的性能水平必須是開發(fā)過程的一部分。
西門子公司設(shè)計驗證技術(shù)部門營銷總監(jiān)Neil Hand表示:“在執(zhí)行層面上推進(jìn)性能極限是非常有限的,而且風(fēng)險很高。此外,如果不考慮性能老化,那么就會像神話中的伊卡洛斯一樣,飛得離太陽太近了?!?/p>
圖1: 產(chǎn)品折衷 (來源:哥本哈根商學(xué)院)
部分問題在于,更新的技術(shù)可能存在一些問題,這些問題沒有被設(shè)計人員、工藝技術(shù)的開發(fā)人員,以及EDA行業(yè)的設(shè)計者完全理解并表述。Kosuru說:“設(shè)計團(tuán)隊?wèi)?yīng)該意識到最新的技術(shù)變化及其不良影響。他們可能需要額外的分析或改進(jìn)方法來應(yīng)對這些變化。代工廠應(yīng)定期更新客戶關(guān)于工藝成熟度和裕度的信息,以便挑戰(zhàn)設(shè)計裕度不會因為延長工藝周期而損害設(shè)計?!?/p>
裕度有很多來源。ANSYS半導(dǎo)體事業(yè)部首席技術(shù)專家Joao Geada列出了一個運(yùn)營清單:
用于補(bǔ)償設(shè)計角度之外出現(xiàn)的效應(yīng)的裕度。例如,鎖相環(huán)抖動、封裝與電路板的RLC諧振。
允許制造工藝與工藝模型之間的差異的裕度。“設(shè)計需要時間來創(chuàng)建,代工工藝也在不斷發(fā)展。在設(shè)計周期后期采用最新的代工模型通常過于昂貴,所以要為模型與將要生產(chǎn)的產(chǎn)品之間的差異留出裕度空間。從基本上講,你可以通過損失一些PPA來獲得更可預(yù)測的制造工藝和產(chǎn)量。 ”
在傳統(tǒng)的電源/地(pg)網(wǎng)格設(shè)計中進(jìn)行的補(bǔ)充。“傳統(tǒng)方法假定pg需要均勻分布,而不考慮功率需求取決于設(shè)計的局部性質(zhì)。例如,有些區(qū)域比其他區(qū)域更耗電。但是傳統(tǒng)流程有pg和時序解耦, 因此兩者都不能利用或影響另一個。 在傳統(tǒng)流程中,整個pg網(wǎng)格被設(shè)計成特定的最大。
避免先前“遺漏的缺陷”的裕度。“大多數(shù)大公司都制造了糟糕的硅片,并對其進(jìn)行了調(diào)試。在某些情況下,遺漏的缺陷不能用現(xiàn)有的解決方案來解決,因此,為了避免未來的缺陷,需要把悲觀估計添加到流程中。隨著工具變得越來越好,其中一些裕度變成了歷史性的補(bǔ)充,從而不再合理。
用來解決效應(yīng)之間的相互作用的補(bǔ)充?!按蠖鄶?shù)現(xiàn)有的解決方案都是針對單個物理問題,而不是處理效應(yīng)之間的相互作用?!?/p>
Geada還列舉了一些經(jīng)常不被考慮的相互作用的例子,包括:
依賴于波形效應(yīng)的約束?!办o態(tài)時序分析(STA)無法模擬這些效應(yīng)?,F(xiàn)有的標(biāo)準(zhǔn)單元設(shè)計描述了約束條件,卻沒有任何關(guān)于設(shè)計效應(yīng)的知識。(在低電壓下,這種效應(yīng)可以達(dá)到+-50%。)
變化幅度。這會影響擺動和延遲,而擺動幅度會影響延遲和延遲幅度,但是STA無法模擬它們之間的相互關(guān)系。
IR下降和時序的相互作用。它們相互依賴,但傳統(tǒng)流程將它們模擬為非相關(guān)效應(yīng)。
溫度變化。在大型SoC中,溫度變化不是恒定的數(shù)值,但在傳統(tǒng)的基于角點(diǎn)特征的解決方案中,它就是這樣模擬的。
重要的第一步是了解設(shè)計要適用在什么樣的市場和環(huán)境中。Open-Silicon公司的Kosuru表示:“對于STA工程師來說,了解芯片的功能和設(shè)計需要適用的環(huán)境條件非常重要。例如,如果設(shè)計不是為了在0°C以下工作,那么讓設(shè)計接近標(biāo)準(zhǔn)的-40°C溫度就毫無意義。在較低的技術(shù)節(jié)點(diǎn)(28nm及以下)中,這意味著由于逆溫現(xiàn)象,我們可以將設(shè)計性能提高至少7%至10%。這里的折衷是,IP供應(yīng)商,包括標(biāo)準(zhǔn)單元的IP供應(yīng)商,愿意為我們所希望的溫度提供特征庫,而他們僅僅是為了大量投資而已。這通常會對設(shè)計收斂造成不利影響?!?/p>
關(guān)注點(diǎn)分離
EDA流程中的許多工具都是隨著遇到特定問題和發(fā)現(xiàn)解決方案而演變的。這導(dǎo)致工具常常用來單獨(dú)處理每個問題。設(shè)計團(tuán)隊也是如此。
ANSYS公司CPS解決方案高級產(chǎn)品經(jīng)理Youngsoo Lee表示:“按照傳統(tǒng)的基于各自獨(dú)立的設(shè)計方法,芯片、封裝、電路板和系統(tǒng)設(shè)計人員使用預(yù)先確定的裕度來設(shè)計其特定組件。這些設(shè)計是由單獨(dú)的團(tuán)隊,甚至單獨(dú)的公司完成的,他們之間的溝通很少。另外,現(xiàn)有的工具限制了每個設(shè)計團(tuán)隊每次只能分析和解決單一物理量(時間、功率、溫度等),而不會看到多個物理量之間的相互作用。單獨(dú)設(shè)計和分析每個組件顯然是不夠的,一次只考慮單一的物理量同樣也不可取?!?/p>
許多工具也簡化了這個過程,或者做出了可能的悲觀假設(shè)。ANSYS半導(dǎo)體事業(yè)部產(chǎn)品營銷經(jīng)理Annapoorna Krishnaswamy表示:“傳統(tǒng)的統(tǒng)一過度設(shè)計電網(wǎng)的方法,在較老的工藝技術(shù)中運(yùn)行良好,但由于嚴(yán)格的布線限制,在先進(jìn)的技術(shù)節(jié)點(diǎn)上無法使用。這可能會導(dǎo)致未來的時序收斂問題。對于高級finFET技術(shù)工藝,電網(wǎng)節(jié)點(diǎn)數(shù)量很大,任何節(jié)點(diǎn)數(shù)量的減少都會導(dǎo)致精度損失。由于設(shè)計裕度非常小,因此,功率驗收解決方案必須非常精確,否則可能導(dǎo)致產(chǎn)品失敗。對整個電網(wǎng)進(jìn)行分析是非常重要的,不能采用‘分而治之’的方法來分割設(shè)計,否則會導(dǎo)致不準(zhǔn)確。這種分析完全忽略了電網(wǎng)覆蓋的完整芯片環(huán)境?!?/p>
改變模型
隨著時間的推移,行業(yè)使用的模型已經(jīng)改變。考慮到在20世紀(jì)80年代,所有重大的延遲都與門有關(guān),導(dǎo)線是不受約束的。如今,情況幾乎完全相反。于是導(dǎo)線被模擬為RC模型,今天我們發(fā)現(xiàn)這可能還不夠好。擁有舊范式最暢銷工具的公司不愿改變,用戶同樣不愿改變,直到有錯誤出現(xiàn)。
互連的重要性不可忽視。Helic公司營銷副總裁Magdy Abadir指出:“嵌入所有緩沖中繼器的全局互連往往消耗芯片總功率的60%,主要的互連網(wǎng)絡(luò),如電源和時鐘分配網(wǎng)絡(luò)和寬總線,是故障機(jī)制的來源,包括抖動、電遷移、功率分配的下降和耦合噪聲。因此,尖端芯片的性能和風(fēng)險規(guī)避都是互連建模和設(shè)計的非常強(qiáng)大的功能?!?/p>
在芯片設(shè)計方面,電感是個丑小鴨。開羅美國大學(xué)納米電子學(xué)和器件中心主任Yehea Ismail解釋說:“從歷史上看,互連已經(jīng)被廣泛地建模為RC網(wǎng)絡(luò)。磁效應(yīng)(電感和電感耦合)在很大程度上被忽略和抑制,因此可以使用現(xiàn)有的工具。忽略磁效應(yīng)主要是一種簡化思考和追趕上市時間的決定,通常是由極端的裕度和抑制感抗效應(yīng)的設(shè)計方法來進(jìn)行驗證。然而,這種設(shè)計方法正變得越來越難以驗證,甚至難以維持,因為頻率的提高幾乎肯定會很快發(fā)生,SoC也越來越復(fù)雜。”
一個邏輯問題是,在功率和延遲方面,忽視感抗效應(yīng)的成本有多大?Abadir說:“我們已經(jīng)看到設(shè)計需要付出巨大的功率和性能損失,以適應(yīng)現(xiàn)有的基于RC的工具。例如,在總線上使用差分開關(guān),并把攜帶相反的開關(guān)信號的線路布線在彼此相鄰的位置。這種方法有效地減少了電感耦合的范圍和幅度。因為相反的電流彼此接近會產(chǎn)生相反的磁場,從而相互抵消。然而,相對于單線開關(guān)或兩根有源耦合導(dǎo)線的平均開關(guān)的情況,彼此相鄰的反向開關(guān)導(dǎo)線消耗的功率是它們之間的耦合電容消耗功率的4倍。此外,延遲是單線開關(guān)的兩倍。”
Ismail說得很直白?!半姼袑?shí)際上是一種有用的元件,電阻對性能是有害的。電感是一種本身不消耗功率的電抗元件,而電阻是一種消耗功率的有源元件。兩種元件總是在互連網(wǎng)絡(luò)中串聯(lián)出現(xiàn),抑制電感總是會因為電阻效應(yīng)的提升而導(dǎo)致更多的損耗?!?/p>
新方法
放寬其他約束可以克服許多性能極限。Movellus公司首席執(zhí)行官M(fèi)uhammad Faisal表示:“我們正在討論給定功率的抖動,這永遠(yuǎn)是一種折衷。如果你想要更小的抖動,那就消耗更多的能量??蛻粝M麅?yōu)化他們的SoC,并愿意放棄一點(diǎn)抖動,如果這樣能讓他們在其他方面不受約束,并帶來潛在的功率優(yōu)化的話。在SoC中,你可能會在角落里有一個鎖相環(huán),然后你在芯片上傳輸高頻信號,結(jié)果是,你在時鐘樹中積累了大量的抖動。所有與開關(guān)有關(guān)的噪聲都被添加到時鐘中。如果你可以合成鎖相環(huán),你就可以把它們放在使用時鐘的模塊旁邊,這樣就可以消除抖動了?!?/p>
你知道的越多,設(shè)計就會表現(xiàn)得越好。 Moortec公司首席執(zhí)行官Stephen Crosher表示:“一種推動性能極限的方法是,通過對影響器件性能的動態(tài)變量進(jìn)行嵌入式監(jiān)控來最小化風(fēng)險,例如PVT(工藝、電壓、溫度)。IC和SoC設(shè)計人員擁有了監(jiān)控影響芯片性能的參數(shù),以及監(jiān)控在溫度和電壓應(yīng)力下的電路失效的能力,便可以構(gòu)建更加高效、高性能和高性價比的產(chǎn)品?!?/p>
Crosher解釋了提高性能的方法?!扒度胧奖O(jiān)控為片內(nèi)控制器提供更新,這有助于記錄和解釋結(jié)果。許多應(yīng)用都可以使用這種兩級體系結(jié)構(gòu),從產(chǎn)品測試中的片內(nèi)參數(shù)的一次性分析,到處理器核心和內(nèi)存的實(shí)時主動管理,從而避免局部老化效應(yīng),并在給定的電壓和溫度點(diǎn)上最優(yōu)化性能?!?/p>
工具也可以改變。Plunify公司的Teo表示:“一種解決辦法就是機(jī)器學(xué)習(xí)。使用機(jī)器學(xué)習(xí)實(shí)際上類似于使用蠻力來處理大量數(shù)據(jù)。然而,機(jī)器學(xué)習(xí)的關(guān)鍵區(qū)別在于,你可以更早地訓(xùn)練模型,以提高它的準(zhǔn)確性并進(jìn)行保存,并在需要的時候使用它。坐標(biāo)軸開始從‘運(yùn)行時間vs QoR’演化為‘?dāng)?shù)據(jù)vs QoR’。能夠積累和分析的數(shù)據(jù)越多,預(yù)測模型就越好??梢灶A(yù)測問題或預(yù)測性能的工具可以在糟糕的設(shè)計選擇上節(jié)省寶貴的迭代。最終,這將是優(yōu)秀設(shè)計和平庸設(shè)計之間的區(qū)別。”
新的電路技術(shù)也可以改變一些長期以來的看法。Faisal表示:“數(shù)字設(shè)計師總是用固定頻率和電壓設(shè)計他們的模塊,因為頻率來自于鎖相環(huán)的設(shè)計,而模擬被認(rèn)為是黑魔法。你必須假定這個頻率,然后用這個頻率進(jìn)行時序收斂。當(dāng)你可以使用數(shù)字方法來實(shí)現(xiàn)數(shù)字鎖相環(huán)時,你便可以開始對約束數(shù)字模塊的因素(即頻率和裕度)進(jìn)行協(xié)同優(yōu)化,并且可以對它們一起進(jìn)行協(xié)同優(yōu)化。這就開辟了額外的設(shè)計空間,從而實(shí)現(xiàn)更多的優(yōu)化?!?/p>
有時候最艱難的教訓(xùn)是我們不愿意聽到的。西門子公司的Hand表示:“作為一個行業(yè),我們一直被推動接近裕度——這是人之常情。但是,這并不是要取得巨大收益的地方。正如他們所言,‘在裕度邊緣徘徊。’真正的性能是在系統(tǒng)級別設(shè)計和驗證的?!?/p>
Hand表示:“系統(tǒng)級的性能分析,以及一個跨越模擬、仿真和原型的統(tǒng)一驗證和驗證平臺,可以在設(shè)計過程中盡早考慮性能折衷,并隨著設(shè)計實(shí)現(xiàn)的不斷完善在軟硬件方面不斷進(jìn)行完善?!?/p>
他們都有一個共同點(diǎn):你的知識越多,做出的決定就越好。當(dāng)信息被故意忽略時,其含義必須是清楚的。否則,你最好增加足夠的裕度來彌補(bǔ)。
-
芯片
+關(guān)注
關(guān)注
456文章
51016瀏覽量
425317 -
電感
+關(guān)注
關(guān)注
54文章
6147瀏覽量
102520 -
低電壓
+關(guān)注
關(guān)注
5文章
128瀏覽量
29862
發(fā)布評論請先 登錄
相關(guān)推薦
評論