電子供應(yīng)鏈中的所有利益相關(guān)者都依賴于他們買賣的復(fù)雜組件的可靠性。但隨著芯片技術(shù)的進步,測試所有可能的質(zhì)量問題變得更具挑戰(zhàn)性。例如,蘋果的A17 Pro SoC擁有190億個晶體管和一個6核CPU,其中兩個高性能內(nèi)核采用了新的臺積電3納米技術(shù)。當組件直接銷售或通過授權(quán)渠道銷售時,半導(dǎo)體制造商保證其芯片的性能。
10納米以下晶圓廠生產(chǎn)的新處理器出現(xiàn)了更多的質(zhì)量問題——有些在常規(guī)測試中很難檢測出來。制造商和原始設(shè)備制造商在最終用戶投訴后才發(fā)現(xiàn),不得不更換整個設(shè)備并推遲生產(chǎn)。
一些小故障仍然是個謎。2015年,一群來自多倫多大學(xué)的計算機科學(xué)家IEEE頻譜報告超過4%的谷歌云計算服務(wù)器被之前任何測試都沒有檢測到的錯誤擊中,導(dǎo)致服務(wù)器意外停止。
然后,在2020年,AMD發(fā)表了一份報告有證據(jù)表明,當時最先進的芯片比上一代同類產(chǎn)品的可靠性低5.5倍。越來越多的人一致認為,隨著每一代半導(dǎo)體的出現(xiàn),這個問題正在成倍增長,尤其是在最先進的芯片中。
2021年,臉書和谷歌的研究人員發(fā)表了描述計算機硬件故障的研究,這些故障的原因不容易確定。他們認為,問題不在于軟件,而在于不同公司生產(chǎn)的計算機硬件的某個地方。
“我們的冒險始于警惕的制作團隊越來越多地抱怨累犯機器破壞數(shù)據(jù),”谷歌工程師彼得·霍奇斯爾德在一次視頻已呈現(xiàn)在操作系統(tǒng)熱點話題(Hot Topics in Operating Systems)2021大會上。
Hochschild和他的團隊推測,“性能和密度正在超過硅的可靠性,復(fù)雜性正在超過測試方法?!?/p>
摩爾定律與功耗
1974年,美國工程師和發(fā)明家羅伯特·h·丹納德與人合著了一部紙認為隨著晶體管變得越來越小,它們的功率密度保持不變,因此功耗與面積成比例。
根據(jù)摩爾定律,晶體管數(shù)量每兩年翻一番,芯片尺寸保持不變,而Dennard scaling則表示,給定面積的總芯片功率在不同代的工藝中保持不變。
英特爾、AMD、臺積電和其他公司一直在利用這兩條定律制造更快、更小的處理器,從而實現(xiàn)了當前的移動計算生態(tài)系統(tǒng)。當前的筆記本電腦、平板電腦,尤其是智能手機,之所以成為可能,是因為它們在相同的面積上封裝了更多的晶體管,而同樣的性能需要更少的功率。
不幸的是,對于半導(dǎo)體行業(yè)和原始設(shè)備制造商來說,Dennard scaling不再有效?!?974年,丹納德的標度法則被發(fā)現(xiàn),并一直保持了30多年,直到2005年左右,”克里斯蒂安·馬丁教授說奧格斯堡應(yīng)用科學(xué)大學(xué)的教授說:“在2005年之前,器件結(jié)構(gòu)大于65納米時,漏電流可以忽略不計。”
根據(jù)內(nèi)存制造商Rambus的說法,“業(yè)界普遍認為,Dennard縮放定律在2005-2007年間的某個時候失效了。正如馬丁所證實的那樣,由于閾值和工作電壓無法再調(diào)整,因此不可能在保持各代產(chǎn)品功率包絡(luò)不變的同時實現(xiàn)潛在的性能提升?!?/p>
事實上,正如馬丁所展示的那樣,在相同的芯片面積下,后Dennard縮放導(dǎo)致每代功耗增加2倍,芯片計算資源的使用減少。對于給定的芯片面積,每一代的能效只能提高40%。
收益率下降;耗電量增加了
摩爾第二定律,也叫洛克定律(以亞瑟·洛克命名)指出半導(dǎo)體制造廠也會隨著時間呈指數(shù)增長。
隨著密度和復(fù)雜性的增加,生產(chǎn)可用芯片的成本增加。一些半導(dǎo)體制造商正花費數(shù)十億美元購買新工具,尤其是阿斯麥***。
此外,由于Dennard擴展已經(jīng)死亡,芯片設(shè)計人員必須創(chuàng)建更多的專用內(nèi)核來補償更高的功耗。這對于云計算和人工智能應(yīng)用尤其重要,在這些應(yīng)用中,電源使用效率(PUE)是效率和可持續(xù)性的最終衡量標準。
最近,華為推出了新的旗艦智能手機Mate 60 Pro,據(jù)報道,它包括由中國半導(dǎo)體制造國際公司(SMIC)明確開發(fā)的新5G麒麟9000s處理器。最初,華為沒有發(fā)布這款設(shè)備的全部規(guī)格,但是拆卸顯示其采用7納米技術(shù)。直到最近,人們還認為沒有一家中國制造商擁有制造如此大規(guī)模芯片的工具。
“一些研究公司預(yù)測SMIC的7納米工藝成品率低于50 %,與90%或更高的行業(yè)標準相比,低產(chǎn)量將限制出貨量在200-400萬片左右,不足以讓華為恢復(fù)其以前在智能手機市場的主導(dǎo)地位,”路透社報道。
測試復(fù)雜的芯片需要新的工具
在對創(chuàng)新的不懈追求中,半導(dǎo)體行業(yè)已經(jīng)達到了前所未有的里程碑,芯片使用5納米和3納米內(nèi)核。然而,這種顯著的進步也帶來了令人擔(dān)憂的副作用:芯片故障率不斷上升。
在這種情況下,對前沿半導(dǎo)體進行全面、持續(xù)的可靠性測試的需求從未像現(xiàn)在這樣明顯。從過去的失敗中吸取的教訓(xùn),如谷歌、AMD、臉書和其他公司所強調(diào)的,強調(diào)了應(yīng)對這些挑戰(zhàn)的緊迫性。
審核編輯:黃飛
-
芯片
+關(guān)注
關(guān)注
456文章
50908瀏覽量
424444 -
摩爾定律
+關(guān)注
關(guān)注
4文章
634瀏覽量
79084 -
芯片設(shè)計
+關(guān)注
關(guān)注
15文章
1023瀏覽量
54924 -
晶體管
+關(guān)注
關(guān)注
77文章
9702瀏覽量
138412 -
半導(dǎo)體制造
+關(guān)注
關(guān)注
8文章
410瀏覽量
24077
發(fā)布評論請先 登錄
相關(guān)推薦
評論