AI 服務(wù)器是專門為運行人工智能算法和處理大規(guī)模數(shù)據(jù)而設(shè)計的高性能計算機,它們通常 具備高處理能力、大內(nèi)存和高速存儲器、多核心處理器、高速網(wǎng)絡(luò)接口等特點,能夠應(yīng)對復(fù) 雜的計算任務(wù)和大數(shù)據(jù)量的處理任務(wù)。 AI 服務(wù)器中 PCB 價值量的提升主要體現(xiàn)在以下幾個模塊:GPU 加速卡(OAM),主要由 GPU 芯片、內(nèi)存芯片、電源模塊、散熱器等部件組成,通過 PCB 板 來連接和傳輸信號。GPU 加速卡可以分為兩種類型:SXM 版本和 PCIE 版本。SXM 版本是指使 用 NVIDIA 公司開發(fā)的 SXM 接口連接 GPU 芯片和主板的加速卡;PCIE 版本是指使用標準的 PCIE 接口連接 GPU 芯片和主板的加速卡。SXM 版本相比 PCIE 版本具有更高的帶寬和更低的 延遲,但也需要更高級別的 PCB 板和散熱系統(tǒng)。
先進的 GPU 加速卡需要使用 5 階 20 層或以上的 HDI 板,HDI 板是高密度互連板的簡稱,它是 一種通過激光鉆孔或微細加工技術(shù),在普通 PCB 板上形成微小的孔徑或線寬,從而實現(xiàn)更高 層次、更密集的布線和連接的 PCB 板。HDI 板可以提高信號完整性、降低電磁干擾、縮小尺 寸和重量、增強可靠性等優(yōu)點。HDI 板可以分為不同的階數(shù)和層數(shù),階數(shù)表示每個層面上有 多少次激光鉆孔或微細加工,層數(shù)表示有多少個層面疊加在一起。一般來說,階數(shù)越高,層 數(shù)越多,HDI 板的密度和復(fù)雜度就越高。
GPU 芯片和內(nèi)存芯片都有很多引腳或焊盤,需要通過 HDI 板來實現(xiàn)高效率、低延遲、低功耗、低噪聲的信號傳輸。 GPU 加速卡需要使用高層次、高密度、高可靠性的 HDI 板來連接各個部件,主要有以下幾個 原因:GPU 芯片和內(nèi)存芯片都有很多引腳或焊盤,需要通過 HDI 板來實現(xiàn)高效率、低延遲、低 功耗、低噪聲的信號傳輸。GPU 加速卡的功耗較高,會產(chǎn)生大量的熱量,如果不能及時散發(fā),會影響其穩(wěn)定性和壽 命。
因此,需要使用具有良好導(dǎo)熱性能的 HDI 板材料。GPU 加速卡的尺寸較小,需要使用 HDI 板來減少 PCB 板的面積和厚度,提高空間利用率 和散熱效果。GPU 加速卡的性能較高,需要使用 HDI 板來支持更高的頻率和帶寬,提高數(shù)據(jù)傳輸速度 和質(zhì)量。
5 階 20 層以上的 HDI 板是目前 PCB 行業(yè)中高端且昂貴的產(chǎn)品之一,其制造工藝要求非常高, 需要使用先進的設(shè)備、材料和工藝。目前,全球能夠生產(chǎn)這種 HDI 板的廠商很少,主要集中 在日本、韓國、中國臺灣等地。 GPU 加速卡對 CCL 的具體要求主要有以下幾點:
高頻高速性能:由于 AI 服務(wù)器需要處理大量的數(shù)據(jù)和信號,因此 GPU 加速卡需要使用 具有高頻高速性能的 CCL,即能夠在高頻率下保持低損耗、低時延、低串擾、低噪聲等 特性的 CCL。這需要 CCL 具有較低的介電常數(shù)(Dk)、介電損耗(Df)、表面粗糙度(Rz) 等參數(shù)。
導(dǎo)熱性能:由于 GPU 加速卡的功耗較高,會產(chǎn)生大量的熱量,如果不能及時散發(fā),會影 響其穩(wěn)定性和壽命。因此,GPU 加速卡需要使用具有良好導(dǎo)熱性能的 CCL,即能夠有效 地將熱量從芯片傳導(dǎo)到散熱器或外部環(huán)境的 CCL。這需要 CCL 具有較高的導(dǎo)熱系數(shù)(K) 和較低的熱膨脹系數(shù)(CTE)等參數(shù)。
可靠性:由于 GPU 加速卡需要在復(fù)雜的環(huán)境中長期穩(wěn)定運行,因此 GPU 加速卡需要使用 具有高可靠性的 CCL,即能夠抵抗各種應(yīng)力和環(huán)境因素的影響,保持其結(jié)構(gòu)和功能不變 的 CCL。這需要 CCL 具有較高的玻璃化轉(zhuǎn)變溫度(Tg)、較低的水分吸收率(MOT)、較強 的機械強度和耐化學(xué)腐蝕性等參數(shù)。
GPU 模組板(UBB),即 Unit Baseboard,是一種用于搭載整個 GPU 平臺的 PCB 板。GPU 模組 板的主要功能是連接多個 GPU 加速卡并與 CPU 主板通信。GPU 加速卡,即 Open Accelerator Module,是一種基于開放標準設(shè)計的 GPU 模塊,可以插入到 GPU 模組板上。
GPU 之間的高速互聯(lián)可以通過 NVLink + NVSwitch 實現(xiàn)。NVSwitch 是英偉達推出的一種高性 能交換芯片,用于實現(xiàn)多個 GPU 加速卡之間的互聯(lián)和通信,NVLink 2.0 協(xié)議最大能夠提供每 秒 900GB 的雙向帶寬。第三代 NVSwitch 有 64 個第四代 NVLink 端口,每個端口可以連接一 個 GPU 加速卡或一個 CPU 主板,從而實現(xiàn)多達 64 個 GPU 加速卡的全互聯(lián)架構(gòu)。NVSwitch 基 于 NVLink 的高級通信能力構(gòu)建,可為計算密集型工作負載提供更高帶寬和更低延遲。
基于 第三代 NVSwitch,通過在服務(wù)器外部添加第二層 NVSwitch,NVLink 網(wǎng)絡(luò)可以連接多達 32 個 服務(wù)器、256 個 GPU,并提供 57.6TB/s 的多對多帶寬,實現(xiàn) GPU 在服務(wù)器節(jié)點間通信擴展, 形成數(shù)據(jù)中心大小的 GPU。為了實現(xiàn)高速、高效、高可靠的數(shù)據(jù)傳輸和圖形處理,GPU 模組板需要使用高多層通孔板(THP 板)作為載體。
THP 板是指通過機械鉆孔或激光鉆孔,在普通 PCB 板上形成大量的通孔,并 在通孔內(nèi)壁鍍上一層導(dǎo)電銅箔,從而實現(xiàn)不同層面之間的電氣連接。THP 板可以分為不同的 層數(shù),層數(shù)表示有多少個層面疊加在一起。一般來說,層數(shù)越多,THP 板的密度和復(fù)雜度就 越高。 GPU 模組板需要使用高多層 THP 板來實現(xiàn)高速數(shù)據(jù)傳輸和高頻信號處理的原因有:GPU 模組板需要處理大量的數(shù)據(jù)和信號,因此需要使用具有高頻高速性能的 THP 板,即 能夠在高頻率下保持低損耗、低時延、低串擾、低噪聲等特性的 THP 板。這需要 THP 板 具有較低的介電常數(shù)(Dk)、介電損耗(Df)、表面粗糙度(Rz)等參數(shù)。GPU 模組板需要連接多個 NVLink 芯片和 GPU 加速卡,因此需要使用具有高層次的 THP 板,即能夠?qū)崿F(xiàn)更多的信號通道和更好的電氣性能的 THP 板。
這需要 THP 板具有較高的 線寬線距、孔徑、阻抗控制等參數(shù)。GPU 模組板的功耗較高,會產(chǎn)生大量的熱量,如果不能及時散發(fā),會影響其穩(wěn)定性和壽 命。因此,GPU 模組板需要使用具有良好導(dǎo)熱性能的 THP 板,即能夠有效地將熱量從芯 片傳導(dǎo)到散熱器或外部環(huán)境的 THP 板。這需要 THP 板具有較高的導(dǎo)熱系數(shù)(K)和較低 的熱膨脹系數(shù)(CTE)等參數(shù)。
GPU 模組板對覆銅板有以下具體要求:
層數(shù):由于 GPU 模組板需要連接多個 GPU 加速卡,并且需要實現(xiàn)多層次的電源分配網(wǎng)絡(luò) (PDN),因此需要使用較高層數(shù)的覆銅板。目前,GPU 模組板使用的覆銅板一般在 16 層 以上;
電性能:由于 GPU 模組板需要支持高速數(shù)據(jù)傳輸和高頻信號處理,因此需要使用具有較 低介電常數(shù)(Dk)和介質(zhì)損耗因子(Df)的覆銅板,以減少信號的衰減和失真,提高信 號的完整性和可靠性,目前 GPU 模組板使用的覆銅板一般采用 PPO 等高性能樹脂材料;
熱性能:由于 GPU 模組板需要承受較高的功耗和發(fā)熱量,因此需要使用具有較高熱導(dǎo)率 和熱穩(wěn)定性的覆銅板,以有效地將熱量從元器件傳導(dǎo)到散熱模組,防止過熱造成性能下 降或損壞。
目前,GPU 模組板使用的覆銅板一般采用金屬基板或者添加導(dǎo)熱填料的復(fù)合 基板;加工性能:由于 GPU 模組板需要實現(xiàn)較多的通孔連接不同層次的電路線路,并且需要實 現(xiàn)較大的面積和厚度,因此需要使用具有較好加工性能的覆銅板,以滿足 THB 的要求, 提高 PCB 的質(zhì)量和良率。目前,GPU 模組板使用的覆銅板一般采用改性 PPO(MPPO)等 可交聯(lián)的熱固性材料,可以提高流動性和加工性。
CPU 主板,是 AI 服務(wù)器中連接 CPU、內(nèi)存、存儲等核心部件的部件,它可以實現(xiàn) CPU 與其他 部件之間的高速數(shù)據(jù)傳輸,并通過 PCIe 5.0 實現(xiàn)與 GPU 主板的互聯(lián)。CPU 主板一般采用 ATX 或 EATX 等標準規(guī)格,其尺寸為 305mm x 244mm 或 305mm x 330mm,其內(nèi)部包含一個或多個 CPU 插槽、內(nèi)存插槽、存儲插槽、電源管理芯片等元器件。CPU 主板通過 PCIe 插槽連接到 GPU 主板上,并通過 PCIe 實現(xiàn)高速數(shù)據(jù)傳輸。
CPU 主板使用的 PCB 一般為高多層通孔板(Through Hole Board, THB),其特點是具有較多 的通孔連接不同層次的電路線路,并且可以實現(xiàn)較大的面積和厚度。THB 可以實現(xiàn)更強的結(jié) 構(gòu)支撐和散熱能力,并且可以承載更多更復(fù)雜的元器件。
CPU 主板對覆銅板有以下具體要求:
介電常數(shù)和介質(zhì)損耗:這兩個參數(shù)影響信號的傳輸速度和能量損失,對于高頻、高速的 CPU 主板來說,需要選擇低介電常數(shù)和低介質(zhì)損耗的 CCL,以保證信號的完整性和質(zhì)量。
熱膨脹系數(shù):這個參數(shù)影響 CCL 在溫度變化時的尺寸穩(wěn)定性,對于高溫、高功率的 CPU 主板來說,需要選擇熱膨脹系數(shù)與銅箔相近的 CCL,以避免因為熱應(yīng)力導(dǎo)致的層間分離 或過孔開裂等缺陷。
熱導(dǎo)率:這個參數(shù)影響 CCL 在散熱方面的性能,對于高溫、高功率的 CPU 主板來說,需 要選擇熱導(dǎo)率較高的 CCL,以有效地將熱量從 CPU 和其他元件傳導(dǎo)到散熱器或外部環(huán)境。
阻燃等級:這個參數(shù)影響 CCL 在遇到火災(zāi)時的安全性能,對于所有的電子產(chǎn)品來說,都需要選擇阻燃等級較高的 CCL,以防止因為火災(zāi)引起的人員傷亡或財產(chǎn)損失。一般來說, 阻燃等級應(yīng)達到 UL94 V-0 或以上。
據(jù)產(chǎn)業(yè)調(diào)研,預(yù)估 2024 年 AI 加速卡需求為 400 萬顆,加速卡 PCB 用量平均單價 100 美元/ 顆,如果折算成英偉達 DGX A100 服務(wù)器對應(yīng)為 50 萬臺,對應(yīng) UBB 板的 PCB 用量為 1000 美 元/臺,對應(yīng) CPU 主板的 PCB 用量為 200 美元/臺,這三部分帶來是市場增量合計 10 億美元。
此外,隨著PCIe 標準升級下信息交互速度不斷提升,對 PCB 的設(shè)計、走線、板材選擇等要求提高。
PCIE5.0(第五代 PCI Express 總線標準),是一種用于連接各種外設(shè)設(shè)備的高速串行接口, 于 2019 年 5 月正式發(fā)布。PCIE5.0 相比于上一代 PCIE4.0,帶寬提升了一倍,能夠支持更高 性能的 CPU、GPU、存儲等設(shè)備,滿足 AI 服務(wù)器等高算力需求。通過改變電氣設(shè)計改善信號 完整性和機械性能,PCIE5.0 新標準減少了延遲,降低了長距離傳輸?shù)男盘査p。與 PCIE4.0 相比,PCIE5.0 信號速率達到 32GT/s,x16 帶寬(雙向)提升到了 128GB/s,能夠更好地滿足 吞吐量要求高的高性能設(shè)備,如數(shù)據(jù)中心、邊緣計算、機器學(xué)習(xí)、AI、5G 網(wǎng)絡(luò)等場景日益增 長的需求。除了保證高速傳輸?shù)哪芰Γ琍CIE5.0 還進一步加強了信號完整性,不僅適合連接 顯卡、SSD 等配件,也適用于平臺總線的使用。
目前 PCB 主流板材為 8-16 層,對應(yīng) PCIe 3.0 一般為 8-12 層,4.0 為 12-16 層,而 5.0 平臺則在 16 層以上。從材料的選擇上來看, PCIe 升級后服務(wù)器對 CCL 的材料要求將達到高頻/超低 損耗/極低損耗級別。 據(jù)產(chǎn)業(yè)調(diào)研,目前支持 PCIe3.0 標準的 Purley 平臺 PCB 價值量約 2200- 2400 元,支持 PCIe4.0 的 Whitley 平臺 PCB 價值量提升 30%-40%,支持 PCIe5.0 的 Eagle 平 臺的 PCB 價值量比 Purley 高一倍。根據(jù)我們測算,到 2025 年,PCIe 5.0 的升級有望為服務(wù) 器平臺 PCB 帶來百億的價值增量。
編輯:黃飛
評論
查看更多