0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

今年,還要搶GPU?

漢通達 ? 2025-02-14 10:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近一短時間以來,被國內(nèi)一家AI大模型初創(chuàng)公司DeepSeek刷屏了。短短幾個月內(nèi),DeepSeek推出的兩款開源大語言模型——DeepSeek-V3和DeepSeek-R1,不僅在多個關鍵性能指標上與世界頂級大模型,如Meta的Llama 3.1、OpenAI的GPT-4、Anthropic的Claude Sonnet 3.5等,不分伯仲。最令人震驚的是,DeepSeek的訓練成本遠遠低于這些傳統(tǒng)模型,且所使用的GPU芯片并非頂級配置,但卻交出了令人嘆為觀止的成績單。

經(jīng)濟學家Ed Yardeni 在一份報告中指出:“DeepSeek在兩個月內(nèi)僅花費 560萬美元來開發(fā)其DeepSeek-v3模型。”相比之下,Anthropic的首席執(zhí)行官Dario Amodei 去年提到,建立一個模型的成本為1億至10億美元。而且由于這些模型是開源的,在成本和定價上都具有很大的優(yōu)勢。

然而,不容忽視的是,盡管DeepSeek的成本大大低于傳統(tǒng)大廠,但其能夠取得如此突破的背后,依然離不開GPU這一關鍵硬件的強力支持。隨著AI競爭日益激烈,尤其是訓練和推理市場的不斷擴展,算力仍將是決定勝負的關鍵,GPU的作用依然無法被忽視。

美國科技巨頭不受影響,

繼續(xù)瘋搶GPU

無論是DeepSeek還是對AI的泡沫擔憂,都沒有減緩企業(yè)的投資熱情。2025年各家云廠商仍然有著大幅的資本支出??萍脊緜?yōu)榱嗽贏I這場戰(zhàn)斗中贏得勝利,近些年來大肆建設數(shù)據(jù)中心,搶GPU卡,搶電力,新一輪激烈角逐正在拉開:

1月21日,OpenAI宣布了一個新項目:星際之門(Stargate Project),計劃在未來四年內(nèi)投資5000億美元,在美國為OpenAI建設新的人工智能基礎設施,在今年投入首筆1000億美元。

亞馬遜今年計劃在基礎設施方面投資1000億美元,高于2024年的770億美元,是前一年480億美元的兩倍多,絕大部分資金將用于亞馬遜網(wǎng)絡服務的數(shù)據(jù)中心和服務器;

微軟在2025年1月初宣布,計劃在2025財年(截止今年6月份)投資800億美元建設能夠處理人工智能工作負載的數(shù)據(jù)中心;

谷歌計劃在2025年投資750億美元(較去年的 530 億美元增長 42%),谷歌首席執(zhí)行官桑達爾·皮查伊稱人工智能的機遇“前所未見,這就是我們加大投入以抓住這一機遇的原因。

Meta將在今年投資600億至650億美元用于AI相關的資本支出。Meta首席執(zhí)行官馬克·扎克伯格表示:“我仍然認為,從長遠來看,大力投資資本支出和基礎設施將是一種戰(zhàn)略優(yōu)勢,我們可能在某個時候會發(fā)現(xiàn)其他情況,但我認為現(xiàn)在下結論還為時過早,就目前而言,我敢打賭,建設這種基礎設施的能力將是一個重大優(yōu)勢?!?/p>

就連過去幾年在AI領域很謹慎的甲骨文,2025年也加大了資本支出。甲骨文將在2025年將資本支出比2024年增加一倍,達到約136億美元。而2021財年,甲骨文的資本支出僅為20億美元左右。甲骨文首席財務官薩弗拉·卡茲 (Safra Katz) 在2025財年財報會上表示,AI需求推動甲骨文云基礎設施收入增長52%,云計算收入本財年有望達到250億美元。

在七大科技公司中,甲骨文是標準普爾500指數(shù)中唯一市值未突破1萬億美元的大型科技公。與亞馬遜和微軟不同,甲骨文主要通過租賃大量數(shù)據(jù)中心而非購買。不過分析師表示,甲骨文這種獨特的數(shù)據(jù)中心策略使其能夠有效與資金雄厚的競爭對手競爭,因為這可以使得其資本支出中更大的一部分被投入到購買GPU,而非像微軟這樣的大規(guī)模支出。作為星際之門的一部分,甲骨文此次也擔任重要角色之一,與英偉達和OpenAI共同構建和運營該計算系統(tǒng)。

據(jù)估計,微軟、亞馬遜、谷歌和Meta 2024 年的總資本支出將達到2460億美元,高于2023年的1510億美元。而2025年的支出可能超過3200億美元。在科技巨頭們?nèi)绱烁哳~的資本支出中,GPU的采買將占據(jù)很大一部分,10萬卡級別的集群正逐步成為AI計算的標配。

英偉達無疑是這一浪潮的最大受益者:其三大客戶之一Meta正加速建設一座超2GW的數(shù)據(jù)中心,計劃在2025年底前部署超過130萬塊GPU;甲骨文則在打造Zettascale級別的云基礎設施超級集群,支持多達131,072個Blackwell GPU,預計于2025年上半年推出;而微軟去年成為全球最大GPU買家,據(jù)Omdia分析,微軟在2024年采購了多達485,000塊Hopper芯片,是其他廠商的兩倍,今年800億美元的預算預計也將大幅投入GPU采購。

2025年,英偉達的Blackwell GPU無疑將成為市場最受關注的芯片。盡管該系列面臨一些技術挑戰(zhàn),英偉達仍計劃提前推出。據(jù)Business Insider報道,Nvidia正積極推動SK Hynix盡早準備其下一代內(nèi)存,以加速Blackwell GPU的量產(chǎn)。

AMD也在積極加速GPU導入廠商,本次大火的DeepSeek-V3模型的開發(fā)中,就使用了AMD Instinct GPU和ROCM軟件。MI300系列GPU已成為AMD有史以來增長最快的產(chǎn)品,微軟已采購Instinct MI300X。據(jù)Nextplatform報道,預計2024年AMD向數(shù)據(jù)中心的GPU芯片銷售額將突破50億美元,幾乎是2023年的10倍。此前,AMD首席執(zhí)行官Lisa Su曾透露,已有超過100家企業(yè)和AI客戶積極部署MI300X。

為了快速攻占AI市場,AMD打算提前推出下一代GPU芯片MI350系列。MI350 將在本季度開始向主要客戶送樣,并將生產(chǎn)出貨時間加速到年中。

在這一趨勢下,GPU市場或將再度迎來供不應求的局面,只有少數(shù)頭部廠商能夠優(yōu)先獲得供應。

擴產(chǎn),能否解決GPU缺貨之痛?

GPU缺貨最大的問題在于產(chǎn)能端。CowoS封裝和HBM存儲作為GPU的兩大支柱,也制約了GPU的產(chǎn)能。據(jù)DIGITIMES Research稱,受云端AI加速器需求旺盛推動,2025年全球對CoWoS及類似封裝產(chǎn)能的需求或將增113%。為此,GPU產(chǎn)業(yè)鏈中關鍵的兩大廠商臺積電、SK海力士等行業(yè)巨頭紛紛加大擴產(chǎn)力度,試圖解決供應不足的困境。

由于日益加劇的地緣政治和經(jīng)濟不確定性,臺積電的先進封裝路線圖在2024年經(jīng)歷了多次調整。根據(jù)臺積電的最新規(guī)劃,2024年CoWoS的月產(chǎn)能預計為35,000片,到2025年將增加一倍,達到75,000片,預計2026年將進一步增至135,000片。

f64f69f2-ea77-11ef-9434-92fbcf53809c.png

臺積電CoWos產(chǎn)能預測(來源:SEMI Vision)

臺積電2024年的CoWoS封裝就進行了擴產(chǎn),比2023年增加了2倍,但是仍然供不應求。根據(jù)SEMI Vision的數(shù)據(jù),臺積電在竹南、嘉義、臺中和臺南四地的先進封裝擴建項目正全力推進。其中竹南先進封裝AP6B廠于12月3日獲使用證,嘉義廠于今年5月動工。臺中AP5B廠預計明年上半年投產(chǎn),群創(chuàng)臺南廠區(qū)臺南AP8廠(內(nèi)部代號AP8)則計劃于2025年底小規(guī)模投產(chǎn)。而經(jīng)濟日報1月20日的最新消息,臺積電再投2000億新臺幣計劃在南科三期新建兩座CoWoS封裝廠。如果消息屬實,加上目前正在建設的嘉科廠,臺積電短期內(nèi)CoWoS廠總數(shù)將達到八座,具體包括嘉科一期兩座、群創(chuàng)四廠改建兩座、南科三期兩座,以及嘉科二期規(guī)劃的兩座。CoWoS封裝的火熱需求可見一斑。

f67014fe-ea77-11ef-9434-92fbcf53809c.png

臺積電先進封裝工廠(來源:SEMI Vision)

另一邊,SK海力士也是忙的飛起。作為HBM的主要供應商,SK海力士2025年的HBM產(chǎn)能均已經(jīng)售罄,因而一邊不斷加大擴產(chǎn)HBM產(chǎn)能,目標是到明年實現(xiàn)每月14萬片晶圓的HBM產(chǎn)能;一邊加快產(chǎn)品迭代步伐,正與臺積電就16層HBM4進行密切合作,預計2026年下半年開始量產(chǎn)出貨。

2024年全年SK海力士營收創(chuàng)歷史新高,超過2022年創(chuàng)下的紀錄21萬億韓元以上,營業(yè)利潤也超過了2018年半導體超級繁榮時期的紀錄。反觀三星,已經(jīng)將HBM3E市場拱手讓給了SK海力士,目前的希望是HBM4,三星打算采用混合鍵合新技術來實現(xiàn)16層的HBM4。但從目前的進展來看,似乎沒那么順利。不過,三星也在擴產(chǎn)HBM產(chǎn)能,計劃在今年年底前將其HBM產(chǎn)能提高至每月14萬至15萬片晶圓,并在明年年底前進一步提高至每月17萬至20萬片晶圓。

美光的HBM產(chǎn)品進展還不錯,其首席執(zhí)行官預計2024財年HBM的收入大概在數(shù)億美元,2025財年將達到數(shù)十億美元。美光的目標是明年拿下20%的HBM市場份額。在臺灣,美光正在大幅擴產(chǎn)HBM產(chǎn)能,包括臺中A3工廠和桃園第11工廠,此外美光還在臺灣開設了一個新的辦公室,收購了友達光電的臺中工廠,將其改建為DRAM生產(chǎn)基地。該公司計劃到明年年底將目前每月20,000片晶圓的產(chǎn)量增加兩倍至60,000片。

從短期來看,盡管擴產(chǎn)計劃已在推進,供需矛盾仍將長期存在。尤其是隨著AI和數(shù)據(jù)中心應用的進一步發(fā)展,GPU的需求將持續(xù)攀升,單靠現(xiàn)有產(chǎn)能擴充恐難以迅速彌補市場缺口。

GPU不夠,ASIC來湊?

GPU芯片短缺已經(jīng)不是一兩年的事了,云廠商們受制于Nvidia好多年了。因而云端巨頭皆投入ASIC芯片開發(fā),Google推出的TPU(張量處理器)已經(jīng)成為行業(yè)標桿;亞馬遜AWS也推出了Trainium和Inferentia兩款自研芯片;微軟緊隨其后,開發(fā)了Maia和Cobalt系列;Meta則以MTIA芯片搶占市場;而OpenAI,據(jù)傳正與博通合作開發(fā)自有的ASIC芯片,以支撐其大規(guī)模AI模型的訓練需求。

顯然這些ASIC已經(jīng)小有氣候。蘋果2024年7月發(fā)表iPhone AI的首個預覽版,其AI模型就是使用Google的TPU(張量處理器)上訓練。在亞馬遜的AWS Reinvent大會上,其宣布將使用亞馬遜自家的自研AI芯片進行模型訓練,除夕之外,蘋果正評估亞馬遜最新的Trainium2芯片,種種跡象表明,ASIC已經(jīng)能補充一部分GPU的空缺。

ASIC必然有其獨特的存在價值。英偉達的B200等GPU芯片,主要通過擴大面積來提升性能,所以會越做越大,而聚焦于提升算力的ASIC芯片,拋棄了GPU中的部分通用功能,成為一種提升效能、降低功耗的選擇,換句話說,ASIC具有高性能、低功耗、成本低、保密性和安全性高以及減少電路板大小的優(yōu)勢。

即使是“GPU之王”英偉達,也沒有忽視ASIC的潛力。據(jù)報道,英偉達已經(jīng)開始規(guī)劃ASIC產(chǎn)品線,在臺灣招募上千名芯片設計、軟件開發(fā)及AI研發(fā)等領域之人才。黃仁勛直言,NVIDIA借此可進一步擴大客群,或許CSP業(yè)者客戶會成為NVIDIA的競爭對手,但同時所有的CSP也都還會是NVIDIA的客戶,云端客戶將離不開NVIDIA。

ASIC盛行時代,也帶火了博通和Marvell。博通已經(jīng)邁向萬億美元市值,Marvell的市值也突破千億美元大關。這些公司在ASIC領域的快速崛起,不僅得益于自身技術研發(fā)能力,還反映了市場對定制化計算解決方案的巨大需求。

隨著AI模型復雜度的提升和大規(guī)模應用的普及,ASIC市場的規(guī)模呈現(xiàn)爆炸式增長。據(jù)摩根士丹利預計,AI ASIC市場規(guī)模將從2024年的120億美元增長至2027年的300億美元,年均復合增長率達34%。博通更樂觀地預測,2027年ASIC的市場需求規(guī)模將在600億至900億美元之間,而Marvell則預計2028年數(shù)據(jù)中心ASIC市場規(guī)模將攀升至429億美元。

GPU的短缺問題雖難短期內(nèi)完全解決,但ASIC芯片的崛起無疑為填補這一空缺提供了可行的路徑。特別是在云計算和AI領域,ASIC通過定制化設計,在特定應用中提供更高效、更低功耗的解決方案,逐步成為GPU的有力補充。

隨著越來越多的云服務商投入到ASIC研發(fā)中,未來的計算生態(tài)可能會更加多元化。GPU和ASIC將兩者互補,共同推動著整個AI和云計算產(chǎn)業(yè)的前進。

寫在最后

DeepSeek的出現(xiàn),使得很多人認為對算力以及英偉達不利。但是「信息平權」的一篇分析中的觀點是前沿探索(如新模型的開發(fā))和后發(fā)追趕(即基于已有成果的改進)所需要的算力需求是不同的。文章引用了《The Bitter Lesson》中的觀點,強調算力才是AI研究的根本驅動力。歷史經(jīng)驗告訴我們,AI的突破往往來源于算力的擴展,而非單純的算法創(chuàng)新。隨著算力的不斷提升,AI的能力將得到質的飛躍。

因此,GPU在未來AI戰(zhàn)場上的重要地位,依舊牢不可破。AI行業(yè)的未來,依然是算力的較量,無論是DeepSeek這樣的新興公司,還是OpenAI、谷歌、Meta等傳統(tǒng)巨頭,GPU仍將是支撐他們技術創(chuàng)新與產(chǎn)品突破的基石。2025年,GPU的搶奪戰(zhàn)依舊很精彩!

END

聲明:

本號對所有原創(chuàng)、轉載文章的陳述與觀點均保持中立,推送文章僅供讀者學習和交流。文章、圖片等版權歸原作者享有,如有侵權,聯(lián)系刪除。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4925

    瀏覽量

    130877
  • AI
    AI
    +關注

    關注

    88

    文章

    34733

    瀏覽量

    276766
  • 大模型
    +關注

    關注

    2

    文章

    3083

    瀏覽量

    3955
  • DeepSeek
    +關注

    關注

    1

    文章

    787

    瀏覽量

    1533
收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    帶來了總雙向帶寬160GB/s的通訊速率,遠高于當時的PCIe接口(實際比現(xiàn)在的PCIe5.0也還要快)。首代的NVlink主要是增強了GPUGPU的通信性能和GPU對系統(tǒng)內(nèi)存的訪問
    發(fā)表于 06-18 19:31

    英偉達擬再推中國特供GPU,今年6月量產(chǎn)!

    電子發(fā)燒友網(wǎng)綜合報道 近年來,美國政府對華半導體出口管制政策不斷收緊,英偉達等半導體企業(yè)面臨嚴峻挑戰(zhàn)。為保持在中國市場的競爭力,英偉達推出了多款特供版GPU,以滿足政策限制下的市場需求
    發(fā)表于 05-27 00:03 ?4340次閱讀

    可以手動構建imx-gpu-viv嗎?

    使用 imx-gpu-viv-6.4.3.p4.2.aarch64.bin。 https://www.nxp.com/lgfiles/NMG/MAD/YOCTO//imx-gpu-viv-6.4.3.p4.2-aarch64.bin 我需要
    發(fā)表于 03-28 06:35

    無法在GPU上運行ONNX模型的Benchmark_app怎么解決?

    在 CPU 和 GPU 上運行OpenVINO? 2023.0 Benchmark_app推斷的 ONNX 模型。 在 CPU 上推理成功,但在 GPU 上失敗。
    發(fā)表于 03-06 08:02

    OpenVINO?檢測到GPU,但網(wǎng)絡無法加載到GPU插件,為什么?

    OpenVINO?安裝在舊的 Windows 10 版本 Windows? 10 (RS1) 上。 已安裝 GPU 驅動程序版本 25.20.100.6373,檢測到 GPU,但網(wǎng)絡無法加載
    發(fā)表于 03-05 06:01

    GPU按需計費的優(yōu)勢

    GPU按需計費,是指用戶根據(jù)實際使用的GPU資源和時間進行費用結算,而非傳統(tǒng)的一次性購買或固定租賃模式。以下,是對GPU按需計費優(yōu)勢的總結,由AI部落小編整理。
    的頭像 發(fā)表于 01-14 10:43 ?348次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH發(fā)布的有關CST Studio Suite 2024的GPU計算指南。涵蓋GPU計算
    發(fā)表于 12-16 14:25

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解算力芯片GPU

    本篇閱讀學習第七、八章,了解GPU架構演進及CPGPU存儲體系與線程管理 █從圖形到計算的GPU架構演進 GPU圖像計算發(fā)展 ●從三角形開始的幾何階段 在現(xiàn)代圖形渲染中,三角形是最常用的基本圖形元素
    發(fā)表于 11-03 12:55

    談談GPU的使用壽命

    上文結合論文談一談,三年壽命的GPU [上]說到,電路腐蝕導致橡樹嶺實驗室的GPU壽命只有3年,更換了11,000塊GPU。
    的頭像 發(fā)表于 11-01 10:27 ?796次閱讀
    談談<b class='flag-5'>GPU</b>的使用壽命

    【一文看懂】大白話解釋“GPUGPU算力”

    隨著大模型的興起,“GPU算力”這個詞正頻繁出現(xiàn)在人工智能、游戲、圖形設計等工作場景中,什么是GPU,它與CPU的區(qū)別是什么?以及到底什么是GPU算力?本篇文章主要從以下5個角度,讓您全方位了解
    的頭像 發(fā)表于 10-29 08:05 ?2433次閱讀
    【一文看懂】大白話解釋“<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>算力”

    常見GPU問題及解決方法

    GPU(圖形處理單元)是計算機硬件的重要組成部分,負責處理圖形和視頻渲染任務。隨著技術的發(fā)展,GPU在深度學習、游戲、視頻編輯等領域扮演著越來越重要的角色。然而,在使用GPU的過程中,我們可能會遇到
    的頭像 發(fā)表于 10-27 14:12 ?3472次閱讀

    GPU深度學習應用案例

    GPU在深度學習中的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是深度學習的核心應用領域之一,GPU在加速圖像識別模型訓練方面發(fā)揮著關鍵作用。通過利用GPU
    的頭像 發(fā)表于 10-27 11:13 ?1239次閱讀

    GPU超頻設置技巧

    超頻GPU(圖形處理單元)可以提高顯卡的性能,但同時也可能增加熱量和功耗,甚至可能縮短硬件的壽命。在進行GPU超頻之前,確保你了解可能的風險,并且愿意承擔這些風險。以下是一些基本的GPU超頻設置
    的頭像 發(fā)表于 10-27 11:09 ?1374次閱讀

    如何選擇適合的GPU

    在現(xiàn)代計算領域,GPU(圖形處理單元)的作用已經(jīng)遠遠超出了傳統(tǒng)的圖形渲染。從深度學習到科學計算,再到視頻編輯,GPU都在發(fā)揮著越來越重要的作用。然而,市場上的GPU型號繁多,性能和價格也各不相同
    的頭像 發(fā)表于 10-27 11:07 ?963次閱讀

    暴漲預警!NVIDIA GPU供應大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品