過去一年,用于AI服務(wù)器的GPU一直供不應(yīng)求,而從未來一年的發(fā)展態(tài)勢來看,相關(guān)產(chǎn)品的緊張程度有增無減。
據(jù)TrendForce(集邦咨詢)預(yù)測,2024年全球服務(wù)器整機出貨量約1365.4萬臺,年增長率約2.05%。同時,市場仍聚焦部署AI服務(wù)器,出貨占比約為12.1%。
從各大ODM出貨動態(tài)來看,今年,增長幅度最高的是Foxconn(富士康),預(yù)估出貨量年增約5%~7%,包含Dell 16G平臺、AWS Graviton 3與4、Google Genoa和Microsoft Gen9等訂單。AI服務(wù)器訂單方面,F(xiàn)oxconn今年已斬獲Oracle訂單,同時也承接了部分AWS訂單。
增長幅度排名第二的是Inventec,預(yù)估出貨量年增約0~3%。AI服務(wù)器方面,除了北美CSP,中國客戶,如ByteDance需求最強,預(yù)估今年Inventec 的AI服務(wù)器出貨量年增長率可達雙位數(shù),占比約10%~15%。
排在Inventec之后的是廣達和Supermicro,預(yù)計今年服務(wù)器出貨量年增長率持平。
整體而言,各家ODM在2024年的出貨仍以AI服務(wù)器最為強勁,主要受惠于北美云端數(shù)據(jù)中心廠商訂單帶動,預(yù)計今年AI服務(wù)器出貨增長率和占比都將達到兩位數(shù)百分比。就出貨種類而言,今年,搭載高端AI訓(xùn)練芯片(如英偉達H系列和AMD的MI系列產(chǎn)品)的機種出貨量有機會翻倍增長。這對英偉達和AMD來說,意味著更大商機。
?01 店大欺客?
目前,英偉達占據(jù)80%的AI服務(wù)器GPU芯片市場份額,AI系統(tǒng)和互聯(lián)網(wǎng)大廠都需要該公司的GPU,因此,英偉達在該市場擁有很大話語權(quán)。
最近,有外媒報道,英偉達可能刻意延后出貨,以限制競爭對手接單。
報道稱,如果英偉達發(fā)現(xiàn)客戶正在尋求更好的業(yè)務(wù)機會,則可能會拖延數(shù)據(jù)中心GPU的出貨。英偉達的競爭對手、人工智能芯片創(chuàng)業(yè)公司Groq表示,由于客戶擔(dān)心英偉達報復(fù)性出貨延遲,都心存恐懼地對取得或設(shè)計人工智能技術(shù)保密。
Groq首席執(zhí)行官羅斯(Jonathan Ross)表示,由于潛在客戶擔(dān)心被英偉達發(fā)現(xiàn)與其它廠商討論接單,客戶們都會否認(rèn)自己曾與這些競爭對手公司會面。實際上,這種情況在業(yè)界并不少見。羅斯說:“很多人都說,如果英偉達聽說客戶正在會面,它們會否認(rèn)這一點。問題是你必須提前一年向英偉達付款,可能會在一年內(nèi)得到硬件,也可能需要更長時間?!?/p>
外媒甚至暗示,微軟、Google和亞馬遜等科技巨頭正打造自有人工智能加速器,但都堅稱不打算成為英偉達的競爭對手,因為英偉達在人工智能市場中占有主導(dǎo)地位。
針對羅斯的聲明,英偉達CEO黃仁勛告訴行業(yè)分析師,他試圖公平地向客戶分配GPU,并將避免向不立即使用加速器的公司出售產(chǎn)品。
在Groq指控英偉達使用延后出貨手段后,AMD前副總裁赫克爾曼(Scott Herkelman)表示,英偉達的確采取類似策略,他甚至稱英偉達為“GPU獨占集團”。他在社交媒體X上發(fā)文寫道:“這種情況發(fā)生的次數(shù)比預(yù)期的要多?!?/p>
赫克爾曼的表態(tài)十分引人關(guān)注,因為他從2016年起負(fù)責(zé)AMD的圖形業(yè)務(wù)部門,該部門在消費者和數(shù)據(jù)中心業(yè)務(wù)方面與英偉達競爭,直到2023年離開AMD。更重要的是,他在2012年9月~2015年5月間擔(dān)任英偉達GeForce業(yè)務(wù)總經(jīng)理。
不過,目前尚不清楚是否有證據(jù)證明英偉達確實有上述行為。
?02 如何保持行業(yè)領(lǐng)導(dǎo)地位?
英偉達在占據(jù)AI服務(wù)器用GPU市場主動地位的情況下,一定會想方設(shè)法實現(xiàn)利潤最大化,具體措施方面,除了高定價,保持客戶粘性是很重要的方式,在這方面的具體措施,包括技術(shù)性的,如用CUDA軟硬件生態(tài)系統(tǒng)牢牢地抓住廣大工程師,還有就是商業(yè)操作層面的,要盡量降低競爭對手的獲客機會。
在當(dāng)前的AI服務(wù)器和相關(guān)GPU市場行情下,無論是GPU提供商,還是系統(tǒng)集成商或互聯(lián)網(wǎng)大廠,都越來越敏感了,特別是互聯(lián)網(wǎng)大廠,都在做兩手準(zhǔn)備,在向英偉達采購更多GPU的同時,正在加緊自研相關(guān)芯片。對于英偉達的各種客戶而言,更多地接觸AMD和英特爾是必然。
微軟、Meta、亞馬遜等云服務(wù)提供商為了降低芯片成本,并使芯片供應(yīng)鏈多元化,減少對英偉達的依賴,不僅開始提升采購AMD的MI300系列產(chǎn)品數(shù)量,要求ODM廠設(shè)計專門采用MI300系列產(chǎn)品的AI服務(wù)器,還紛紛加強自研HPC芯片力度,爭取將更多自研芯片用于自家的互聯(lián)網(wǎng)和云計算系統(tǒng)。
AMD是英偉達最大的競爭對手,由于受到越來越多英偉達客戶的關(guān)注,對AMD產(chǎn)品的采購量在增加,使得該GPU“二哥”的行業(yè)地位持續(xù)提升,這在資本市場上有越來越明顯的表現(xiàn)。最近,AMD股價漲幅超過9%至每股192.53美元,創(chuàng)造歷史新高,2月份累計上漲了14.8%,市值首度突破3000億美元。
根據(jù)道瓊斯市場數(shù)據(jù),AMD的市值達到了3110億美元。在近期的連續(xù)上漲之后,AMD股價越來越貴,其市盈率接近50倍,遠(yuǎn)高于英偉達的32倍。
這樣看來,雖然英偉達依然很風(fēng)光,但受限于先進制程、封裝產(chǎn)能,以及來自各級別芯片對手的競爭,該公司的危機意識也在增加。
對于英偉達來說,要加快推出新品和優(yōu)化原有產(chǎn)品的節(jié)奏。
英偉達AI年度盛會“GTC 2024”將于3月18日在美國登場,屆時,黃仁勛將公布旗下最新的AI芯片、采用新一代Blackwell架構(gòu)的B100 GPU。據(jù)悉,該新品將由臺積電3nm制程代工生產(chǎn),最快今年第四季度出貨。
GTC大會不僅將世界各地的專業(yè)工程師、研究人員會聚一堂,還將邀請多位科技大老親自到場,活動預(yù)計將涌進超過30萬人(線下和線上總參與人數(shù)),今年的GTC也被外界看作是觀察2024和2025年AI關(guān)鍵技術(shù)發(fā)展進程的重要風(fēng)向標(biāo)。
英偉達即將發(fā)布的B100,與目前的H系列GPU相比,整體效能有大幅提升。其中,光是HBM內(nèi)存容量,就比H系列最強的H200芯片高出約40%的容量,使得B100能應(yīng)對高效能HPC或加速LLM的AI訓(xùn)練需求。據(jù)了解,B100芯片的AI效能,至少是Hopper架構(gòu)H200的兩倍,可以達到H100的4倍以上。
多家AI服務(wù)器系統(tǒng)大廠已經(jīng)開始爭奪B100,包括已成為英偉達B100模組供應(yīng)商的代工大廠緯創(chuàng),以及提供3nm或4nm制程技術(shù)的臺積電,還有現(xiàn)已開始接到來自英偉達B100 AI服務(wù)器水冷項目訂單的代工大廠英業(yè)達。英業(yè)達表示,今年的AI服務(wù)器市場仍以英偉達產(chǎn)品為主流,并以高端訓(xùn)練用的AI服務(wù)器產(chǎn)品為市場主力。
對于即將發(fā)布的新品B100,英偉達對所搭載的散熱技術(shù)也進行了升級,從原來的氣冷轉(zhuǎn)為水冷,對此,黃仁勛曾提到,自己堅信浸沒式水冷技術(shù)是未來發(fā)展方向,將帶動整個散熱市場迎來全面的革新。據(jù)悉,英偉達從B100開始,未來所有產(chǎn)品的散熱技術(shù),都將由氣冷轉(zhuǎn)為水冷。
?03 中國市場給英偉達增添了更多危機感
英偉達對競爭對手帶給它威脅的重視程度,從它對中國大陸市場及本土芯片企業(yè)的態(tài)度就可以看出來。
中國大陸市場占英偉達銷售額的20%左右,近兩年,該公司不得不多次改變GPU性能規(guī)格,以滿足美國政府的出口要求。
2022年8月,美國政府禁止向中國大陸出口英偉達的A100和H100芯片,因為這些芯片的通信帶寬達到了600GB/s或更高。針對中國大陸市場,英偉達隨后推出了A800和H800處理器,通信帶寬都明顯低于600GB/s。
2023年10月,美國商務(wù)部工業(yè)與安全局(BIS)表示,將使用 “性能密度”作為新參數(shù)對受限芯片進行分類。根據(jù)新規(guī)定,英偉達的A800、H800、L40、L40S和RTX 4090相關(guān)產(chǎn)品被禁止銷往中國大陸。針對這項規(guī)定,英偉達又于去年11月推出了三款A(yù)I芯片——H20、L20和L2,但要到2024年第二季度才能量產(chǎn)交付。
針對RTX 4090在中國大陸銷售受限問題,英偉達開發(fā)出了RTX 4090 D顯卡,通過降低部份規(guī)格,以符合美國出口管制要求。據(jù)悉,RTX 4090 D滿足綜合運算性能(TPP)4800限制,RTX 4090的TPP是5286。
最近,英偉達推出了最新版本的中國特供GPU和顯卡RTX 5880 Ada,符合4800 TPP的限制規(guī)定。英偉達將AD102芯片用于RTX 6000 Ada和RTX 5000 Ada,RTX 5880 Ada很可能使用相同芯片的變體。AD102擁有18,432個CUDA內(nèi)核。
隨著近幾年美國限制政策的出臺,以及中國本土企業(yè)和產(chǎn)品競爭力的提升,英偉達等廠商的技術(shù)和產(chǎn)品優(yōu)勢正在縮小。例如,H20在性能和效率上仍比中國本土AI芯片具有優(yōu)勢,但這種優(yōu)勢正在縮小,因為多家中國本土芯片廠商正在快速發(fā)展。
由于中國本土AI芯片與英偉達特供版產(chǎn)品之間的差距在縮小,進入2024年以來,多家中國互聯(lián)網(wǎng)大廠和云服務(wù)提供商表示,今年下訂的英偉達H20等產(chǎn)品數(shù)量將遠(yuǎn)少于原本想買的,因為來自中國本土的相關(guān)芯片用量增加了。
測試結(jié)果顯示,H20能在多個處理器之間高效傳輸數(shù)據(jù),比中國本土相關(guān)芯片更適合AI計算應(yīng)用,但是,需要更多H20才能表現(xiàn)出英偉達常規(guī)GPU的算力,這就大幅提高了成本。相比之下,中國本土最先進的AI芯片也能處理AI相關(guān)應(yīng)用,只是處理任務(wù)的復(fù)雜度低于英偉達的。知情人士表示,多家中國互聯(lián)網(wǎng)大廠和云服務(wù)提供商已經(jīng)把一些AI芯片訂單轉(zhuǎn)至本土廠商,以華為為例,據(jù)悉,該公司去年已從本土互聯(lián)網(wǎng)大廠手中拿到至少5000組Ascend 910B芯片訂單,預(yù)定今年交貨。
2月下旬,黃仁勛在接受外媒采訪時表示,如今,整個科技行業(yè)都在爭相開發(fā)和優(yōu)化自己的芯片技術(shù),無論是TPU團隊、AWS Trainium和Interentia團隊,還是微軟的Maia項目,以及中國各大云服務(wù)提供商和初創(chuàng)公司,都在這一領(lǐng)域投入了大量的精力。這種競爭態(tài)勢確實非常激烈。
對于中國大陸的競爭對手,黃仁勛表示,華為是非常好的公司。盡管他們受到現(xiàn)有半導(dǎo)體制程技術(shù)的限制,但他們?nèi)匀豢梢酝ㄟ^將許多芯片聚集在一起來構(gòu)建非常強大的系統(tǒng)。為了與華為競爭,英偉達正在向客戶提供兩款專門針對中國市場的新AI芯片樣品。
這是英偉達首次公開將華為列為競爭對手。此前,英偉達唯一一次公開提到華為是在2017年的一份財報中,當(dāng)時,該公司表示,華為將使用英偉達的Volta HGX架構(gòu)為數(shù)據(jù)中心構(gòu)建AI系統(tǒng)。在那份報告中,英偉達還將華為列為其AI智慧城市平臺的合作伙伴,而現(xiàn)在,華為成為了英偉達不得不重視的競爭對手。
?04 結(jié)語
經(jīng)過2023年的火爆,2024年的AI服務(wù)器市場很可能會更加旺盛,這給相關(guān)高性能芯片、特別是GPU廠商提供了更多商機。
對于行業(yè)領(lǐng)導(dǎo)廠商而言,眾多競爭對手,甚至包括客戶都虎視眈眈。站得越高,如果處理不好的話,摔得就會越慘,需要在技術(shù)、產(chǎn)品和商業(yè)推廣等多方面,充分發(fā)揮原有優(yōu)勢,壓制競爭對手,才能保持行業(yè)地位。
對于英偉達來說,2024年的AI服務(wù)器GPU市場依然會是它的天下。但在不斷變化、發(fā)展的高性能計算市場,誰能斷定兩三年后的技術(shù)和產(chǎn)品市場會有多大變化呢?就像兩年前,誰能斷定華為能在2023年實現(xiàn)手機處理器制造突破一樣。
審核編輯:黃飛
?
評論
查看更多