2月21日,英偉達(Nvidia)公布截止到2024年1月28日的第四季度營收,收入達到221億美元,比較上一季度增長22%,較去年同期增長265%。英偉達2024財年收入增長126%,達到609億美元。
在公布強勁財報后,Nvidia周四股價飆升16%,市值增加約2770億美元,令其總市值接近2萬億美元。擊敗Facebook母公司Meta Platform在今年2月早前達到的1,960億美元,成為華爾街史上單日市值增加最多的企業(yè)。
Nvidia創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“加速計算和生成式AI已經達到一個轉折點。全球企業(yè)、行業(yè)和各個國家的需求都在激增。由于生成式AI以及整個行業(yè)從中央處理器轉向英偉達制造的加速器,對英偉達GPU的需求將保持高位?!?br />
摩根士丹利分析師Joseph Moore表示,Nvidia的表現(xiàn)超過預期,直到幾個季度前,我們從未見過超過20億美元的季度收入指引,但在AI激增期間,這已經成為常規(guī)。AI需求的強勁持續(xù)令人矚目。
2022年10月和2023年10月,美國商務部工業(yè)和安全局(BIS)兩次更新對中國的先進半導體和計算設備的出口管制,英偉達中國特供版GPU產品A800、H800芯片均已經于去年11月17日起在中國禁售。除此之外,AMD發(fā)布的性能最強的MI300X、MI300A、MI250X也不能賣到中國。在ChatGPT、AI大模型帶動下各國算力需求激增,中國芯片廠商如何挖掘這個市場的商機?本文進行主要的分析。
阿里云平頭哥
2023年的云棲大會上,阿里巴巴集團董事會主席蔡崇信闡釋了阿里云的新愿景:“打造AI時代最開放的云”。 他表示,隨著AI大模型技術的迅速發(fā)展,智能化時代正在開啟,AI將成為各行各業(yè)的新型生產力,并對算力提出更高要求。
成立于2018年的阿里平頭哥,正處于云計算的拐點之上。這是一家阿里巴巴全資的半導體芯片公司,業(yè)務主體擁有端云一體全棧產品系列,涵蓋數(shù)據(jù)中心芯片、IoT 芯片、處理器 IP 授權等,實現(xiàn)芯片端到端設計鏈路全覆蓋。
阿里平頭哥 2019 年 9 月推出了其首款高性能人工智能推理芯片──含光800,基于 12nm 制程與自研架構,整合 170 億晶體管,性能峰值算力達 820 TOPS。 在業(yè)界標準的 ResNet-50測試中,推理性能達到 78563 IPS,能效比達 500 IPS/W。
2023 年 8 月,阿里平頭哥發(fā)布了首個自研 RISC-V AI 平臺,支持運行 170 余個主流 AI 模型,推動 RISC-V 進入高性能 AI 應用時代。同時,平頭哥宣布玄鐵處理器 C920 全新升級,C920 執(zhí)行 GEMM(矩陣的矩陣乘法) 計算較 Vector 方案可提速 15 倍。
11月21日,平頭哥玄鐵RiSC-V上新了三款處理器:首次實現(xiàn)AI矩陣擴展的C907、滿足Vector1.0標準的C920,以及實時處理器R910,將加速推動RiSC-V在自動駕駛、人工智能、企業(yè)級SSD、網絡通信等場景和領域的大規(guī)模商用落地。C920較上一代提升了最高3.9倍的AI性能,可以跑Transformer模型,適合機器學習、自動駕駛領域。
華為昇騰910系列
Nvidia在最新提交給美國證券交易所的一份檔案,認定華為是AI芯片領域的主要競爭對手。Nvidia指出,與華為在AI芯片領域進行競爭,包括GPU、CPU和網絡芯片。
在2018 全聯(lián)接大會上,華為提出 AI 戰(zhàn)略和全棧全場景 AI 解決方案,并發(fā)布了 2 顆全新的 AI 芯片:昇騰 910(Ascend 910)和昇騰 310(Ascend 310)。
兩款 AI 芯片均基于華為自研達芬奇架構,其中 Ascend 910(用于訓練)采用 7nm 制程,半精度達256TFOPs,功耗為 350W,運算密度號稱超越了 NVIDIA Tesla V100 和Google TPU v3。
Nvidia在2020 年和 2022 年推出了 A100 和 H100 芯片,占據(jù)了全球 AI 芯片市場的最大份額,華為昇騰910B據(jù)稱采用的是7nm制程。業(yè)界認為,華為昇騰 910B 能力已經基本做到可對標 Nvidia A100。
華為計算官網顯示,基于昇騰 910(Ascend 910)和昇騰 310(Ascend 310),華為還推出了Atlas AI 計算解決方案。華為目前 Atlas 300T 產品有三個型號,分別對應升騰 910A、910B、910 Pro B,最大 300W 功耗,前兩者 AI 算力均為 256 TFLOPS,而 910 Pro B 可達 280 TFLOPS(FP16)。
此前路透社的報道,國內搜索巨頭百度向華為下了訂單,購買昇騰910B用于AI服務器。
最新中國移動智算中心AI服務器采購大單,華為昇騰再次成為贏家。此次四家中標候選人中,河南昆侖為超聚變全資子公司,與華鯤振宇、烽火通信(控股子公司長江計算)、神州數(shù)碼均為華為昇騰認證的合伙伙伴。
百度昆侖芯
百度集團執(zhí)行副總裁、百度ACG(智能云事業(yè)群)總裁沈抖表示,未來所有的企業(yè)都會強依賴大模型,而且所有的產品都會基于大模型來開發(fā)。
昆侖芯1代AI芯片于2020年量產,在百度搜索引擎、小度等業(yè)務中部署數(shù)萬片,是國內唯一一款經歷過互聯(lián)網大規(guī)模核心算法考驗的云端AI芯片。昆侖芯2代AI芯片于2021年8月量產,是國內首款采用GDDR6顯存的通用AI芯片,相比昆侖芯1代AI芯片性能提升2-3倍,且在通用性、易用性方面也有顯著增強。
而昆侖芯2代則采用了TSMC 工藝,性能和功耗都有顯著提升。
寒武紀推出思元370、590系列及加速卡
2022年,寒武紀首顆訓推一體的Chiplet智能芯片思元370及系列加速卡初次亮相WAIC,思元370是寒武紀第三代云端產品,采用7nm制程工藝,最大算力高達256TOPS(INT8),是寒武紀第二代云端推理產品思元270算力的2倍。同時,思元370芯片支持LPDDR5內存,內存帶寬是思元270的3倍,可在板卡有限的功耗范圍內給人工智能芯片分配更多的能源,輸出更高的算力。
而寒武紀在2016年成立,專注于人工智能芯片產品的研發(fā)與技術創(chuàng)新,提供云邊端一體、軟硬件協(xié)同、訓練推理融合、具備統(tǒng)一生態(tài)的系列化智能芯片產品和平臺化基礎系統(tǒng)軟件,產品廣泛應用于服務器廠商和產業(yè)公司。
據(jù)悉,寒武紀最新一代思元590在性能上對標英偉達A100、A800,有可能在2024年上半年量產,成為國產替代的備選之一。
近年來寒武紀陸續(xù)推出思元、玄思等芯片/加速卡產品系列。 在目前AI算力建設大爆炸時期,特別是高端進口算力芯片受限下,國產替代的需求或讓寒武紀公司的芯片在算力時代搶得一定的市場份額。
沐曦:推出人工智能推理GPU曦思N100和通用計算芯片曦云C500
沐曦集成電路公司于2020年在上海成立,致力于為異構計算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產品。
2022年,沐熙集成電路推出了曦思N100,現(xiàn)處于規(guī)?;慨a和大規(guī)模出貨狀態(tài)。曦思N100是沐曦面向人工智能推理場景推出的高效能GPU產品,內置 MXN100 異構 GPGPU 處理器以及 HBM2E 顯存,單卡算力達 160TOPS(INT8)和 80TFLOPS(FP16),能夠提供最高 128 路編碼和 96 路解碼的視頻處理能力,兼容 HEVC、H.264、AV1、AVS2 等多種視頻格式,最高支持 8K 分辨率。
此外,沐曦首款面向人工智能訓練及通用計算的旗艦產品曦云C500在2023年6月流片,這款芯片基于自研的高性能GPU IP,特別適合千億參數(shù)AI大模型的訓練和推理,能夠提供構建高密度算力和云計算部署的優(yōu)秀國產GPU解決方案,在2023年底實現(xiàn)規(guī)模量產。
小結:
分析師估計中國人工智能芯片市場價值70億美元。目前在大模型推理方面,國內 AI 芯片910B僅能達到Nvidia公司A100的60%-70%左右,集群的模型訓練難以為繼。而就在2月21日,Nvidia CEO黃仁勛向媒體表示,英偉達目前正在向客戶提供兩款面向中國市場的新型人工智能(AI)芯片樣品,以在美國采取對華芯片出口管制措施的背景下維持該公司在中國市場的地位。
此外,除了華為昇騰外,寒武紀、沐曦、天數(shù)智芯都公布過AI訓練及推理芯片,但是AI芯片生態(tài)尚未有效建立,和Nvidia CUDA生態(tài)對比,還有不少短板。
-
AI
+關注
關注
87文章
31225瀏覽量
269579
發(fā)布評論請先 登錄
相關推薦
評論