0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI大模型需求持續(xù)激增,中國AI芯片如何?

章鷹觀察 ? 來源:電子發(fā)燒友 ? 作者:章鷹 ? 2024-02-24 09:07 ? 次閱讀

2月21日,英偉達(Nvidia)公布截止到2024年1月28日的第四季度營收,收入達到221億美元,比較上一季度增長22%,較去年同期增長265%。英偉達2024財年收入增長126%,達到609億美元。

wKgZomXb5ICASzjqAADUIV0l9xQ214.jpg

在公布強勁財報后,Nvidia周四股價飆升16%,市值增加約2770億美元,令其總市值接近2萬億美元。擊敗Facebook母公司Meta Platform在今年2月早前達到的1,960億美元,成為華爾街史上單日市值增加最多的企業(yè)。

wKgZomXb5IeACoF-AAFfas9ULQw284.jpg

Nvidia創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“加速計算和生成式AI已經達到一個轉折點。全球企業(yè)、行業(yè)和各個國家的需求都在激增。由于生成式AI以及整個行業(yè)從中央處理器轉向英偉達制造的加速器,對英偉達GPU的需求將保持高位?!?br />
摩根士丹利分析師Joseph Moore表示,Nvidia的表現(xiàn)超過預期,直到幾個季度前,我們從未見過超過20億美元的季度收入指引,但在AI激增期間,這已經成為常規(guī)。AI需求的強勁持續(xù)令人矚目。

2022年10月和2023年10月,美國商務部工業(yè)和安全局(BIS)兩次更新對中國的先進半導體和計算設備的出口管制,英偉達中國特供版GPU產品A800、H800芯片均已經于去年11月17日起在中國禁售。除此之外,AMD發(fā)布的性能最強的MI300X、MI300A、MI250X也不能賣到中國。在ChatGPT、AI大模型帶動下各國算力需求激增,中國芯片廠商如何挖掘這個市場的商機?本文進行主要的分析。

阿里云平頭哥

2023年的云棲大會上,阿里巴巴集團董事會主席蔡崇信闡釋了阿里云的新愿景:“打造AI時代最開放的云”。 他表示,隨著AI大模型技術的迅速發(fā)展,智能化時代正在開啟,AI將成為各行各業(yè)的新型生產力,并對算力提出更高要求。

成立于2018年的阿里平頭哥,正處于云計算的拐點之上。這是一家阿里巴巴全資的半導體芯片公司,業(yè)務主體擁有端云一體全棧產品系列,涵蓋數(shù)據(jù)中心芯片、IoT 芯片、處理器 IP 授權等,實現(xiàn)芯片端到端設計鏈路全覆蓋。

阿里平頭哥 2019 年 9 月推出了其首款高性能人工智能推理芯片──含光800,基于 12nm 制程與自研架構,整合 170 億晶體管,性能峰值算力達 820 TOPS。 在業(yè)界標準的 ResNet-50測試中,推理性能達到 78563 IPS,能效比達 500 IPS/W。

2023 年 8 月,阿里平頭哥發(fā)布了首個自研 RISC-V AI 平臺,支持運行 170 余個主流 AI 模型,推動 RISC-V 進入高性能 AI 應用時代。同時,平頭哥宣布玄鐵處理器 C920 全新升級,C920 執(zhí)行 GEMM(矩陣的矩陣乘法) 計算較 Vector 方案可提速 15 倍。

wKgZomXb5JKAaWOAAADi7Es3yt4134.jpg

11月21日,平頭哥玄鐵RiSC-V上新了三款處理器:首次實現(xiàn)AI矩陣擴展的C907、滿足Vector1.0標準的C920,以及實時處理器R910,將加速推動RiSC-V在自動駕駛、人工智能、企業(yè)級SSD、網絡通信等場景和領域的大規(guī)模商用落地。C920較上一代提升了最高3.9倍的AI性能,可以跑Transformer模型,適合機器學習、自動駕駛領域。

華為昇騰910系列

Nvidia在最新提交給美國證券交易所的一份檔案,認定華為是AI芯片領域的主要競爭對手。Nvidia指出,與華為在AI芯片領域進行競爭,包括GPU、CPU網絡芯片。

在2018 全聯(lián)接大會上,華為提出 AI 戰(zhàn)略和全棧全場景 AI 解決方案,并發(fā)布了 2 顆全新的 AI 芯片:昇騰 910(Ascend 910)和昇騰 310(Ascend 310)。


兩款 AI 芯片均基于華為自研達芬奇架構,其中 Ascend 910(用于訓練)采用 7nm 制程,半精度達256TFOPs,功耗為 350W,運算密度號稱超越了 NVIDIA Tesla V100 和Google TPU v3。

Nvidia在2020 年和 2022 年推出了 A100 和 H100 芯片,占據(jù)了全球 AI 芯片市場的最大份額,華為昇騰910B據(jù)稱采用的是7nm制程。業(yè)界認為,華為昇騰 910B 能力已經基本做到可對標 Nvidia A100。

華為計算官網顯示,基于昇騰 910(Ascend 910)和昇騰 310(Ascend 310),華為還推出了Atlas AI 計算解決方案。華為目前 Atlas 300T 產品有三個型號,分別對應升騰 910A、910B、910 Pro B,最大 300W 功耗,前兩者 AI 算力均為 256 TFLOPS,而 910 Pro B 可達 280 TFLOPS(FP16)。

此前路透社的報道,國內搜索巨頭百度向華為下了訂單,購買昇騰910B用于AI服務器。

最新中國移動智算中心AI服務器采購大單,華為昇騰再次成為贏家。此次四家中標候選人中,河南昆侖為超聚變全資子公司,與華鯤振宇、烽火通信(控股子公司長江計算)、神州數(shù)碼均為華為昇騰認證的合伙伙伴。

百度昆侖芯

百度集團執(zhí)行副總裁、百度ACG(智能云事業(yè)群)總裁沈抖表示,未來所有的企業(yè)都會強依賴大模型,而且所有的產品都會基于大模型來開發(fā)。

昆侖芯1代AI芯片于2020年量產,在百度搜索引擎、小度等業(yè)務中部署數(shù)萬片,是國內唯一一款經歷過互聯(lián)網大規(guī)模核心算法考驗的云端AI芯片。昆侖芯2代AI芯片于2021年8月量產,是國內首款采用GDDR6顯存的通用AI芯片,相比昆侖芯1代AI芯片性能提升2-3倍,且在通用性、易用性方面也有顯著增強。

而昆侖芯2代則采用了TSMC 工藝,性能和功耗都有顯著提升。

寒武紀推出思元370、590系列及加速卡

2022年,寒武紀首顆訓推一體的Chiplet智能芯片思元370及系列加速卡初次亮相WAIC,思元370是寒武紀第三代云端產品,采用7nm制程工藝,最大算力高達256TOPS(INT8),是寒武紀第二代云端推理產品思元270算力的2倍。同時,思元370芯片支持LPDDR5內存,內存帶寬是思元270的3倍,可在板卡有限的功耗范圍內給人工智能芯片分配更多的能源,輸出更高的算力。

而寒武紀在2016年成立,專注于人工智能芯片產品的研發(fā)與技術創(chuàng)新,提供云邊端一體、軟硬件協(xié)同、訓練推理融合、具備統(tǒng)一生態(tài)的系列化智能芯片產品和平臺化基礎系統(tǒng)軟件,產品廣泛應用于服務器廠商和產業(yè)公司。

據(jù)悉,寒武紀最新一代思元590在性能上對標英偉達A100、A800,有可能在2024年上半年量產,成為國產替代的備選之一。

近年來寒武紀陸續(xù)推出思元、玄思等芯片/加速卡產品系列。 在目前AI算力建設大爆炸時期,特別是高端進口算力芯片受限下,國產替代的需求或讓寒武紀公司的芯片在算力時代搶得一定的市場份額。

沐曦:推出人工智能推理GPU曦思N100和通用計算芯片曦云C500

沐曦集成電路公司于2020年在上海成立,致力于為異構計算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產品。

2022年,沐熙集成電路推出了曦思N100,現(xiàn)處于規(guī)?;慨a和大規(guī)模出貨狀態(tài)。曦思N100是沐曦面向人工智能推理場景推出的高效能GPU產品,內置 MXN100 異構 GPGPU 處理器以及 HBM2E 顯存,單卡算力達 160TOPS(INT8)和 80TFLOPS(FP16),能夠提供最高 128 路編碼和 96 路解碼的視頻處理能力,兼容 HEVC、H.264、AV1、AVS2 等多種視頻格式,最高支持 8K 分辨率。

此外,沐曦首款面向人工智能訓練及通用計算的旗艦產品曦云C500在2023年6月流片,這款芯片基于自研的高性能GPU IP,特別適合千億參數(shù)AI大模型的訓練和推理,能夠提供構建高密度算力和云計算部署的優(yōu)秀國產GPU解決方案,在2023年底實現(xiàn)規(guī)模量產。

小結:

分析師估計中國人工智能芯片市場價值70億美元。目前在大模型推理方面,國內 AI 芯片910B僅能達到Nvidia公司A100的60%-70%左右,集群的模型訓練難以為繼。而就在2月21日,Nvidia CEO黃仁勛向媒體表示,英偉達目前正在向客戶提供兩款面向中國市場的新型人工智能(AI)芯片樣品,以在美國采取對華芯片出口管制措施的背景下維持該公司在中國市場的地位。

此外,除了華為昇騰外,寒武紀、沐曦、天數(shù)智芯都公布過AI訓練及推理芯片,但是AI芯片生態(tài)尚未有效建立,和Nvidia CUDA生態(tài)對比,還有不少短板。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31225

    瀏覽量

    269579
收藏 人收藏

    評論

    相關推薦

    Cadence如何應對AI芯片設計挑戰(zhàn)

    生成式 AI 引領智能革命成為產業(yè)升級的核心動力并點燃了“百模大戰(zhàn)”。多樣化的大模型應用激增對高性能AI 芯片
    的頭像 發(fā)表于 12-14 15:27 ?733次閱讀

    ai模型ai框架的關系是什么

    AI模型AI框架是人工智能領域中兩個重要的概念,它們之間的關系密切且復雜。 AI模型的定義和特點
    的頭像 發(fā)表于 07-16 10:07 ?4.1w次閱讀

    后摩智能引領AI芯片革命,推出邊端大模型AI芯片M30

    在人工智能(AI)技術飛速發(fā)展的今天,AI模型的部署需求正迅速從云端向端側和邊緣側設備遷移。這一轉變對AI
    的頭像 發(fā)表于 06-28 15:13 ?713次閱讀

    三星電子存儲芯片漲價,AI需求激增提振業(yè)績預期

    在全球科技產業(yè)持續(xù)革新的背景下,人工智能(AI)技術的快速發(fā)展對存儲芯片行業(yè)產生了深遠的影響。隨著AI需求
    的頭像 發(fā)表于 06-27 14:36 ?780次閱讀

    英偉達AI芯片需求激增,封測廠訂單量或翻倍

    在全球半導體行業(yè)持續(xù)演進的背景下,英偉達(NVIDIA)的AI芯片需求正迎來前所未有的增長。據(jù)悉,英偉達GB200與B系列AI
    的頭像 發(fā)表于 06-24 18:05 ?1694次閱讀

    AI芯片哪里買?

    AI芯片
    芯廣場
    發(fā)布于 :2024年05月31日 16:58:19

    STM CUBE AI錯誤導入onnx模型報錯的原因?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發(fā)表于 05-27 07:15

    英偉達首席執(zhí)行官黃仁勛:AI模型推動英偉達AI芯片需求

    近來,以ChatGPT為代表的AI聊天機器人已經導致英偉達AI芯片供應緊張。然而,隨著能夠創(chuàng)造視頻并進行近似人類交流的新型AI模型問世,英偉
    的頭像 發(fā)表于 05-24 10:04 ?528次閱讀

    為什么Cubeai導入模型的時候報錯[AI:persondetection] ModuleNotFoundError: No module named \'_socket\'?

    在使用CubeIde導入ai模型進行模型分析的時候報錯[AI:persondetection] ModuleNotFoundError: No module named \'_sock
    發(fā)表于 05-21 06:44

    risc-v多核芯片AI方面的應用

    RISC-V多核芯片AI方面的應用主要體現(xiàn)在其低功耗、低成本、靈活可擴展以及能夠更好地適應AI算法的不同需求等特點上。 首先,RISC-V適合用于高效設計實現(xiàn),其內核面積更小,功耗更
    發(fā)表于 04-28 09:20

    開發(fā)者手機 AI - 目標識別 demo

    Network Runtime 神經網絡運行時,作為中間橋梁連通上層AI推理框架和底層加速芯片,實現(xiàn)AI模型的跨芯片推理計算。提供統(tǒng)一
    發(fā)表于 04-11 16:14

    防止AI模型被黑客病毒入侵控制(原創(chuàng))聆思大模型AI開發(fā)套件評測4

    ,應用場景和安全需求會有所不同。我會幫助客戶構建安全的 AI模型。上面的只是一些基本的安全措施,在實際中我可以利用eFPGA芯片對上述的功能進行加速,下面我編寫一個加速代碼: //
    發(fā)表于 03-19 11:18

    cubemx ai導入onnx模型后壓縮失敗了怎么解決?

    cubemx ai導入onnx模型后壓縮失敗。請問我怎么解決
    發(fā)表于 03-19 07:58

    AI模型遠程控制啟動車輛(原創(chuàng))

    AI模型
    還沒吃飯
    發(fā)布于 :2024年03月18日 15:18:29

    使用cube-AI分析模型時報錯的原因有哪些?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發(fā)表于 03-14 07:09