0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT AI興起,芯片、服務(wù)器、智能算力浪潮來襲

智能計(jì)算芯世界 ? 來源:智能計(jì)算芯世界 ? 2023-04-12 09:49 ? 次閱讀

AI 需要多元異構(gòu)算力提供支持,拉動 AI 芯片需求。人工智能算法需要從海量的圖像、語音、視頻等非結(jié)構(gòu)化數(shù)據(jù)中挖掘信息。從大模型的訓(xùn)練、場景化的微調(diào)以及推理應(yīng)用場景,都需要算力支撐。而以 CPU 為主的通用計(jì)算能力已經(jīng)無法滿足多場景的 AI 需求。以 CPU+AI 芯片(GPUFPGA、ASIC)提供的異構(gòu)算力,并行計(jì)算能力優(yōu)越、具有高互聯(lián)帶寬,可以支持 AI 計(jì)算效力實(shí)現(xiàn)最大化,成為智能計(jì)算的主流解決方案。

服務(wù)器中的 CPU 和 AI 卡的數(shù)量并不固定,會根據(jù)客戶應(yīng)用需求調(diào)整,對于 AI 服務(wù)器來講,較為常見的是配備 2 個 CPU,以及八個 AI 卡。而相比于 AI 服務(wù)器,傳統(tǒng)的通用服務(wù)器則以 CPU 為主。因此,AI 的發(fā)展將極大拉動 GPGPU、TPU、NPU 等 AI 芯片的需求。

AI 計(jì)算需要多元異構(gòu)算力提供支持,將極大拉動GPGPU、AISC 等 AI 芯片的需求。中國 AI 芯片市場規(guī)模有望快速增長,據(jù)艾瑞咨詢發(fā)布的《2022 年中國人工智能產(chǎn)業(yè)研究報(bào)告(Ⅴ)》,預(yù)計(jì) 2027 年達(dá)到 2164 億元。

中國 AI 芯片市場將保持高速增長,AI 推理芯片份額有望持續(xù)提升,國產(chǎn)化 AI 芯片占比有望提升。2022 年,中國的 AI 芯片市場規(guī)模約 385 億元。隨著 AI 發(fā)展以及智算中心建設(shè)浪潮,該市場預(yù)計(jì)將保持高增長趨勢。據(jù)艾瑞咨詢測算,到 2027 年,中國的 AI 芯片市場規(guī)模預(yù)計(jì)將達(dá)到 2164 億元。另外,在我國高性能及 AI 服務(wù)器中, GPGPU 憑借其優(yōu)秀的性能和通用能力占比 92%, 剩下份額由 AISC 和 FPGA 分享。隨著 AI 模型的優(yōu)化落地,AI 推理芯片的占比將日益提升。據(jù)艾瑞咨詢,2022 年,中國 AI 訓(xùn)練芯片以及 AI 推理芯片的占比分別為 47.2%和 52.8%。

871e72e8-d8c3-11ed-bfe3-dac502259ad0.png

AI 芯片領(lǐng)域的三類玩家。大模型的訓(xùn)練需要大規(guī)模的訓(xùn)練數(shù)據(jù)以及強(qiáng)大的計(jì)算資源,需要多卡多機(jī)協(xié)同完成。這對 AI 芯片本身的性能,以及多卡多機(jī)的互聯(lián)提出了很高的要求。目前,在 AI 芯片領(lǐng)域,有三類玩家。一種是以 Nvidia、AMD 為代表的實(shí)力強(qiáng)勁的老牌芯片巨頭,這些企業(yè)積累了豐富的經(jīng)驗(yàn),產(chǎn)品性能突出。

另一種是以 Google、百度、華為為代表的云計(jì)算巨頭,這些企業(yè)紛紛布局通用大模型,并自己開發(fā)了 AI 芯片、深度學(xué)習(xí)平臺等支持大模型發(fā)展。如 google 的TensorFlow 以及 TPU,華為的鯤鵬昇騰、CANN 及 Mindspore。

最后是一些小而美的 AI 芯片獨(dú)角獸,如寒武紀(jì)、壁仞等。

英偉達(dá)占據(jù) 80%以上中國加速卡市場份額,國產(chǎn) AI 芯片亟待發(fā)展。根據(jù) IDC 的數(shù)據(jù)顯示,2021年中國加速卡的出貨數(shù)量已經(jīng)超過 80 萬片,其中 Nvidia 占據(jù)了超過 80%的市場份額。剩下的份額有 AMD、百度、寒武紀(jì)、燧原科技、新華三、華為、Intel賽靈思品牌。

872f555e-d8c3-11ed-bfe3-dac502259ad0.png

1、英偉達(dá):全球 GPU 龍頭

英偉達(dá)占據(jù)芯片市場絕對優(yōu)勢。長期以來,英偉達(dá)在高端GPU市場占據(jù)絕對主導(dǎo)地位,現(xiàn)如今已量產(chǎn)的主流 A100 芯片相比前代產(chǎn)品 V100,性能得到顯著提高,代表當(dāng)今高端芯片水平。最新一代 H100 芯片也已經(jīng)亮相,即將量產(chǎn)。天數(shù)智芯數(shù)據(jù)顯示,2021 年英偉達(dá)在中國云端 AI 訓(xùn)練芯片市場的份額達(dá)到 90%。據(jù) IDC,在 2021 年中國出貨的 80 多萬張加速卡中,英偉達(dá)占據(jù)超過 80%份額。芯片的研發(fā)周期較長,英偉達(dá)具有絕對先行優(yōu)勢,雖然目前國內(nèi)企業(yè)突破英偉達(dá)壟斷仍然任重道遠(yuǎn),但寒武紀(jì)、華為 AI 芯片快速發(fā)展,有望逐步進(jìn)行國產(chǎn)替代。

8743fb3a-d8c3-11ed-bfe3-dac502259ad0.png

受制裁影響,英偉達(dá)對部分產(chǎn)品性能進(jìn)行 “閹割”,推出“中國版芯片”A800、H800。2022 年10 月,美國發(fā)布了針對中國的先進(jìn)計(jì)算與半導(dǎo)體產(chǎn)品的出口管制,限制美國企業(yè)向中國出口先進(jìn)高端芯片設(shè)備。在新管制的限制下,英偉達(dá)的 A100、H100 被禁止售賣給中國,而采用 12nm 工藝、性能較低的 V100 GPU 芯片不在管控之列。針對此次制裁,英偉達(dá)對 A100 的部分性能進(jìn)行“閹割”,推出 A800。

相比于 A100,A800 在單卡計(jì)算性能上沒有差別,但是互聯(lián)帶寬從600GB/s 下降到了 400GB/s,在一定程度上影響了如大模型訓(xùn)練等多卡互聯(lián)場景的性能。目前,A800 已實(shí)現(xiàn)量產(chǎn),并在中國規(guī)?;涞貞?yīng)用。英偉達(dá)還推出了旗艦芯片 H100 的替代版 H800,目前還未量產(chǎn)。

875329de-d8c3-11ed-bfe3-dac502259ad0.png

2、海光信息:國產(chǎn)高性能 CPU 和 GPGPU 領(lǐng)軍企業(yè)

海光信息專注于研發(fā)、設(shè)計(jì)和銷售高端處理器(CPU 以及 GPGPU),持續(xù)技術(shù)創(chuàng)新、產(chǎn)品迭代。海光信息的主要產(chǎn)品為應(yīng)用于服務(wù)器和工作站等設(shè)備中的通用處理器(CPU)和協(xié)處理器(DCU,即 GPGPU)。海光處理器性能出眾,同時軟硬件生態(tài)豐富、工具鏈完整、應(yīng)用遷移成本低。另外,海光 CPU 與 DCU 雖脫胎于 AMD,但經(jīng)過多年獨(dú)立自主研發(fā)迭代,已經(jīng)實(shí)現(xiàn)自主可控、安全可靠,是***之光。目前,蘇州昆山、成都等多地超算中心已經(jīng)搭載海光 CPU 與 DCU,為社會提供優(yōu)質(zhì)算力。

海光 CPU 一、二代均已商業(yè)化, 三代初亮相,四代有序研發(fā)中。海光 DCU 一代已商業(yè)化應(yīng)用,二代研發(fā)中。公司持續(xù)技術(shù)創(chuàng)新和演進(jìn),堅(jiān)持走“銷售一代, 驗(yàn)證一代, 研發(fā)一代”的產(chǎn)品開發(fā)策略。公司建立了完善的高端處理器的研發(fā)環(huán)境和流程,持續(xù)開發(fā)多代產(chǎn)品,產(chǎn)品性能不斷提高,同時功能不斷完善豐富。海光 CPU 的四代產(chǎn)品中,海光一號和海光二號均實(shí)現(xiàn)了商業(yè)化應(yīng)用,海光三號已亮相發(fā)布會,海光四號處于研發(fā)階段。海光 DCU 于 2018 年啟動 DCU 第一代產(chǎn)品深算一號的產(chǎn)品研發(fā),于 2020 年 1 月啟動了深算二號的研發(fā),截至 2022 年 6 月,深算一號已實(shí)現(xiàn)商業(yè)化應(yīng)用。

87659aba-d8c3-11ed-bfe3-dac502259ad0.png

海光 DCU 某些硬件性能與英偉達(dá)的 A100、AMD 的 MI100 相近。海光 DCU 雙精度計(jì)算能力突出。據(jù)北京大學(xué)高性能計(jì)算系統(tǒng)中標(biāo)公告(HCZB-2021-ZB0364),海光信息的 DCU Z100 的通用計(jì)算核心達(dá)到 8192 個。其關(guān)鍵性能指標(biāo)實(shí)現(xiàn):FP64 10.8TFlops,顯存 32GB HBM2,對比全球芯片巨頭的高端 AI 芯片不遑多讓。英偉達(dá) A100 的相關(guān)指標(biāo)為:FP64 9.7 TFlops、顯存40/80GB HBM2。AMD MI100 的相關(guān)指標(biāo)為:FP64 11.5 TFlops、顯存 32GB HBM2。

877491a0-d8c3-11ed-bfe3-dac502259ad0.png

海光 DCU 生態(tài)豐富,工具鏈完整。海光的 DCU 脫胎于 AMD,兼容主流生態(tài)——開源 ROCmGPU 計(jì)算生態(tài),支持 TensorFlow、Pytorch 和 PaddlePaddle 等主流深度學(xué)習(xí)框架、適配主流應(yīng)軟件。ROCm 又被稱為類 CUDA,現(xiàn)有 CUDA 上運(yùn)行的應(yīng)用可以低成本遷移到基于 ROCm 的海光平臺上運(yùn)行。

2022 年,海光發(fā)布國內(nèi)首個全精度(FP64)異構(gòu)計(jì)算平臺,該平臺搭載 CPU 海光三號和 DCU海光深算,涵蓋數(shù)值模擬、AI 訓(xùn)練、AI 推理所需的多樣算力,實(shí)現(xiàn)了智能計(jì)算與數(shù)值運(yùn)算的深度融合。同時,此平臺可全面支持 TensorFlow、PyTorch、Caffe2 等主流 AI 深度學(xué)習(xí)框架,目前已超過 1000 種應(yīng)用軟件部署在該平臺上。

3、寒武紀(jì):國產(chǎn) AI 芯片先行者

寒武紀(jì)始終深耕芯片研發(fā),不斷推陳出新、實(shí)現(xiàn)技術(shù)進(jìn)步。寒武紀(jì)成立于 2016 年,專注人工智能芯片產(chǎn)品的研發(fā)與創(chuàng)新。公司成立之初便開始了對 AI 芯片領(lǐng)域的探索創(chuàng)新。并在 2016 年年底成功研發(fā)出全球首款 AI 手機(jī)芯片——寒武紀(jì) 1A 。2017 年,這款芯片被搭載于華為的高端系統(tǒng)級芯片麒麟 970,應(yīng)用于 Mate10 手機(jī),并獲得了廣泛好評。芯片可以在功耗極低的前提下,涵蓋人臉識別、語音識別、圖像增強(qiáng)等多種功能。此后,寒武紀(jì)又陸續(xù)推出了多款 AI 芯片產(chǎn)品,包括云端訓(xùn)練芯片 MLU100、邊緣推理芯片 MLU270、車載推理芯片 MLU290 等 。這些產(chǎn)品都具有高性能、低功耗、高集成度等特點(diǎn),在圖像識別、語音識別、自然語言處理等領(lǐng)域都有著優(yōu)異的表現(xiàn)。

8782e9d0-d8c3-11ed-bfe3-dac502259ad0.png

思元 370 是寒武紀(jì)的首款訓(xùn)練推理一體芯片,也是其云端產(chǎn)品的第三代。思元 370 采用了 7nm 制程工藝,并成為首款采用 Chiplet 技術(shù)的人工智能芯片。該芯片最大算力可達(dá) 256TOPS(INT8),是上一代云端推理產(chǎn)品思元 270 算力的兩倍,同時該芯片還支持 LPDDR5 內(nèi)存,內(nèi)存帶寬是 270的三倍,因此可以在板卡有限的功耗范圍內(nèi)為人工智能芯片分配更多的能源,從而輸出更高的算力。思元 370 智能芯片還采用了先進(jìn)的 Chiplet 技術(shù),支持靈活的芯粒組合,僅用單次流片便可以實(shí)現(xiàn)多款智能加速卡產(chǎn)品的商用。目前,該公司已推出三款加速卡:MLU370-S4、MLU370-X4和 MLU370-X8,包含應(yīng)用于計(jì)算密度高的數(shù)據(jù)中心、針對專注人工智能推理相關(guān)業(yè)務(wù)的互聯(lián)網(wǎng)廠商需求和應(yīng)用于對算力帶寬要求高的訓(xùn)練任務(wù),滿足用戶的多樣化需求。

新一代訓(xùn)練芯片寒武紀(jì) 590 還未量產(chǎn),據(jù)悉訓(xùn)練能力突出。寒武紀(jì)最新一代云端智能訓(xùn)練芯片思元 590 還未正式發(fā)布,據(jù)寒武紀(jì)董事長在 2022 WAIC 上介紹,思元 590 采用全新的 MLUarch05架構(gòu),實(shí)測訓(xùn)練性能較在售產(chǎn)品有了顯著提升。思元 590 可提供更大的內(nèi)存容量和更高的內(nèi)存帶寬,其 PCIe 接口也較上代實(shí)現(xiàn)了升級。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    50907

    瀏覽量

    424430
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4615

    瀏覽量

    93004
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47372

    瀏覽量

    238856

原文標(biāo)題:ChatGPT AI興起,芯片、服務(wù)器、智能算力浪潮來襲

文章出處:【微信號:AI_Architect,微信公眾號:智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    再躍升!億萬克發(fā)布新一代AI服務(wù)器——G882N7+!

    的特質(zhì),但告急。想要打破數(shù)智時代的瓶頸,異構(gòu)智成為有效方案。 近期,億萬克面向激增的AI
    的頭像 發(fā)表于 10-25 17:02 ?221次閱讀

    什么是AI服務(wù)器AI服務(wù)器的優(yōu)勢是什么?

    AI服務(wù)器是一種專門為人工智能應(yīng)用設(shè)計(jì)的服務(wù)器,它采用異構(gòu)形式的硬件架構(gòu),通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速
    的頭像 發(fā)表于 09-21 11:43 ?910次閱讀

    環(huán)球儀器助力應(yīng)對服務(wù)器組裝挑戰(zhàn)

    隨著智能化、云服務(wù)、AI等產(chǎn)業(yè)的發(fā)展,的作用日漸突出。服務(wù)器作為提供
    的頭像 發(fā)表于 09-14 11:34 ?365次閱讀

    服務(wù)器為什么選擇GPU

    隨著人工智能技術(shù)的快速普及,需求日益增長。智中心的服務(wù)器作為支撐大規(guī)模數(shù)據(jù)處理和計(jì)算的核心設(shè)備,其性能優(yōu)化顯得尤為關(guān)鍵。而GPU
    的頭像 發(fā)表于 07-25 08:28 ?664次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服務(wù)器</b>為什么選擇GPU

    ai服務(wù)器是什么架構(gòu)類型

    AI服務(wù)器,即人工智能服務(wù)器,是專門為人工智能應(yīng)用設(shè)計(jì)的高性能計(jì)算服務(wù)器。
    的頭像 發(fā)表于 07-02 09:51 ?1105次閱讀

    AI服務(wù)器散熱,需要用到哪些導(dǎo)熱界面材料?

    在數(shù)字經(jīng)濟(jì)、AI大模型等發(fā)展的帶動下,全球服務(wù)器的市場需求急劇提升,利用其強(qiáng)大的計(jì)算能力,能夠處理復(fù)雜的算法和海量數(shù)據(jù)。與此同時,生成式人工智能的大
    的頭像 發(fā)表于 05-30 10:44 ?715次閱讀
    <b class='flag-5'>AI</b>高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服務(wù)器</b>散熱,需要用到哪些導(dǎo)熱界面材料?

    智能存在缺口,AI服務(wù)器市場規(guī)模持續(xù)提升

    商的資本支出將大幅增加。全球前四大云服務(wù)商資本支出調(diào)升,預(yù)計(jì)將從2023年的1400億美元提升至2024年的超過2000億美元。 ? AI 服務(wù)器市場規(guī)模持續(xù)增長 ? 近些年,人工智能
    的頭像 發(fā)表于 05-22 00:14 ?3100次閱讀

    弘信電子簽訂服務(wù)器產(chǎn)品銷售合同

    弘信電子的子公司甘肅燧弘人工智能科技有限公司與慶陽市京合云計(jì)算科技有限公司簽訂了服務(wù)器產(chǎn)品銷售合同 。
    的頭像 發(fā)表于 05-13 11:10 ?560次閱讀

    解鎖未來,華為云耀云服務(wù)器 X 實(shí)例引領(lǐng)柔性新時代

    在數(shù)字化浪潮的推動下,云計(jì)算已經(jīng)成為企業(yè)發(fā)展的必然選擇,但傳統(tǒng)云服務(wù)器常常束縛了企業(yè)的發(fā)展步伐。云耀云服務(wù)器 X 實(shí)例的問世,標(biāo)志著云計(jì)算邁向了全新的柔性
    的頭像 發(fā)表于 04-11 22:23 ?1025次閱讀
    解鎖未來,華為云耀云<b class='flag-5'>服務(wù)器</b> X 實(shí)例引領(lǐng)柔性<b class='flag-5'>算</b><b class='flag-5'>力</b>新時代

    256Tops!CSA1-N8S1684X服務(wù)器

    (基于BM1684X的高服務(wù)器)高AI處理
    的頭像 發(fā)表于 03-23 08:02 ?1670次閱讀
    256Tops<b class='flag-5'>算</b><b class='flag-5'>力</b>!CSA1-N8S1684X<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服務(wù)器</b>

    聯(lián)想向燧弘華創(chuàng)交付首臺搭載國產(chǎn)AI芯片的問天WA5480 G3服務(wù)器

    3月19日,在聯(lián)想集團(tuán)(全球)最大的智能計(jì)算設(shè)備研發(fā)和制造基地——聯(lián)寶科技,聯(lián)想集團(tuán)向燧弘華創(chuàng)交付聯(lián)想首臺可搭載國產(chǎn)AI芯片的聯(lián)想問天W
    的頭像 發(fā)表于 03-22 09:40 ?895次閱讀

    聯(lián)想首臺可搭載國產(chǎn)AI芯片的聯(lián)想問天WA5480 G3服務(wù)器成功交付

    3月19日,在聯(lián)想(全球)最大的智能計(jì)算設(shè)備研發(fā)和制造基地——聯(lián)寶科技,中國領(lǐng)先的智能IT基礎(chǔ)設(shè)施提供商聯(lián)想續(xù)寫智新篇章:聯(lián)想首臺可搭載國產(chǎn)AI
    的頭像 發(fā)表于 03-20 10:36 ?528次閱讀

    聯(lián)想首臺搭載國產(chǎn)AI芯片服務(wù)器成功交付

    在聯(lián)想(全球)最大的智能計(jì)算設(shè)備研發(fā)和制造基地——聯(lián)寶科技,一場科技界的盛事吸引了業(yè)界的廣泛關(guān)注。這一天,中國領(lǐng)先的智能IT基礎(chǔ)設(shè)施提供商聯(lián)想成功交付了首臺可搭載國產(chǎn)AI
    的頭像 發(fā)表于 03-20 09:42 ?787次閱讀

    能RADXA微服務(wù)器試用體驗(yàn)】Radxa Fogwise 1684X Mini 規(guī)格

    通過網(wǎng)絡(luò)可以了解到,能RADXA微服務(wù)器的具體規(guī)格: 處理:BM1684X :高達(dá)32Tops INT8峰值
    發(fā)表于 02-28 11:21

    國產(chǎn)服務(wù)器主陣地有哪些?

    AI 、低功耗等對服務(wù)器芯片提出新的要求,英
    的頭像 發(fā)表于 01-29 11:29 ?1309次閱讀
    國產(chǎn)<b class='flag-5'>服務(wù)器</b>主陣地有哪些?