0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型AI興起:新一輪芯片、服務(wù)器、智算等浪潮來襲

架構(gòu)師技術(shù)聯(lián)盟 ? 來源:架構(gòu)師技術(shù)聯(lián)盟 ? 2023-04-26 09:21 ? 次閱讀

AI需要多元異構(gòu)算力提供支持,拉動AI芯片需求。人工智能算法需要從海量的圖像、語音、視頻等非結(jié)構(gòu)化數(shù)據(jù)中挖掘信息。從大模型的訓(xùn)練、場景化的微調(diào)以及推理應(yīng)用場景,都需要算力支撐。而以CPU為主的通用計算能力已經(jīng)無法滿足多場景的AI需求。以CPU+AI芯片(GPU、FPGA、ASIC)提供的異構(gòu)算力,并行計算能力優(yōu)越、具有高互聯(lián)帶寬,可以支持AI計算效力實現(xiàn)最大化,成為智能計算的主流解決方案。

服務(wù)器中的CPU和AI卡的數(shù)量并不固定,會根據(jù)客戶應(yīng)用需求調(diào)整,對于AI服務(wù)器來講,較為常見的是配備2個CPU,以及八個AI卡。而相比于AI服務(wù)器,傳統(tǒng)的通用服務(wù)器則以CPU為主。因此,AI的發(fā)展將極大拉動GPGPU、TPU、NPU等AI芯片的需求。

AI 計算需要多元異構(gòu)算力提供支持,將極大拉動GPGPU、AISC 等 AI 芯片的需求。中國 AI 芯片市場規(guī)模有望快速增長,據(jù)艾瑞咨詢發(fā)布的《2022 年中國人工智能產(chǎn)業(yè)研究報告(Ⅴ)》,預(yù)計 2027 年達(dá)到 2164 億元。

中國AI芯片市場將保持高速增長,AI推理芯片份額有望持續(xù)提升,國產(chǎn)化AI芯片占比有望提升。2022年,中國的AI芯片市場規(guī)模約385億元。隨著AI發(fā)展以及智算中心建設(shè)浪潮,該市場預(yù)計將保持高增長趨勢。據(jù)艾瑞咨詢測算,到2027年,中國的AI芯片市場規(guī)模預(yù)計將達(dá)到2164億元。另外,在我國高性能及AI服務(wù)器中,GPGPU憑借其優(yōu)秀的性能和通用能力占比92%,剩下份額由AISC和FPGA分享。隨著AI模型的優(yōu)化落地,AI推理芯片的占比將日益提升。據(jù)艾瑞咨詢,2022年,中國AI訓(xùn)練芯片以及AI推理芯片的占比分別為47.2%和52.8%。

445950e8-e3ce-11ed-ab56-dac502259ad0.png

AI芯片領(lǐng)域的三類玩家。大模型的訓(xùn)練需要大規(guī)模的訓(xùn)練數(shù)據(jù)以及強(qiáng)大的計算資源,需要多卡多機(jī)協(xié)同完成。這對AI芯片本身的性能,以及多卡多機(jī)的互聯(lián)提出了很高的要求。目前,在AI芯片領(lǐng)域,有三類玩家。一種是以Nvidia、AMD為代表的實力強(qiáng)勁的老牌芯片巨頭,這些企業(yè)積累了豐富的經(jīng)驗,產(chǎn)品性能突出。

另一種是以Google、百度、華為為代表的云計算巨頭,這些企業(yè)紛紛布局通用大模型,并自己開發(fā)了AI芯片、深度學(xué)習(xí)平臺等支持大模型發(fā)展。如google的TensorFlow以及TPU,華為的鯤鵬昇騰、CANN及Mindspore。

最后是一些小而美的AI芯片獨角獸,如寒武紀(jì)、壁仞等。

英偉達(dá)占據(jù)80%以上中國加速卡市場份額,國產(chǎn)AI芯片亟待發(fā)展。根據(jù)IDC的數(shù)據(jù)顯示,2021年中國加速卡的出貨數(shù)量已經(jīng)超過80萬片,其中Nvidia占據(jù)了超過80%的市場份額。剩下的份額有AMD、百度、寒武紀(jì)、燧原科技、新華三、華為、Intel賽靈思等品牌。

446e045c-e3ce-11ed-ab56-dac502259ad0.png

1、英偉達(dá):全球GPU龍頭

英偉達(dá)占據(jù)芯片市場絕對優(yōu)勢。長期以來,英偉達(dá)在高端GPU市場占據(jù)絕對主導(dǎo)地位,現(xiàn)如今已量產(chǎn)的主流A100芯片相比前代產(chǎn)品V100,性能得到顯著提高,代表當(dāng)今高端芯片水平。最新一代H100芯片也已經(jīng)亮相,即將量產(chǎn)。天數(shù)智芯數(shù)據(jù)顯示,2021年英偉達(dá)在中國云端AI訓(xùn)練芯片市場的份額達(dá)到90%。據(jù)IDC,在2021年中國出貨的80多萬張加速卡中,英偉達(dá)占據(jù)超過80%份額。芯片的研發(fā)周期較長,英偉達(dá)具有絕對先行優(yōu)勢,雖然目前國內(nèi)企業(yè)突破英偉達(dá)壟斷仍然任重道遠(yuǎn),但寒武紀(jì)、華為AI芯片快速發(fā)展,有望逐步進(jìn)行國產(chǎn)替代。

448ab96c-e3ce-11ed-ab56-dac502259ad0.png

受制裁影響,英偉達(dá)對部分產(chǎn)品性能進(jìn)行 “閹割”,推出“中國版芯片”A800、H800。2022年10月,美國發(fā)布了針對中國的先進(jìn)計算與半導(dǎo)體產(chǎn)品的出口管制,限制美國企業(yè)向中國出口先進(jìn)高端芯片設(shè)備。在新管制的限制下,英偉達(dá)的A100、H100被禁止售賣給中國,而采用12nm工藝、性能較低的V100 GPU芯片不在管控之列。針對此次制裁,英偉達(dá)對A100的部分性能進(jìn)行“閹割”,推出A800。

相比于A100,A800在單卡計算性能上沒有差別,但是互聯(lián)帶寬從600GB/s下降到了400GB/s,在一定程度上影響了如大模型訓(xùn)練等多卡互聯(lián)場景的性能。目前,A800已實現(xiàn)量產(chǎn),并在中國規(guī)模化落地應(yīng)用。英偉達(dá)還推出了旗艦芯片H100的替代版H800,目前還未量產(chǎn)。

44ac04a0-e3ce-11ed-ab56-dac502259ad0.png

2、海光信息:國產(chǎn)高性能CPU和GPGPU領(lǐng)軍企業(yè)

海光信息專注于研發(fā)、設(shè)計和銷售高端處理器(CPU以及GPGPU),持續(xù)技術(shù)創(chuàng)新、產(chǎn)品迭代。海光信息的主要產(chǎn)品為應(yīng)用于服務(wù)器和工作站等設(shè)備中的通用處理器(CPU)和協(xié)處理器(DCU,即GPGPU)。海光處理器性能出眾,同時軟硬件生態(tài)豐富、工具鏈完整、應(yīng)用遷移成本低。另外,海光CPU與DCU雖脫胎于AMD,但經(jīng)過多年獨立自主研發(fā)迭代,已經(jīng)實現(xiàn)自主可控、安全可靠,是***之光。目前,蘇州昆山、成都等多地超算中心已經(jīng)搭載海光CPU與DCU,為社會提供優(yōu)質(zhì)算力。

海光CPU一、二代均已商業(yè)化, 三代初亮相,四代有序研發(fā)中。海光DCU一代已商業(yè)化應(yīng)用,二代研發(fā)中。公司持續(xù)技術(shù)創(chuàng)新和演進(jìn),堅持走“銷售一代, 驗證一代, 研發(fā)一代”的產(chǎn)品開發(fā)策略。公司建立了完善的高端處理器的研發(fā)環(huán)境和流程,持續(xù)開發(fā)多代產(chǎn)品,產(chǎn)品性能不斷提高,同時功能不斷完善豐富。海光CPU的四代產(chǎn)品中,海光一號和海光二號均實現(xiàn)了商業(yè)化應(yīng)用,海光三號已亮相發(fā)布會,海光四號處于研發(fā)階段。海光DCU于2018年啟動DCU第一代產(chǎn)品深算一號的產(chǎn)品研發(fā),于2020年1月啟動了深算二號的研發(fā),截至2022年6月,深算一號已實現(xiàn)商業(yè)化應(yīng)用。

44caf8a6-e3ce-11ed-ab56-dac502259ad0.png

海光DCU某些硬件性能與英偉達(dá)的A100、AMD的MI100相近。海光DCU雙精度計算能力突出。據(jù)北京大學(xué)高性能計算系統(tǒng)中標(biāo)公告(HCZB-2021-ZB0364),海光信息的DCU Z100的通用計算核心達(dá)到8192個。其關(guān)鍵性能指標(biāo)實現(xiàn):FP64 10.8TFlops,顯存32GB HBM2,對比全球芯片巨頭的高端AI芯片不遑多讓。英偉達(dá)A100的相關(guān)指標(biāo)為:FP64 9.7 TFlops、顯存40/80GB HBM2。AMD MI100的相關(guān)指標(biāo)為:FP64 11.5 TFlops、顯存32GB HBM2。

44f40ed0-e3ce-11ed-ab56-dac502259ad0.png

海光DCU生態(tài)豐富,工具鏈完整。海光的DCU脫胎于AMD,兼容主流生態(tài)——開源ROCmGPU計算生態(tài),支持TensorFlow、Pytorch和PaddlePaddle等主流深度學(xué)習(xí)框架、適配主流應(yīng)軟件。ROCm又被稱為類CUDA,現(xiàn)有CUDA上運行的應(yīng)用可以低成本遷移到基于ROCm的海光平臺上運行。

2022年,海光發(fā)布國內(nèi)首個全精度(FP64)異構(gòu)計算平臺,該平臺搭載CPU海光三號和DCU海光深算,涵蓋數(shù)值模擬、AI訓(xùn)練、AI推理所需的多樣算力,實現(xiàn)了智能計算與數(shù)值運算的深度融合。同時,此平臺可全面支持TensorFlow、PyTorch、Caffe2等主流AI深度學(xué)習(xí)框架,目前已超過1000種應(yīng)用軟件部署在該平臺上。

3、寒武紀(jì):國產(chǎn)AI芯片先行者

寒武紀(jì)始終深耕芯片研發(fā),不斷推陳出新、實現(xiàn)技術(shù)進(jìn)步。寒武紀(jì)成立于2016年,專注人工智能芯片產(chǎn)品的研發(fā)與創(chuàng)新。公司成立之初便開始了對AI芯片領(lǐng)域的探索創(chuàng)新。并在2016年年底成功研發(fā)出全球首款A(yù)I手機(jī)芯片——寒武紀(jì)1A。2017年,這款芯片被搭載于華為的高端系統(tǒng)級芯片麒麟970,應(yīng)用于Mate10手機(jī),并獲得了廣泛好評。芯片可以在功耗極低的前提下,涵蓋人臉識別、語音識別、圖像增強(qiáng)等多種功能。此后,寒武紀(jì)又陸續(xù)推出了多款A(yù)I芯片產(chǎn)品,包括云端訓(xùn)練芯片MLU100、邊緣推理芯片MLU270、車載推理芯片MLU290等 。這些產(chǎn)品都具有高性能、低功耗、高集成度等特點,在圖像識別、語音識別、自然語言處理等領(lǐng)域都有著優(yōu)異的表現(xiàn)。

450900f6-e3ce-11ed-ab56-dac502259ad0.png

思元370是寒武紀(jì)的首款訓(xùn)練推理一體芯片,也是其云端產(chǎn)品的第三代。思元370采用了7nm制程工藝,并成為首款采用Chiplet技術(shù)的人工智能芯片。該芯片最大算力可達(dá)256TOPS(INT8),是上一代云端推理產(chǎn)品思元270算力的兩倍,同時該芯片還支持LPDDR5內(nèi)存,內(nèi)存帶寬是270的三倍,因此可以在板卡有限的功耗范圍內(nèi)為人工智能芯片分配更多的能源,從而輸出更高的算力。思元370智能芯片還采用了先進(jìn)的Chiplet技術(shù),支持靈活的芯粒組合,僅用單次流片便可以實現(xiàn)多款智能加速卡產(chǎn)品的商用。目前,該公司已推出三款加速卡:MLU370-S4、MLU370-X4和MLU370-X8,包含應(yīng)用于計算密度高的數(shù)據(jù)中心、針對專注人工智能推理相關(guān)業(yè)務(wù)的互聯(lián)網(wǎng)廠商需求和應(yīng)用于對算力帶寬要求高的訓(xùn)練任務(wù),滿足用戶的多樣化需求。

新一代訓(xùn)練芯片寒武紀(jì)590還未量產(chǎn),據(jù)悉訓(xùn)練能力突出。寒武紀(jì)最新一代云端智能訓(xùn)練芯片思元590還未正式發(fā)布,據(jù)寒武紀(jì)董事長在2022 WAIC上介紹,思元590采用全新的MLUarch05架構(gòu),實測訓(xùn)練性能較在售產(chǎn)品有了顯著提升。思元590可提供更大的內(nèi)存容量和更高的內(nèi)存帶寬,其PCIe接口也較上代實現(xiàn)了升級。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    51600

    瀏覽量

    429913
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    32487

    瀏覽量

    271697
  • 人工智能
    +關(guān)注

    關(guān)注

    1800

    文章

    48094

    瀏覽量

    242228

原文標(biāo)題:大模型AI興起:新一輪芯片、服務(wù)器、智算等浪潮來襲

文章出處:【微信號:架構(gòu)師技術(shù)聯(lián)盟,微信公眾號:架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Lunar Lake大戰(zhàn)Strix Point!AMD、英特爾掀起新一輪AI PC芯片“大躍進(jìn)”

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)最近在COMPUTEX 2024上,可以說AI PC掀起了新一輪的PC芯片“大躍進(jìn)”。 ? AMD、Intel接連推出全新的移動端AI PC
    的頭像 發(fā)表于 06-06 09:15 ?4220次閱讀

    海納AI獲5000萬新一輪融資

    近日,國內(nèi)領(lǐng)先的AI面試測評解決方案提供商海納AI宣布成功獲得5000萬元人民幣的新一輪融資。本輪融資由德同資本領(lǐng)投,求是資本跟投,共同為海納AI的未來發(fā)展注入新的活力。 這筆資金將主
    的頭像 發(fā)表于 02-19 10:10 ?159次閱讀

    慶虹電子獲新一輪融資,比亞迪參與投資

    ,廣泛應(yīng)用于通訊網(wǎng)絡(luò)、計算機(jī)、服務(wù)器以及通信交換機(jī)多個領(lǐng)域。憑借卓越的產(chǎn)品質(zhì)量和專業(yè)的技術(shù)服務(wù),慶虹電子在市場上贏得了良好的口碑和廣泛的認(rèn)可。 此次獲得新一輪融資,不僅是對慶虹電子過
    的頭像 發(fā)表于 12-02 10:39 ?398次閱讀

    字節(jié)跳動開啟新一輪股權(quán)回購

    字節(jié)跳動近日向員工發(fā)布了新一輪股權(quán)回購的郵件通知。此次回購中,在職員工的稅前回購價定為每股180.7美元,而離職員工的回購價則為153.6美元。
    的頭像 發(fā)表于 10-11 15:46 ?474次閱讀

    OpenAI新一輪融資66億美元,鞏固AI領(lǐng)先地位

    近日,美國人工智能領(lǐng)域的佼佼者OpenAI宣布,在最新一輪融資中成功籌集了高達(dá)66億美元的資金。此次融資后,OpenAI的估值飆升至1570億美元,再次彰顯了其在全球AI領(lǐng)域的強(qiáng)勁實力。
    的頭像 發(fā)表于 10-08 14:44 ?441次閱讀

    Anthropic擬進(jìn)行新一輪融資

    人工智能領(lǐng)域再掀波瀾,初創(chuàng)公司Anthropic正緊鑼密鼓地籌備新一輪融資,市場預(yù)計其估值將躍升至400億美元大關(guān)。此次融資吸引了包括谷歌、亞馬遜科技巨頭的青睞,彰顯了Anthropic在AI賽道上的強(qiáng)勁競爭力和市場潛力。目前
    的頭像 發(fā)表于 09-24 15:19 ?462次閱讀

    什么是AI服務(wù)器?AI服務(wù)器的優(yōu)勢是什么?

    AI服務(wù)器種專門為人工智能應(yīng)用設(shè)計的服務(wù)器,它采用異構(gòu)形式的硬件架構(gòu),通常搭載GPU、FPGA、ASIC加速
    的頭像 發(fā)表于 09-21 11:43 ?1392次閱讀

    摩爾線程GPU力底座助力大模型產(chǎn)業(yè)發(fā)展

    以大模型為代表的新代人工智能技術(shù)是引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù)和重要驅(qū)動力量,隨著對力需求的日益高漲,人工智能力底座公司日
    的頭像 發(fā)表于 08-27 16:15 ?741次閱讀

    后摩智能引領(lǐng)AI芯片革命,推出邊端大模型AI芯片M30

    的技術(shù)實力,推出了基于存體架構(gòu)的邊端大模型AI芯片——后摩漫界??M30,引領(lǐng)了AI
    的頭像 發(fā)表于 06-28 15:13 ?828次閱讀

    英偉達(dá)新業(yè)務(wù)動向:AI服務(wù)器市場的新變局

    在全球AI技術(shù)迅猛發(fā)展的浪潮中,英偉達(dá)正積極布局,尋求新的業(yè)務(wù)增長點。據(jù)最新報道,英偉達(dá)計劃為其即將推出的GB200旗艦人工智能芯片設(shè)計服務(wù)器機(jī)架,此舉無疑將對該領(lǐng)域的傳統(tǒng)廠商如戴爾、
    的頭像 發(fā)表于 06-21 14:11 ?1142次閱讀

    銀河水滴科技完成新一輪股權(quán)融資

    近日,步態(tài)身份識別系統(tǒng)研發(fā)商銀河水滴科技完成新一輪股權(quán)融資,融資額未披露,本輪投資方為蘇高新金控。
    的頭像 發(fā)表于 05-28 11:24 ?1493次閱讀
    銀河水滴科技完成<b class='flag-5'>新一輪</b>股權(quán)融資

    基于英特爾至強(qiáng)可擴(kuò)展處理浪潮信息服務(wù)器AI訓(xùn)推體化方案

    模型已經(jīng)成為新一輪數(shù)字化轉(zhuǎn)型的重要驅(qū)動力,為了降低對力與語料資源的要求,加快大模型在實際應(yīng)用的部署,目前企業(yè)普遍在開源/商用大模型中,加
    的頭像 發(fā)表于 05-11 09:27 ?1650次閱讀
    基于英特爾至強(qiáng)可擴(kuò)展處理<b class='flag-5'>器</b>的<b class='flag-5'>浪潮</b>信息<b class='flag-5'>服務(wù)器</b><b class='flag-5'>AI</b>訓(xùn)推<b class='flag-5'>一</b>體化方案

    RISC-V在服務(wù)器方面應(yīng)用與發(fā)展前景

    RISC-V在服務(wù)器方面的應(yīng)用與發(fā)展前景十分廣闊。作為種開源、開放、簡潔、靈活的指令集,RISC-V近年來在芯片產(chǎn)業(yè)中發(fā)展迅速,并逐漸引領(lǐng)新一輪處理
    發(fā)表于 04-28 09:04

    RISC-V在服務(wù)器方面的應(yīng)用與發(fā)展前景如何?剛畢業(yè)的學(xué)生才開始學(xué)來的及嗎?

    RISC-V在服務(wù)器方面的應(yīng)用與發(fā)展前景十分廣闊。作為種開源、開放、簡潔、靈活的指令集,RISC-V近年來在芯片產(chǎn)業(yè)中發(fā)展迅速,并逐漸引領(lǐng)新一輪處理
    發(fā)表于 04-28 08:49

    AI服務(wù)器催生創(chuàng)新變革,電子行業(yè)迎來新一輪產(chǎn)品質(zhì)量挑戰(zhàn)

    AI需求暴增、5G升級周期和汽車智能電動化因素的推動下,全球電子市場進(jìn)入新一輪的增長期,尤其是在通信電子、消費電子和汽車電子領(lǐng)域。需求增長促使上游產(chǎn)能升級的同時,也帶來了制造和設(shè)
    發(fā)表于 04-19 17:49 ?767次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>服務(wù)器</b>催生創(chuàng)新變革,電子行業(yè)迎來<b class='flag-5'>新一輪</b>產(chǎn)品質(zhì)量挑戰(zhàn)