電子發(fā)燒友網(wǎng)報道(文/李彎彎)根據(jù)應(yīng)用場景的不同,AI芯片被分為云端AI芯片和邊緣AI芯片。云端AI芯片有些用于訓(xùn)練,有些用于推理。過去幾年AI芯片的市場需求不斷增加,2017年整體AI芯片市場規(guī)模為62.7億美元,預(yù)計到2022年將會達到596.2億美元。
而云端AI芯片的市場需求也是增長明顯,根據(jù)市場調(diào)研機構(gòu)數(shù)據(jù),2017年云端訓(xùn)練AI芯片市場規(guī)模為20.2億美元,云端推理芯片為3.4億美元。預(yù)計到2022年,云端訓(xùn)練AI芯片將達到172.1億美元,云端推理芯片為71.9億美元
如今在全球云端AI芯片市場領(lǐng)域,可以說是英偉達一家獨大,在云端訓(xùn)練市場占比達到90%,在云端推理市場占比也高達60%。另外,國外的英特爾、AMD等廠商也在積極布局。
在國內(nèi),也有大批企業(yè)尋求在云端AI芯片方面不斷突破,包括寒武紀(jì)、昆侖芯、燧原科技、天數(shù)智芯,以及瀚博半導(dǎo)體、沐曦集成、壁仞科技、摩爾線程、登臨科技等。這里對這些企業(yè)及產(chǎn)品進展做了梳理,如下:
寒武紀(jì)
寒武紀(jì)成立于2016年,專注于人工智能芯片產(chǎn)品的研發(fā)與技術(shù)創(chuàng)新,致力于打造人工智能領(lǐng)域的核心處理器芯片。產(chǎn)品廣泛應(yīng)用于服務(wù)器廠商和產(chǎn)業(yè)公司,面向互聯(lián)網(wǎng)、金融、交通、能源、電力和制造等領(lǐng)域的復(fù)雜AI應(yīng)用場景提供充裕算力,推動人工智能賦能產(chǎn)業(yè)升級。
寒武紀(jì)云端智能芯片產(chǎn)品,大致可以分為云端訓(xùn)練芯片和云端推理芯片,包括云端推理芯片思元270,主要面向云端訓(xùn)練的高端產(chǎn)品思元290,以及主要面向中高端訓(xùn)推場景的思元370。
思元290是寒武紀(jì)首顆AI訓(xùn)練芯片,采用創(chuàng)新性的MLUv02擴展架構(gòu),使用臺積電7nm先進制程工藝制造,在一顆芯片上集成了高達460億的晶體管。
思元370基于7nm制程工藝,是寒武紀(jì)首款采用chiplet(芯粒)技術(shù)的AI芯片,集成了390億個晶體管,最大算力高達256TOPS(INT8),是寒武紀(jì)第二代產(chǎn)品思元270算力的2倍。憑借寒武紀(jì)最新智能芯片架構(gòu)MLUarch03,思元370實測性能表現(xiàn)更為優(yōu)秀。
思元370是國內(nèi)第一款公開發(fā)布支持LPDDR5內(nèi)存的云端AI芯片,內(nèi)存帶寬是上一代產(chǎn)品的3倍,訪存能效達GDDR6的1.5倍。搭載MLU-Link?多芯互聯(lián)技術(shù),在分布式訓(xùn)練或推理任務(wù)中為多顆思元370芯片提供高效協(xié)同能力。全新升級的Cambricon NeuWare軟件棧,新增推理加速引擎MagicMind,實現(xiàn)訓(xùn)推一體,大幅提升了開發(fā)部署的效率,降低用戶的學(xué)習(xí)成本、開發(fā)成本和運營成本。
思元370通過不同MLU-Die組合出了三款不同規(guī)格、符合不同場景需求的加速卡產(chǎn)品MLU370-S4、MLU370-X4、MLU370-X8。
2021年,寒武紀(jì)與阿里巴巴等頭部互聯(lián)網(wǎng)企業(yè)的多個業(yè)務(wù)部門進行了深入合作,云端產(chǎn)品思元370芯片及加速卡在視覺、語音、圖文識別等場景的適配性能表現(xiàn)超出客戶預(yù)期,部分場景已經(jīng)進入小批量銷售環(huán)節(jié)。在金融領(lǐng)域,寒武紀(jì)與多家頭部銀行進行了導(dǎo)入和適配。其中,MLU370-X4在招商銀行多個業(yè)務(wù)場景的實測性能超過競品,能夠大幅提升客戶的效率。
昆侖芯
昆侖芯于2021年4月完成了獨立融資,前身是百度智能芯片及架構(gòu)部,在實際業(yè)務(wù)場景中深耕AI加速領(lǐng)域已十余年,是一家在體系結(jié)構(gòu)、芯片實現(xiàn)、軟件系統(tǒng)和場景應(yīng)用均有深厚積累的AI芯片企業(yè)。
昆侖芯1代芯片于2020年量產(chǎn),昆侖芯2代于2021年8月18日宣布正式量產(chǎn)。2022年09月百度集團執(zhí)行副總裁沈抖透露,昆侖芯3代將于2024年初量產(chǎn)。
昆侖芯1代芯片采用14nm工藝,256 TOPS@INT8算力,可用于云數(shù)據(jù)中心和智能邊緣,支持全AI算法,落地超過兩萬片;昆侖芯2代芯片,搭載自研的第二代XPU架構(gòu),采用7nm制程,GDDR6高性能顯存,算力256 TOPS@INT8,128 TFLOPS@FP16,相比一代性能提升2-3倍,適用于云、端、邊等多場景,支持硬件虛擬化,芯片間互聯(lián)和視頻編解碼。
昆侖芯 AI 芯片除了擁有自研 XPU 架構(gòu)及多項自主設(shè)計,也已與飛騰等多款國產(chǎn)通用處理器、麒麟等多款國產(chǎn)操作系統(tǒng)以及百度自研的飛槳深度學(xué)習(xí)框架完成了端到端的適配,擁有軟硬一體的全棧國產(chǎn)AI能力。
目前,昆侖芯科技已與智能產(chǎn)業(yè)的上下游企業(yè)建立了良好的合作生態(tài),通過向不同行業(yè)提供以人工智能芯片為基礎(chǔ)的算力產(chǎn)品,輻射互聯(lián)網(wǎng)、智慧城市、智算中心、智慧工業(yè)、智慧應(yīng)急、智慧交通、智慧金融等“智慧+”產(chǎn)業(yè),以計算驅(qū)動智能,以智能促進發(fā)展。
燧原科技
燧原科技成立于2018年3月,專注人工智能領(lǐng)域云端算力產(chǎn)品,致力為人工智能產(chǎn)業(yè)發(fā)展交付普惠的基礎(chǔ)設(shè)施解決方案,提供原始創(chuàng)新、全棧自研、具備完全自主知識產(chǎn)權(quán)的通用人工智能訓(xùn)練和推理產(chǎn)品。憑借其高算力、 高能效比以及靈活編程能力,可廣泛應(yīng)用于互聯(lián)網(wǎng)、金融、交通、能源及新基建等多個行業(yè)和場景。
截至目前,燧原科技已經(jīng)開發(fā)了兩個產(chǎn)品線,一個是云端的訓(xùn)練,包括邃思1.0和邃思2.0,一個是推理芯片,邃思2.5。
邃思1.0基于可編程芯片的設(shè)計理念,其計算核心包含32個通用可擴展神經(jīng)元處理器(SIP),每8個SIP組合成1個可擴展智能計算群(SIC)。SIC之間通過HBM實現(xiàn)高速互聯(lián),通過片上調(diào)度算法,數(shù)據(jù)在搬遷中完成計算,實現(xiàn)SIP利用率最大化。邃思支持CNN、RNN、LSTM、BERT等網(wǎng)絡(luò)模型和豐富的數(shù)據(jù)類型(FP32/FP16/BF16/Int8/Int16/Int32等)。
邃思2.0基于GCU-CARA 2.0架構(gòu),以TF32為核心提供多數(shù)據(jù)精度AI算力支持,針對張量、矢量、標(biāo)量等多計算范式提供領(lǐng)先性能,支持指令驅(qū)動、可編程的融合式數(shù)據(jù)流架構(gòu),提供軟件透明、基于任務(wù)的智能調(diào)度;基于12nm FinFET先進工藝,單芯片包含225億個晶體管,有效提升算力密度;廣泛支持視覺、語音語義、強化學(xué)習(xí)等各技術(shù)方向的模型訓(xùn)練。
燧原科技創(chuàng)始人趙立東前不久表示,公司去年與浪潮科技,聯(lián)合發(fā)布了錢塘江智算中心的解決方案,打造了一個液冷的160臺服務(wù)器的算力集群,集成了180張燧原科技第一代的訓(xùn)練卡,現(xiàn)在已部署在之江實驗室上線運行。
天數(shù)智芯
天數(shù)智芯2018年正式啟動通用并行云端計算芯片設(shè)計,公司致力于開發(fā)云端服務(wù)器級的通用高性能計算芯片,以客戶、市場為導(dǎo)向,瞄準(zhǔn)以云計算、人工智能、數(shù)字化轉(zhuǎn)型為代表的數(shù)據(jù)驅(qū)動技術(shù)市場,解決核心算力瓶頸問題,為全產(chǎn)業(yè)打造高端算力解決方案。
2021年3月,天數(shù)智芯正式發(fā)布通用GPU“天垓100”芯片及天垓100加速卡。天垓100芯片基于7nm工藝,采用全自研的架構(gòu)、計算核、指令集及基礎(chǔ)軟件棧,2.5D CoWoS晶圓封裝技術(shù),包括240億個晶體管。
天數(shù)智芯堅持自研通用GPU體系思路,天垓100適配x86、ARM、MIPS等架構(gòu)CPU指令集,業(yè)界標(biāo)準(zhǔn)的軟件API(應(yīng)用程序編程接口)支持垂直類行業(yè)應(yīng)用開發(fā),支持TensorFlow、PyTorch等各種主流深度學(xué)習(xí)開發(fā)框架,以及軟硬件全棧支持等,廣泛應(yīng)用于互聯(lián)網(wǎng)、運營商、生物醫(yī)療、教育科研、智算中心等不同行業(yè)眾多應(yīng)用場景。
2022年4月,天數(shù)智芯宣布,目前天垓100產(chǎn)品累計訂單金額已經(jīng)接近2億元,覆蓋新華三等多個頭部企業(yè)。而且,天垓100已支撐近百個客戶在人工智能領(lǐng)域進行超過兩百個不同種類模型訓(xùn)練。另外天數(shù)智芯首款7nm通用GPU推理產(chǎn)品智鎧100也在今年5月份成功點亮。
瀚博半導(dǎo)體
瀚博半導(dǎo)體成立于2018年,專注于研發(fā)高性能通用加速芯片,為計算機視覺、智能視頻處理、自然語言處理等應(yīng)用場景,提供低延時、高吞吐的異構(gòu)計算性能和高效的性能/功耗比,芯片解決方案覆蓋從云端到邊緣的服務(wù)器及一體機市場。
2021年7月7日,瀚博半導(dǎo)體發(fā)布首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡。SV100系列,深度學(xué)習(xí)推理性能指標(biāo)數(shù)倍于現(xiàn)有主流數(shù)據(jù)中心GPU,超高吞吐量、超低延遲;針對各種深度學(xué)習(xí)推理負(fù)載而優(yōu)化的通用架構(gòu),支持計算機視覺、視頻處理、自然語言處理和搜索推薦等推理應(yīng)用場景;集成高密度視頻解碼,廣泛適用于云端與邊緣解決方案,單芯片INT8峰值算力超過200TOPS,節(jié)省設(shè)備投資、降低運營成本。
在2022年世界人工智能大會期間,瀚博半導(dǎo)體又發(fā)布了四款新品:瀚博統(tǒng)一計算架構(gòu)、全新數(shù)據(jù)中心AI推理卡載天VA10、邊緣AI推理加速卡載天VE1、以及瀚博軟件平臺VastStream擴展版。此外,瀚博還預(yù)覽展示國產(chǎn)7nm云端GPU芯片SG100,用于圖像渲染、視頻、元宇宙等領(lǐng)域,不過這款產(chǎn)品目前還未發(fā)布。
沐曦集成
沐曦集成成立于202年9月,公司致力于為異構(gòu)計算提供安全可靠的高性能GPU芯片及解決方案,可廣泛應(yīng)用于人工智能、智慧城市、數(shù)據(jù)中心、云計算、自動駕駛、科學(xué)計算、數(shù)字孿生、元宇宙等前沿領(lǐng)域,為數(shù)字經(jīng)濟發(fā)展提供強大的算力支撐。
2022年1月,沐曦首款采用7nm工藝的異構(gòu)GPU產(chǎn)品已正式流片,預(yù)計很快量產(chǎn)。該產(chǎn)品主要用于AI推理場景,可在人工智能、自動駕駛、工業(yè)和制造自動化、智慧城市、自然語言處理、邊緣計算等領(lǐng)域應(yīng)用。
沐曦第二款用于科學(xué)計算、數(shù)據(jù)中心彈性計算、AI訓(xùn)練等的旗艦GPU芯片也已進入研發(fā)收尾階段,計劃于2024年全面量產(chǎn)。此外,到2025年,沐曦將推出融合了圖形渲染的完整GPU產(chǎn)品,也就是顯示和游戲用途的GPU。
沐曦產(chǎn)品均采用完全自主研發(fā)的高性能GPU IP,擁有完全自主的指令集和架構(gòu),配以兼容主流GPU生態(tài)的完整軟件棧(MACAMACA),具備高性能、高效能和高通用性的天然優(yōu)勢,能夠為客戶構(gòu)建軟硬件一體的全面生態(tài)解決方案。
壁仞科技
壁仞科技創(chuàng)立于2019年,致力于開發(fā)原創(chuàng)性的通用計算體系,建立高效的軟硬件平臺,同時在智能計算領(lǐng)域提供一體化的解決方案。從發(fā)展路徑上,壁仞科技將首先聚焦云端通用智能計算,逐步在人工智能訓(xùn)練和推理、圖形渲染等多個領(lǐng)域趕超現(xiàn)有解決方案。
壁仞科技BR100系列通用GPU芯片,針對人工智能訓(xùn)練、推理,及科學(xué)計算等更廣泛的通用計算場景開發(fā),主要部署在大型數(shù)據(jù)中心,依托“壁立仞”原創(chuàng)架構(gòu),可提供高能效、高通用性的加速計算算力。目前,BR100系列擁有BR100、BR104兩款芯片。
BR100系列采用7nm制程,并創(chuàng)新性應(yīng)用Chiplet與2.5D CoWoS封裝技術(shù),兼顧高良率與高性能;支持PCIe 5.0接口技術(shù)與CXL通信協(xié)議,雙向帶寬最高達128 GB/s;原創(chuàng)BLink?高速GPU互連技術(shù),單卡互連帶寬最高達448 GB/s,并支持單節(jié)點8卡全互連;除原生支持FP32、BF16、FP16、INT8等主流數(shù)據(jù)精度外,原創(chuàng)定義TF32+數(shù)據(jù)精度,相較TF32提供更高數(shù)據(jù)精度與吞吐性能。
摩爾線程
摩爾線程成立于2020年10月,專注于研發(fā)設(shè)計全功能GPU芯片及相關(guān)產(chǎn)品,支持3D高速圖形渲染、AI訓(xùn)練推理加速、超高清視頻編解碼和高性能科學(xué)計算等多種組合工作負(fù)載,兼顧算力與算效,能夠為中國科技生態(tài)合作伙伴提供強大的計算加速能力。
2022年3月30日,摩爾線程正式推出首款基于其先進架構(gòu)MUSA統(tǒng)一系統(tǒng)架構(gòu)(Moore Threads Unified System Architecture)打造的數(shù)據(jù)中心級多功能GPU產(chǎn)品MTT S2000,內(nèi)置渲染、音視頻編解碼、人工智能加速和并行計算等硬件模塊,能夠提供圖形圖像渲染、視頻云處理、AI和科學(xué)計算在內(nèi)的全棧功能。
憑借其獨特的渲染、虛擬化等能力和廣泛的生態(tài)支持,MTT S2000可以在云桌面、安卓云游戲、視頻云、云渲染和AI推理計算加速等應(yīng)用場景全面助力綠色數(shù)字經(jīng)濟發(fā)展。
摩爾線程MTT S2000兼容X86、ARM等CPU架構(gòu)以及主流Linux操作系統(tǒng)發(fā)行版,并已著手與多家服務(wù)器合作伙伴開展合作,包括浪潮、新華三、聯(lián)想、清華同方、長城超云、思騰合力等OEM廠商多款通用服務(wù)器及GPU服務(wù)器型號,可以在眾多硬件和應(yīng)用環(huán)境中完成部署。
得益于豐富的模型庫支持和先進硬件設(shè)計,MTT S2000能夠滿足計算機視覺、自然語言處理等多種智能應(yīng)用場景的模型訓(xùn)練和推理應(yīng)用,并對包括DBNet、CRNN、FastRCNN、Yolo V2/V3/V5、PSENet、Mask RCNN、Resnet 50/101、Inception、Vgg、Alexnet、Densenet、Unet等在內(nèi)的眾多主流深度學(xué)習(xí)算法提供支持。
同時,MTT S2000也支持用戶使用PyTorch、TensorFlow、PaddlePaddle等深度學(xué)習(xí)框架進行算法開發(fā)及應(yīng)用搭建。此外,用戶也可通過應(yīng)用更廣泛的OpenCL及CUDA環(huán)境進行開發(fā),大幅降低了新硬件的學(xué)習(xí)及應(yīng)用門檻,提升開發(fā)速度。
登臨科技
登臨科技成立于2017年,專注于高性能通用計算平臺的芯片研發(fā)與技術(shù)創(chuàng)新,致力于打造云邊端一體、軟硬件協(xié)同、訓(xùn)練推理融合的前沿芯片產(chǎn)品和平臺化基礎(chǔ)系統(tǒng)軟件。
公司自主創(chuàng)新的GPU+,在兼容CUDA/OpenCL在內(nèi)的編程模型和軟件生態(tài)的基礎(chǔ)上,通過架構(gòu)創(chuàng)新,完美解決了通用性和高效率的雙重難題。大量客戶產(chǎn)品實測證明,針對AI計算,GPU+相比傳統(tǒng)GPU在性能尤其是能效上有顯著提升。
2022年9月,登臨科技創(chuàng)始人李建文在某會議上表示,登臨科技首款系列產(chǎn)品基于GPU+的創(chuàng)新AI加速器Goldwasser已在智慧城市、交通、金融、能源、電力、教育、無人駕駛、互聯(lián)網(wǎng)等眾多行業(yè)實現(xiàn)商業(yè)化落地,目標(biāo)年內(nèi)客戶訂單達數(shù)萬片,并且已實現(xiàn)批量量產(chǎn)交付。登臨第二代產(chǎn)品將于明年上半年進入市場,其能效比將是第一代產(chǎn)品的2倍。
另外,登臨科技還發(fā)布了完整的翰銘(Hamming)軟件工具鏈,該工具鏈支持國內(nèi)外主流AI框架、操作系統(tǒng)、CPU、容器與虛擬機、以及推理服務(wù)器,可幫助客戶盡快把算法部署到實際業(yè)務(wù)上,并幫助云端與數(shù)據(jù)中心的客戶更好地利用硬件資源。
小結(jié)
總結(jié)來看,寒武紀(jì)、昆侖芯的云端AI芯片已經(jīng)有一定量出貨,燧原科技的產(chǎn)品也已經(jīng)智算中心中部署運行,天數(shù)智芯表示其天垓100產(chǎn)品累計已拿下接近2億元的訂單金額,登臨科技的產(chǎn)品也已經(jīng)實現(xiàn)批量交付。其他各家的產(chǎn)品在研發(fā)和推進應(yīng)用方面,都有不同程度的進展。整體而言,各家廠商都在積極尋求創(chuàng)新,尋求突破。
-
芯片
+關(guān)注
關(guān)注
455文章
50818瀏覽量
423718 -
AI
+關(guān)注
關(guān)注
87文章
30898瀏覽量
269129 -
人工智能
+關(guān)注
關(guān)注
1791文章
47282瀏覽量
238534
發(fā)布評論請先 登錄
相關(guān)推薦
評論