国产偷国产偷亚洲清高软件,国产乱人伦偷精精品视频

在AI算力、算法和數(shù)據(jù)人工智能行業(yè)三要素中，AI算力更是重中之重，業(yè)界廠商通過對(duì)各類AI硬件不斷迭代為算力狂飆的需求提供強(qiáng)有力保障。自ChatGPTAI、GPT-4模型發(fā)布火爆出圈后，在引發(fā)了普羅大眾對(duì)AI大模型熱情的同時(shí)，也引燃了AI算力的戰(zhàn)火。全球科技巨頭紛紛發(fā)布AI大模型、AI訓(xùn)練卡產(chǎn)品都是入場者爭奪AI制高點(diǎn)的戰(zhàn)爭縮影。

1、AI異構(gòu)計(jì)算三分天下，GPU表現(xiàn)異常亮眼

眾所周知，人工智能（尤其是大模型新興應(yīng)用領(lǐng)域）對(duì)AI算力需求超過了通用CPU的摩爾定律的發(fā)展速度，而異構(gòu)計(jì)算的性能增長恰恰能夠滿足這些新興領(lǐng)域的算力需求發(fā)展方向和趨勢。異構(gòu)計(jì)算領(lǐng)域，目前呈現(xiàn)出GPU、FPGA、ASIC 芯片三分天下的局面，GPU、FPGA、ASIC芯片都會(huì)有自己獨(dú)特的技術(shù)特長和應(yīng)用領(lǐng)域，有自己獨(dú)特的客戶群體。

ASIC芯片可以獲得最優(yōu)性能，即面積利用率高、速度快、功耗低；但AISC開發(fā)風(fēng)險(xiǎn)極大，算法是固定，而且從研發(fā)到市場的時(shí)間周期很長，不適合例如深度學(xué)習(xí)快速迭代的領(lǐng)域。大多是具備AI算法又擅長芯片研發(fā)的巨頭參與，如 Google 的TPU。 FPGA稱為現(xiàn)場可編程門陣列，用戶可以根據(jù)自身的需求進(jìn)行重復(fù)編程，相比之下，具有可硬件編程的特點(diǎn)，靈活性好；但基本單元的計(jì)算能力有限，速度和功耗存在不足。FPGA 在工業(yè)互聯(lián)網(wǎng)領(lǐng)域、工業(yè)機(jī)器人設(shè)備領(lǐng)域應(yīng)用前景十分巨大。 GPU具備高效的并行性、高密集的運(yùn)算、超長流水線，以及成熟生態(tài)，最先被引入深度學(xué)習(xí)；GPU針對(duì)不同應(yīng)用領(lǐng)域的需求，增加了專用向量、張量、矩陣運(yùn)算指令，提升浮點(diǎn)運(yùn)算精度和性能，以滿足天氣預(yù)報(bào)、工業(yè)設(shè)計(jì)、基因工程、藥物發(fā)現(xiàn)、金融工程、自動(dòng)駕駛等不同計(jì)算場景的需求。綜合考慮性能、能效比和編程靈活性等因素，GPU明顯優(yōu)于ASIC、FPGA等芯片，并成為目前AI加速服務(wù)器的最主流選擇。目前，英偉達(dá)和AMD是目前全球GPU的領(lǐng)軍企業(yè)，兩家合計(jì)獲取了全球GPU絕大部分市場份額。國內(nèi)海光信息、寒武紀(jì)等公司的GPU產(chǎn)品已經(jīng)實(shí)現(xiàn)規(guī)?；N售。全球來看，英偉達(dá)的H100及A100、AMD的MI100及MI200等均為主流的GPGPU產(chǎn)品型號(hào)。據(jù)IDC數(shù)據(jù)顯示，2021年GPU服務(wù)器份額占國內(nèi)AI加速服務(wù)器市場的88.4%，2021-2025年間年復(fù)合增速為19.1%。據(jù)Jon Peddie Research數(shù)據(jù)顯示2022Q1英偉達(dá)占據(jù)79%市場份額，AMD占據(jù)21%。英偉達(dá)在獨(dú)立GPU領(lǐng)域一枝獨(dú)秀。

在中國市場上，根據(jù)IDC數(shù)據(jù)，2021年英偉達(dá)占國內(nèi)AI加速卡80%以上市場份額，2015-2021年間年復(fù)合增速高達(dá)77.4%，處于市場領(lǐng)先地位。

2、英偉達(dá)中國版GPU限制及可供應(yīng)性風(fēng)險(xiǎn)

無論在HPC高性能計(jì)算，科學(xué)研發(fā)領(lǐng)域，還是人工智能大模型場景，尤其是對(duì)算力要求的比較高Training（訓(xùn)練）環(huán)節(jié)，AMD的MI 100、MI 200以及Nvidia的A100，H100都是GPU領(lǐng)域的超強(qiáng)算力芯片，極其普遍的應(yīng)用在AI服務(wù)器中實(shí)現(xiàn)加速計(jì)算，提供計(jì)算精度，減少訓(xùn)練周期。 NVIDIA A100、H100等加速計(jì)算卡的需求過于火爆，即便在臺(tái)積電增加了大量的訂單，緊急提升產(chǎn)能，依然無法滿足。但在中國市場上，由于美國的禁令，NVIDIA基于中市場策略定制了特供版A800、H800。那么，中國特供版A800和H800與A100和H100的具體差距？主要差距是互聯(lián)后整體集群帶寬的下降。A800的互聯(lián)帶寬從A100的600GB/s下降到400GB/s，H800的互聯(lián)帶寬從H100的900GB/s下降到450GB/s。本身單卡的算力不變，但是集群卡間互聯(lián)的帶寬限制整個(gè)集群的算力規(guī)模，從而限制了集群性能，相當(dāng)于限制了AI模型訓(xùn)練精度以及中國AI技術(shù)發(fā)展。

即便如此，NVIDIA特供版A800、H800發(fā)布也是異常搶手，在國內(nèi)大型互聯(lián)網(wǎng)企業(yè)在采購潮的推動(dòng)下，漲價(jià)幅度已經(jīng)超過40％。在如此大模型高算力市場需求下，依靠國外GPU技術(shù)發(fā)展AI技術(shù)本身就是偽命題，如同沙灘筑高樓；同時(shí)，在可供應(yīng)性和技術(shù)演進(jìn)上成了極大風(fēng)險(xiǎn)。

3、國內(nèi)GPU廠商概述及國產(chǎn)化應(yīng)對(duì)策略

美國對(duì)中國GPU等芯片的“卡脖子”制裁也給國內(nèi)產(chǎn)品替代英偉達(dá)帶來非常大的機(jī)會(huì)。國產(chǎn)AI芯片廠商持續(xù)發(fā)力，對(duì)標(biāo)行業(yè)龍頭已縮小差距。在AI加速和高性能計(jì)算領(lǐng)域，國內(nèi)主要有GPGPU和NPU兩條技術(shù)路徑；GPGPU技術(shù)沉淀深、生態(tài)兼容廣，NPU發(fā)展迅速，但算力供給單一性和生態(tài)壁壘比較難打破，兩條路徑都得到相應(yīng)廠商的支持和發(fā)展，在特定領(lǐng)域性能都達(dá)到業(yè)界一流水平。

相較而言，GPGPU路線更加符合AI算力發(fā)展需求，更具潛力。GPGPU也叫做通用GPU，優(yōu)勢在于具備大規(guī)模并行計(jì)算的能力，可快速開發(fā)高能效的應(yīng)用程序，在產(chǎn)品性能、通用性、易用性等方面優(yōu)勢明顯，全球9成以上商用AI系統(tǒng)的選擇GPGPU架構(gòu)芯片，在訓(xùn)練負(fù)載方面更是如此。而且，當(dāng)前AI應(yīng)用基本全都建立在GPGPU架構(gòu)的軟件開發(fā)平臺(tái)上，生態(tài)體系更加完善，好用，易用。AI技術(shù)發(fā)展日新月異，AI軟件開發(fā)者通過在GPGPU平臺(tái)開發(fā)，能夠更好的提高生產(chǎn)力。

ASIC架構(gòu)，優(yōu)勢在于根據(jù)產(chǎn)品的需求，進(jìn)行特定設(shè)計(jì)和制造的集成電路，因此計(jì)算速度快，能耗更低。它的出現(xiàn)存在一個(gè)理論前提，即算法發(fā)展相對(duì)成熟，已發(fā)現(xiàn)最優(yōu)算法，通過將軟件固化到硬件執(zhí)行，以實(shí)現(xiàn)最優(yōu)效率。由于當(dāng)前AI算法、模型快速迭代發(fā)展，ASIC架構(gòu)需要投入大量的資金，以及經(jīng)歷較長的研發(fā)和工程周期，容易出現(xiàn)量產(chǎn)即落后的局面。另外，國際上還有基于FPGA架構(gòu)開發(fā)AI芯片，雖然可根據(jù)自身需求進(jìn)行重復(fù)編程，但缺點(diǎn)在于頻率較低，單元計(jì)算能力有限，價(jià)格昂貴。而且，基于FPGA的AI應(yīng)用開發(fā)，需要軟件工程師同時(shí)具備軟件、硬件能力，開發(fā)難度較大；并且目前FPGA被國外巨頭壟斷，因此很少有FPGA架構(gòu)的國產(chǎn)AI芯片。

相對(duì)于ASIC與FPGA而言，國內(nèi)對(duì)GPGPU芯片其實(shí)需求更為迫切。大模型預(yù)訓(xùn)練面臨著計(jì)算資源需求、數(shù)據(jù)集規(guī)模、訓(xùn)練時(shí)間和效率、參數(shù)調(diào)優(yōu)和模型調(diào)整、以及泛化能力和適應(yīng)性等多個(gè)難題。應(yīng)對(duì)這些難題需要綜合考慮硬件資源、數(shù)據(jù)管理、算法設(shè)計(jì)等多方面因素。因此，算力領(lǐng)先、軟件完善的 GPGPU成為先進(jìn)大模型的首選算力來源。而且，隨著AI應(yīng)用向多模態(tài)進(jìn)一步發(fā)展，通用性更優(yōu)的GPGPU可以更好的支持這類應(yīng)用發(fā)展

另外，國內(nèi)對(duì)GPGPU芯片的需求不止于芯片可提供多少算力，是否能滿足應(yīng)用場景所需的計(jì)算精度也同樣重要。原因在于，AI應(yīng)用視場景不同，需要算力精度不同。例如AICG領(lǐng)域?qū)D像和語音的處理，用32位、16位計(jì)算精度即可；而部分科學(xué)計(jì)算，則需要用到FP64雙精度浮點(diǎn)運(yùn)算，才可保證模型訓(xùn)練和預(yù)測結(jié)果的準(zhǔn)確性?？偠灾?，AI算力的全面發(fā)展，需要全精度、通用性強(qiáng)的GPGPU芯片支撐。

當(dāng)前，國內(nèi)AI芯片廠商數(shù)量約在6000+家，其中主流廠商數(shù)量約60余家，主要分為三個(gè)梯隊(duì)，第一梯隊(duì)包括海光、華為、寒武紀(jì)等。劃分原因在于，第一梯隊(duì)廠商有成熟產(chǎn)品，且已有商業(yè)化量產(chǎn)規(guī)模的應(yīng)用。

海光：DCU產(chǎn)品深算系列，兼容通用的“類 CUDA”環(huán)境以及國際主流商業(yè)計(jì)算軟件和人工智能軟件，對(duì)標(biāo)主流 NVIDIA A100 產(chǎn)品，海光 DCU 單芯片產(chǎn)品基本能達(dá)到與其相近的性能水平。并且，海光DCU深算一號(hào)，國內(nèi)唯一能支持全部算力精度，可以滿足需要更高精度的數(shù)學(xué)計(jì)算的需要。GPGPU架構(gòu)，讓其通用性更強(qiáng)，海光DCU產(chǎn)品在AI計(jì)算、大數(shù)據(jù)處理、商業(yè)計(jì)算等領(lǐng)域發(fā)揮著重要作用。

華為昇騰：產(chǎn)品包括昇騰310、910，自研達(dá)芬奇架構(gòu)實(shí)現(xiàn)較低功耗和較好散熱，可在華為龐大的AI軟件工程師支持下，通過運(yùn)行華為的全棧軟硬件平臺(tái)，并且深度適配、遷移和優(yōu)化，可以應(yīng)用于云邊端全場景覆蓋，目前已形成較為完善的生態(tài)。

寒武紀(jì)：產(chǎn)品主要由云端芯片與邊緣芯片等組成，產(chǎn)品體系豐富，適配AI應(yīng)用及各類算法,產(chǎn)品的能效較好，并掌握了智能芯片架構(gòu)、編譯器、工具鏈等核心技術(shù)。但因?yàn)锳ISC架構(gòu)芯片的天然劣勢，使得寒武紀(jì)產(chǎn)品在實(shí)際應(yīng)用中需要大量資金、人才投入，落地部署困難重重，實(shí)際應(yīng)用限制多多。

第二梯隊(duì)包括，燧原、昆侖芯、天數(shù)、壁仞、沐曦等近幾年成立的初創(chuàng)企業(yè)。這幾家廠商雖然發(fā)布了產(chǎn)品，但由于AI芯片產(chǎn)品化、復(fù)雜度等原因，在實(shí)際應(yīng)用中進(jìn)展有限，或開始在某些領(lǐng)域局部試水，或者還在努力建設(shè)軟件生態(tài)，集群部署方案等。

第三梯隊(duì)包括龍芯、景嘉微等，這兩家廠商有意向進(jìn)軍AI計(jì)算領(lǐng)域，但尚無AI芯片量產(chǎn)。龍芯作為國產(chǎn)CPU領(lǐng)域的主流廠商，5月份宣布集成龍芯自研GPGPU的第一款A(yù)I計(jì)算芯片，預(yù)計(jì)將于 2024 年一季度流片。而景嘉微作為國內(nèi)最早投入GPU研發(fā)的廠商之一，近期也宣布募資42億元投入高性能GPGPU芯片研發(fā)及產(chǎn)業(yè)化項(xiàng)目。這兩家廠商作為國內(nèi)計(jì)算芯片代表廠商，如今在布局AI計(jì)算芯片研發(fā)，終于邁出了第一步。

4、總結(jié)

AI大模型催生GPU市場需求劇增，在嚴(yán)峻的國際形勢下，GPU的國產(chǎn)替代進(jìn)程刻不容緩，海光信息深算一號(hào)已基本具備英偉達(dá)高端 GPU的技術(shù)能力，在緊張的局勢背景下，未來有望推動(dòng)高端GPU國產(chǎn)替代進(jìn)程。

在特定AI應(yīng)用領(lǐng)域（尤其是GPU圖形計(jì)算和AI推理領(lǐng)域），國內(nèi)GPU廠商從技術(shù)到生態(tài)都具備一定積累，隨著產(chǎn)品不斷迭代更新，以及在AI訓(xùn)練領(lǐng)域持續(xù)發(fā)力，未來在爭奪AI制高點(diǎn)的戰(zhàn)爭中發(fā)光發(fā)熱，從而緩解“卡脖子”問題和供應(yīng)風(fēng)險(xiǎn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

gpu

gpu

+關(guān)注

關(guān)注
28

文章
4740

瀏覽量
128948
人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47279

瀏覽量
238491
算力

算力

+關(guān)注

關(guān)注
1

文章
977

瀏覽量
14810
大模型

大模型

+關(guān)注

關(guān)注
2

文章
2450

瀏覽量
2706

原文標(biāo)題：大模型AI算力劇增，誰來扛國產(chǎn)GPU大旗？

文章出處：【微信號(hào)：AI_Architect，微信公眾號(hào)：智能計(jì)算芯世界】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

AI算力GPU開始騰飛，背后是電源管理的持續(xù)支持

為AI PC元年。 ? 不僅是AI PC，還包括AI服務(wù)器、AI手機(jī)、AI汽車等，眾多AI實(shí)際應(yīng)

發(fā)表于 03-30 00:12 ?4551次閱讀

<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>GPU</b>開始騰飛，背后是電源管理的持續(xù)支持

企業(yè)AI算力租賃是什么

企業(yè)AI算力租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的算力提供商租用所需的計(jì)算資源，以滿足其AI應(yīng)用的需求。

發(fā)表于 11-14 09:30 ?590次閱讀

GPU算力開發(fā)平臺(tái)是什么

隨著AI技術(shù)的廣泛應(yīng)用，算力需求呈現(xiàn)出爆發(fā)式增長。AI算力租賃作為一種新興的服務(wù)模式，正逐漸成為

發(fā)表于 10-31 10:31 ?184次閱讀

【一文看懂】大白話解釋“GPU與GPU算力”

隨著大模型的興起，“GPU算力”這個(gè)詞正頻繁出現(xiàn)在人工智能、游戲、圖形設(shè)計(jì)等工作場景中，什么是GPU，它與CPU的區(qū)別是什么？以及到底什么是

發(fā)表于 10-29 08:05 ?626次閱讀

【一文看懂】大白話解釋“<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b><b class='flag-5'>算</b><b class='flag-5'>力</b>”

存算一體架構(gòu)創(chuàng)新助力國產(chǎn)大算力AI芯片騰飛

在灣芯展SEMiBAY2024《AI芯片與高性能計(jì)算（HPC）應(yīng)用論壇》上，億鑄科技高級(jí)副總裁徐芳發(fā)表了題為《存算一體架構(gòu)創(chuàng)新助力國產(chǎn)大算力

發(fā)表于 10-23 14:48 ?297次閱讀

GPU算力租用平臺(tái)是什么

GPU算力租用平臺(tái)是一種基于云計(jì)算的服務(wù)模式，它允許用戶通過互聯(lián)網(wǎng)按需租用高性能GPU資源，而無需自行購買、部署和維護(hù)這些硬件。

發(fā)表于 10-16 10:15 ?231次閱讀

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

、GPU、NPU,給我們剖析了算力芯片的微架構(gòu)。書中有對(duì)芯片方案商處理器的講解，理論聯(lián)系實(shí)際，使讀者能更好理解算力芯片。全書共11章，

發(fā)表于 10-15 22:08

【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 未知領(lǐng)域的感受

”，好奇于這種大模型算力中心到底是如何建設(shè)的，用什么設(shè)備、什么架構(gòu)建設(shè)的？對(duì)這些問題真是一無所知，甚至都沒有想過，帶著這份好奇開始閱讀。先瀏覽目錄，共分十三章，目錄中出現(xiàn)最多的就是GPU

發(fā)表于 10-08 10:40

名單公布！【書籍評(píng)測活動(dòng)NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

力，在全球范圍內(nèi)，對(duì)于推動(dòng)科技進(jìn)步、經(jīng)濟(jì)發(fā)展及社會(huì)整體的運(yùn)作具有至關(guān)重要的作用。隨著信息技術(shù)的高速發(fā)展，高性能計(jì)算（HPC）和人工智能（AI）等技術(shù)在多個(gè)領(lǐng)域的應(yīng)用變得日益廣泛，芯片算力

發(fā)表于 09-02 10:09

大模型時(shí)代的算力需求

現(xiàn)在AI已進(jìn)入大模型時(shí)代，各企業(yè)都爭相部署大模型，但如何保證大模型的算力，以及相關(guān)的穩(wěn)定性和性能

發(fā)表于 08-20 09:04

名單公布！【書籍評(píng)測活動(dòng)NO.41】大模型時(shí)代的基礎(chǔ)架構(gòu)：大模型算力中心建設(shè)指南

工作日內(nèi)未聯(lián)系，視為放棄本次試用評(píng)測資格！書籍介紹大模型是近年來引人注目的熱點(diǎn)之一。大模型蓬勃發(fā)展的基礎(chǔ)，是針對(duì)其需求設(shè)計(jì)的算力及基礎(chǔ)架構(gòu)。本書針對(duì)如何為大

發(fā)表于 08-16 18:33

摩爾線程張建中：以國產(chǎn)算力助力數(shù)智世界，滿足大模型算力需求

摩爾線程創(chuàng)始人兼CEO張建中在會(huì)上透露，為了滿足國內(nèi)對(duì)AI算力的迫切需求，他們正在積極尋求與國內(nèi)頂尖科研機(jī)構(gòu)的深度合作，共同推動(dòng)更大規(guī)模的AI智算

發(fā)表于 05-10 16:36 ?959次閱讀

青云科技聯(lián)手摩爾線程，構(gòu)建國產(chǎn)算力繁榮生態(tài)

隨著大數(shù)據(jù)模型與各行業(yè)深度整合，以GPU為代表的智能算力需求持續(xù)攀升。同時(shí)，政府出臺(tái)多項(xiàng)扶持政策，積極推行“人工智能+”戰(zhàn)略，激勵(lì)AI芯片行

發(fā)表于 04-22 09:32 ?523次閱讀

國產(chǎn)GPU在AI大模型領(lǐng)域的應(yīng)用案例一覽

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）近一年多時(shí)間，隨著大模型的發(fā)展，GPU在AI領(lǐng)域的重要性再次凸顯。雖然相比英偉達(dá)等國際大廠，國產(chǎn)GPU起步較晚

發(fā)表于 04-01 09:28 ?3808次閱讀

Sora算力需求引發(fā)業(yè)界對(duì)集結(jié)國內(nèi)AI企業(yè)算力的探討

據(jù)周鴻祎觀察，Sora視頻分析所需算力恐遠(yuǎn)超千億規(guī)模模型。因而，考慮到如今國內(nèi)芯片供應(yīng)受限，算力問題至關(guān)重要。事實(shí)上，Meta已有約50萬臺(tái)

發(fā)表于 02-25 10:03 ?588次閱讀

搜索歷史

大模型AI算力劇增，誰來扛國產(chǎn)GPU大旗？

評(píng)論

AI算力GPU開始騰飛，背后是電源管理的持續(xù)支持

企業(yè)AI算力租賃是什么

GPU算力開發(fā)平臺(tái)是什么

【一文看懂】大白話解釋“GPU與GPU算力”

存算一體架構(gòu)創(chuàng)新助力國產(chǎn)大算力AI芯片騰飛

GPU算力租用平臺(tái)是什么

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 未知領(lǐng)域的感受

名單公布！【書籍評(píng)測活動(dòng)NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

大模型時(shí)代的算力需求

名單公布！【書籍評(píng)測活動(dòng)NO.41】大模型時(shí)代的基礎(chǔ)架構(gòu)：大模型算力中心建設(shè)指南

摩爾線程張建中：以國產(chǎn)算力助力數(shù)智世界，滿足大模型算力需求

青云科技聯(lián)手摩爾線程，構(gòu)建國產(chǎn)算力繁榮生態(tài)

國產(chǎn)GPU在AI大模型領(lǐng)域的應(yīng)用案例一覽

Sora算力需求引發(fā)業(yè)界對(duì)集結(jié)國內(nèi)AI企業(yè)算力的探討

搜索歷史

大模型AI算力劇增，誰來扛國產(chǎn)GPU大旗？

評(píng)論

大模型AI算力劇增，誰來扛國產(chǎn)GPU大旗？