0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

算力時(shí)代探尋國產(chǎn)GPGPU破局之路

科技數(shù)碼 ? 來源:科技數(shù)碼 ? 作者:科技數(shù)碼 ? 2022-11-30 18:01 ? 次閱讀

來源:愛集微

在數(shù)字經(jīng)濟(jì)化時(shí)代,算力就是生產(chǎn)力。隨著以算力為核心的科技競爭成為當(dāng)前大國競爭的戰(zhàn)略焦點(diǎn),把握算力發(fā)展的重大戰(zhàn)略機(jī)遇期就是搶占發(fā)展的主動(dòng)權(quán)和制高點(diǎn)。

作為新型生產(chǎn)力,算力的迅猛發(fā)展離不開芯片、數(shù)據(jù)中心云計(jì)算等產(chǎn)業(yè)鏈的日臻完善,特別是作為三大算力芯片之一的GPU,更是兵家必爭之地。而由GPU衍生出來的GPGPU憑借并行計(jì)算理念打造出強(qiáng)大的高性能通用計(jì)算優(yōu)勢,在算力時(shí)代正風(fēng)生水起。

有算力時(shí)代繪就的宏偉GPGPU藍(lán)圖召喚,有英偉達(dá)一飛沖天的傳奇激勵(lì),疊加中國進(jìn)口替代以及科創(chuàng)板的杠桿效應(yīng),資本對GPGPU賽道高度興奮,一眾初創(chuàng)公司亦相繼涌現(xiàn),爭相登高一呼,要在融資、量產(chǎn)、應(yīng)用層面試比高,也讓這一賽道端得熱鬧非凡。

但要警醒的是,與GPGPU高熱相伴的是圈內(nèi)的浮躁風(fēng)、套殼風(fēng)和虛夸風(fēng)不止。而在波譎云詭的國際形勢面前一系列熱點(diǎn)事件的發(fā)酵,更讓業(yè)界關(guān)注國產(chǎn)GPGPU的真實(shí)“成色”。穿越GPGPU的重重迷霧,到底該如何解鎖國產(chǎn)GPGPU的真功夫?

補(bǔ)位迫切國產(chǎn)GPGPU迎來新考驗(yàn)

經(jīng)過多年的積淀,中國作為算力發(fā)展的“領(lǐng)跑者”,已在算力競逐中走到世界前列。

截至2022年6月,中國數(shù)據(jù)中心機(jī)架總規(guī)模超過590萬臺,服務(wù)器規(guī)模約2000萬臺,算力總規(guī)模超過150 EFlops,位列全球第二。有機(jī)構(gòu)預(yù)測到2025年,中國GPGPU市場規(guī)模將達(dá)到458億元,相較于2019年的86億元增長5倍多。

但在巨大的市場規(guī)模背后,折射的卻是GPGPU難言的尷尬境地。英偉達(dá)、AMD雙雄憑借多年構(gòu)筑的護(hù)城河優(yōu)勢,壟斷了中國GPGPU的90%市場。隨著GPGPU應(yīng)用在云計(jì)算、大數(shù)據(jù)、工業(yè)、安防、HPC等市場蔚然成風(fēng),無論是中國自身算力的大發(fā)展,還是國產(chǎn)高端大芯片的自主化率提升,國產(chǎn)GPU不能也不應(yīng)在這一賽道上缺席太久。

加之中美科技戰(zhàn)愈加嚴(yán)峻,特別是英偉達(dá)禁售A100事件發(fā)生以來,國產(chǎn)GPGPU“替代”之路將不斷加快,如何做強(qiáng)成為新的考驗(yàn)。

特別是黨的二十大報(bào)告也提出,以國家戰(zhàn)略需求為導(dǎo)向,集聚力量進(jìn)行原創(chuàng)性引領(lǐng)性科技攻關(guān),堅(jiān)決打贏關(guān)鍵核心技術(shù)攻堅(jiān)戰(zhàn)。GPGPU作為國內(nèi)急待突破的高端芯片之一,必然要走上自主化道路。

近幾年國內(nèi)GPGPU公司乘著政策、資本、人才和應(yīng)用的東風(fēng)相繼涌現(xiàn),除了一眾老將之外,包括珠海芯動(dòng)力、壁仞、沐曦、登臨、天數(shù)智芯、紅山微電子、瀚博半導(dǎo)體等新勢力集結(jié)發(fā)力,或在自研架構(gòu)層面的高算力高靈活性發(fā)力;或在生態(tài)打造上可圈可點(diǎn);或在應(yīng)用上開疆拓土,在某些特定應(yīng)用領(lǐng)域也在加快落地。

而在進(jìn)軍的長征路上,一些急功近利的心態(tài)、大鳴大放的風(fēng)格也在無形之中對國產(chǎn)GPGPU的發(fā)展產(chǎn)生了阻礙。到底該如何丈量國產(chǎn)GPGPU的“成色”?未來的發(fā)展之路究竟應(yīng)如何走?

架構(gòu)創(chuàng)新 打造高性能低功耗

作為高端芯片代表,研發(fā)GPGPU顯然是一項(xiàng)極其復(fù)雜的系統(tǒng)性工程,涉及硬件架構(gòu)、驅(qū)動(dòng)開發(fā)、軟件生態(tài)、應(yīng)用適配等,正是關(guān)關(guān)難過關(guān)關(guān)過。

特別是GPGPU需設(shè)置大量的計(jì)算單元,將大量計(jì)算單元進(jìn)行適當(dāng)組合并實(shí)現(xiàn)極高的計(jì)算效率難度極大,而且GPGPU的多元化應(yīng)用要求GPGPU“兼顧”高算力、低功耗、靈活性,這對底層的核心硬件架構(gòu)提出了更嚴(yán)格的要求。

目前國內(nèi)GPGPU廠商的核心架構(gòu)大多自研,這是一條艱難而正確的道路。正如有行業(yè)人士分析稱,走到頂峰的一定是采取自研架構(gòu)的路線,只有能夠把整個(gè)架構(gòu)掌握實(shí)現(xiàn)自研,才能夠追趕頭部玩家,才有可能在未來進(jìn)行超越。

珠海市芯動(dòng)力科技有限公司(簡稱芯動(dòng)力)創(chuàng)始人李原也指出,為實(shí)現(xiàn)大量的計(jì)算、流水線的排列方式,需要GPGPU采用大量處理單元陣列的可重構(gòu)計(jì)算架構(gòu),這樣才可滿足高算力的需求,同時(shí)保持低功耗和硅面積高效。

知行合一,在經(jīng)過長期的摸索和不斷的探索之后,芯動(dòng)力創(chuàng)新性地開發(fā)了兼顧能效與編程靈活性的可重構(gòu)并行處理器芯片架構(gòu)RPP(可重構(gòu)并行處理器),吹響了向GPGPU進(jìn)軍的號角。

厚積而薄發(fā),RPP的架構(gòu)優(yōu)勢也十分顯著:支持大量的并行線程,通過采用空間處理器架構(gòu),把RPP指令分發(fā)到空間上不同的PE陣列里面,并按照指令的依賴關(guān)系連接起來,當(dāng)大量數(shù)據(jù)流過PE陣列時(shí),以流水線的方式完成計(jì)算。此外,因RPP處理器設(shè)計(jì)的高效性,可以在同樣的芯片面積上放入更多的片上內(nèi)存,在計(jì)算時(shí)候可以實(shí)現(xiàn)數(shù)據(jù)的最小距離搬運(yùn),大大降低功耗,實(shí)現(xiàn)了低功耗存算一體化。

poYBAGOHKe6AT-r8AAFyj5B-Lak599.png

(RPP架構(gòu)圖)


整體而言,利用RPP架構(gòu)的優(yōu)越性,可達(dá)到更高的算力、更低的功耗,從而降低服務(wù)器的部署和運(yùn)維成本。

在架構(gòu)層面厚積薄發(fā)之后,芯動(dòng)力乘勝出擊,采用空間流水線架構(gòu)、原生支持CUDA生態(tài)的第一代產(chǎn)品RPP-R8已成功流片,并面向客戶送樣及銷售。

pYYBAGOHKe-AF5kKAAWSDrQRXSo920.png

據(jù)悉,RPP-R8除了具備專用芯片所沒有的通用編程性,面積效率比可達(dá)到英偉達(dá)同類產(chǎn)品的7~10倍,能效比也超過3倍,可滿足高效并行計(jì)算及AI計(jì)算應(yīng)用。

兼容主流生態(tài)切入邊緣應(yīng)用場景

要在GPGPU領(lǐng)域通關(guān),生態(tài)至關(guān)重要。而且,GPGPU的生態(tài)非常復(fù)雜,要求一路打通到應(yīng)用層,提供面向應(yīng)用的全面支持。

因英偉達(dá)CUDA生態(tài)盛行,國內(nèi)不少GPGPU初創(chuàng)公司初期大都在走兼容CUDA生態(tài)的道路。在這方面,RPP也以獨(dú)有的底層硬件架構(gòu)實(shí)現(xiàn)了對CUDA語言的支撐,原生支持CUDA生態(tài)。芯動(dòng)力自主開發(fā)工具鏈,擁有獨(dú)立的SIMT指令集與后端編譯器,在cuDNN與TensorRT上實(shí)現(xiàn)了API兼容;支持廣泛AI框架如TensorFlow、Pythorch,。

李原認(rèn)為,通過兼容CUDA語言,通過自有的指令集和開發(fā)工具進(jìn)行深度優(yōu)化性能,在高性能計(jì)算領(lǐng)域內(nèi)RPP-R8可以得到最廣泛使用的編程語言的支持,不僅從底層的軟件兼容,而且從它的調(diào)用形式、用戶的感知方面也兼容并帶來更好的體驗(yàn)。

實(shí)現(xiàn)兼容之后,芯動(dòng)力擁有了GPGPU應(yīng)用之門的“鑰匙”。GPGPU的應(yīng)用場景廣泛,如何滿足客戶的差異化需求?特別是國產(chǎn)GPGPU實(shí)力還相對較弱的情形下,如何走農(nóng)村包圍城市的路線?

“這就要求從客戶的角度來看,幫助客戶解決了什么痛點(diǎn)?而市場需要的是能夠幫助客戶快速的完成他們的產(chǎn)品,也就是Time to Market。”李原判斷。

看準(zhǔn)這一動(dòng)向,芯動(dòng)力謀定而后動(dòng)。RPP-R8的特點(diǎn)非常適用在高密度數(shù)據(jù)量的邊緣計(jì)算場景,因此,芯動(dòng)力科技選擇從邊緣計(jì)算市場如工業(yè)視覺、輔助駕駛、安防等領(lǐng)域切入。

近年來,安防行業(yè)越來越多數(shù)據(jù)從云中心遷移到“邊緣”上,RPP-R8在安防的應(yīng)用場景中優(yōu)勢也讓芯動(dòng)力在這一市場斬獲豐實(shí)。此外,隨著智能制造業(yè)的智能化需求在不斷提升,芯動(dòng)力的應(yīng)用拓展也延伸到了工業(yè)視覺領(lǐng)域,得到了廣泛的認(rèn)可。

此外,RPP-R8具備的高性能和通用可編程性還可不斷加快客戶Time to Market的步伐。一家采用RPP-R8進(jìn)行信號處理的客戶直陳說:“RPP-R8芯片對公司的意義不僅僅是一個(gè)產(chǎn)品一個(gè)項(xiàng)目,而是解決公司長遠(yuǎn)問題的一顆芯片?!辈粌H如此,他們還希望把整個(gè)公司的產(chǎn)品都基于RPP-R8芯片來設(shè)計(jì)使用,這樣就可以從繁瑣而耗時(shí)的FPGA硬件開發(fā)中解脫出來,從而得以專心研發(fā)系統(tǒng)軟件和算法,通過使用通用的并行計(jì)算芯片,使產(chǎn)品快速上市。

在GPGPU的激蕩歲月,國內(nèi)GPGPU廠商就要選擇一條為客戶創(chuàng)造價(jià)值的道路,這樣才能成就自身的價(jià)值,才能行穩(wěn)致選。芯動(dòng)力將這一DNA貫穿于創(chuàng)新、優(yōu)化和應(yīng)用的全過程,也收獲了新的勢能。

在RPP-R8芯片的應(yīng)用正在多點(diǎn)開花之際,芯動(dòng)力對于未來也有了更明確的規(guī)劃。李原表示,市場在迅速地變化,地緣政治的因素對行業(yè)影響非常大,芯動(dòng)力要能應(yīng)對這些變化,并在變化之中找到機(jī)會。芯動(dòng)力也將花費(fèi)更多的時(shí)間打磨,無論是架構(gòu)、生態(tài)還是應(yīng)用層面都要更上一層樓。也希望在今后的發(fā)展過程當(dāng)中,能夠得到更多的行業(yè)和生態(tài)系統(tǒng)合作伙伴的支持,一起去共同促進(jìn)國產(chǎn)GPGPU的發(fā)展。

結(jié)語:

在當(dāng)前充滿競爭且空前復(fù)雜的市場形勢之下,國產(chǎn)GPGPU業(yè)的發(fā)展注定是曲折的。

盡管面臨重重險(xiǎn)阻,但在國家相關(guān)政策及產(chǎn)業(yè)資金的傾斜下,最后的成功唯取決于中國無數(shù)公司的努力,取決于技術(shù)的創(chuàng)新,取決于堅(jiān)持的長久。

還要看到的是,GPGPU的研發(fā)牽一發(fā)而動(dòng)全身,需要的不僅僅是架構(gòu)迭代與生態(tài)打造,還需要光刻機(jī)等配套產(chǎn)業(yè)的同步提升,才能縮短與國際領(lǐng)先水平之間的差距。此外,兼容是捷徑,但不是終點(diǎn),從長遠(yuǎn)來說一定要建立自己的生態(tài)。國內(nèi)GPGPU廠商還應(yīng)風(fēng)物長宜放眼量。

無疑,美對我國半導(dǎo)體業(yè)的全面圍剿也將不斷加速國產(chǎn)芯片自主化的進(jìn)程,但要從弱到強(qiáng),從低端到高端,顯然是一場以數(shù)年為計(jì)的長征之路。

審核編輯黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4742

    瀏覽量

    128973
收藏 人收藏

    評論

    相關(guān)推薦

    芯片、模型生態(tài)分散,無問芯穹、沐曦、壁仞談國產(chǎn)瓶頸之道

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,2024世界人工智能大會正在舉行,無問芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪在大會論壇上談到一個(gè)現(xiàn)象,從GPT-3到GPT-4,無論是還是大模型能力都遵循指數(shù)級增長
    的頭像 發(fā)表于 07-07 11:14 ?4602次閱讀
    芯片、模型生態(tài)分散,無問芯穹、沐曦、壁仞談<b class='flag-5'>國產(chǎn)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>瓶頸<b class='flag-5'>破</b><b class='flag-5'>局</b>之道

    北電數(shù)智前進(jìn)·AI異構(gòu)計(jì)算平臺,繪制國產(chǎn)商業(yè)化落地新藍(lán)圖

    在當(dāng)今的數(shù)字經(jīng)濟(jì)時(shí)代,人工智能已然成為推動(dòng)科技進(jìn)步與社會發(fā)展的核心動(dòng)力。作為助推AI浪潮與數(shù)字經(jīng)濟(jì)發(fā)展的基礎(chǔ)設(shè)施,AI芯片和相關(guān)產(chǎn)業(yè)成為撬動(dòng)全球智能化、數(shù)字化發(fā)展的關(guān)鍵錨點(diǎn),
    的頭像 發(fā)表于 12-24 11:54 ?323次閱讀

    一體架構(gòu)創(chuàng)新助力國產(chǎn)AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計(jì)算(HPC)應(yīng)用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《存一體架構(gòu)創(chuàng)新助力國產(chǎn)AI芯片騰飛》的演講。
    的頭像 發(fā)表于 10-23 14:48 ?314次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯 感謝平臺提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。 本書主要講芯片CPU
    發(fā)表于 10-15 22:08

    中國大會召開,業(yè)界首個(gè)高質(zhì)量評估體系發(fā)布

    首次完整地構(gòu)建了人工智能時(shí)代高質(zhì)量的理論體系,并探索性提出業(yè)界首個(gè) "五位一體"的高質(zhì)量評估體系。 發(fā)布現(xiàn)場 在當(dāng)前由大模型和AIG
    的頭像 發(fā)表于 09-28 16:50 ?273次閱讀
    中國<b class='flag-5'>算</b><b class='flag-5'>力</b>大會召開,業(yè)界首個(gè)<b class='flag-5'>算</b><b class='flag-5'>力</b>高質(zhì)量評估體系發(fā)布

    大模型時(shí)代需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問題,帶著這個(gè)極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    安謀科技異構(gòu)組合,生成式AI挑戰(zhàn)

    近日,此芯科技集團(tuán)有限公司(以下簡稱“此芯科技”)AI PC戰(zhàn)略暨首款芯片發(fā)布會在上海舉行,正式推出了其首款專為AI PC打造的異構(gòu)高能效芯片產(chǎn)品——“此芯P1”。作為國產(chǎn)新一代AI PC底座
    的頭像 發(fā)表于 08-13 09:12 ?574次閱讀

    國產(chǎn)芯片原廠的出路:從風(fēng)潮到現(xiàn)實(shí)的之路

    國產(chǎn)芯片原廠的出路:從風(fēng)潮到現(xiàn)實(shí)的之路
    的頭像 發(fā)表于 08-12 17:54 ?790次閱讀

    力系列基礎(chǔ)篇——101:從零開始了解

    相信大家已經(jīng)感受到,我們正處在一個(gè)人工智能時(shí)代。如果要問在人工智能時(shí)代最重要的是什么?那必須是:
    的頭像 發(fā)表于 04-24 08:05 ?1002次閱讀
    <b class='flag-5'>算</b>力系列基礎(chǔ)篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:從零開始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    廣東:到2025年,規(guī)模38E,智50%,國產(chǎn)70%

    日前,廣東省通信管理等九部門印發(fā)了《廣東省基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)暨“粵”行動(dòng)計(jì)劃(2024-2025年)》(以下簡稱《行動(dòng)計(jì)劃》),明確了計(jì)算
    的頭像 發(fā)表于 04-23 08:25 ?472次閱讀
    廣東:到2025年,<b class='flag-5'>算</b><b class='flag-5'>力</b>規(guī)模38E,智<b class='flag-5'>算</b>50%,<b class='flag-5'>國產(chǎn)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>70%

    2024-2025發(fā)展,廣東省這樣做,“粵”行動(dòng)計(jì)劃火熱開展

    通信管理等九部門關(guān)于印發(fā)《廣東省基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)暨“粵”行動(dòng)計(jì)劃(2024-2025年)》的通知。文件指出:力作為數(shù)字經(jīng)濟(jì)
    的頭像 發(fā)表于 03-29 08:24 ?860次閱讀
    2024-2025<b class='flag-5'>算</b><b class='flag-5'>力</b>發(fā)展,廣東省這樣做,“粵<b class='flag-5'>算</b>”行動(dòng)計(jì)劃火熱開展

    時(shí)代, 如何打破內(nèi)存墻

    設(shè)計(jì)的不斷革新,進(jìn)入了大時(shí)代。 目前,主流AI芯片的架構(gòu)仍然沿用了傳統(tǒng)的馮·諾依曼模型,這一設(shè)計(jì)將計(jì)算單元與數(shù)據(jù)存儲分離。在這種架構(gòu)下,處理器需要從內(nèi)存中讀取數(shù)據(jù),執(zhí)行計(jì)算任務(wù),然后將結(jié)果寫回內(nèi)存。盡管AI芯片的
    的頭像 發(fā)表于 03-06 19:51 ?321次閱讀
    大<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>時(shí)代</b>, 如何打破內(nèi)存墻

    中國電信規(guī)劃在上海建設(shè)首個(gè)國產(chǎn)超大規(guī)模液冷集群

    中國電信規(guī)劃建設(shè)首個(gè)國產(chǎn)超大規(guī)模液冷集群 人工智能技術(shù)的快速發(fā)展催生了巨大的需求;中國電信規(guī)劃在上海規(guī)劃建設(shè)可支持萬億參數(shù)大模型訓(xùn)練
    的頭像 發(fā)表于 02-22 18:48 ?1339次閱讀

    大茉莉X16-P,5800M大稱王稱霸

    Rykj365
    發(fā)布于 :2024年01月25日 14:54:52

    立足,聚焦AI!順網(wǎng)科技全面走進(jìn)AI智時(shí)代

    “立足,聚焦AI”,順網(wǎng)科技進(jìn)軍AI智時(shí)代的號角已被吹響。 1月18日,順網(wǎng)科技(300113.SZ)以“躍遷·向未來”為主題的戰(zhàn)略升級暨產(chǎn)品升級發(fā)布會在杭州圓滿召開。發(fā)布會上,
    的頭像 發(fā)表于 01-19 10:57 ?464次閱讀
    立足<b class='flag-5'>算</b><b class='flag-5'>力</b>,聚焦AI!順網(wǎng)科技全面走進(jìn)AI智<b class='flag-5'>算</b><b class='flag-5'>時(shí)代</b>