0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

?GPU芯片新技術出現(xiàn),中國廠商值得借鑒

半導體產業(yè)縱橫 ? 來源:半導體產業(yè)縱橫 ? 2023-11-12 11:48 ? 次閱讀

11月6日,在創(chuàng)業(yè)三年,即將進入下一個三年之際,摩爾線程創(chuàng)始人兼CEO張建中給公司全體員工發(fā)了一封信。信中提到了很多關于過去三年研發(fā)工作的總結,以及未來發(fā)展規(guī)劃的內容,不過,這封信的核心內容是:摩爾線程將進行一次崗位優(yōu)化,也就是裁員。

對于這家中國本土新崛起的GPU芯片設計公司來說,最近幾年的形勢,使得擺在他面前的機遇和挑戰(zhàn)都顯得很凸出。

不僅摩爾線程,壁仞科技和沐曦集成電路也是近幾年中國本土表現(xiàn)非常凸出的GPU芯片創(chuàng)業(yè)公司,再加上老牌的景嘉微,以及其它幾家相關企業(yè),把中國本土GPU技術和芯片產品市場熱度推向了一個新高度,在主動與被動之間,取得了明顯多于、快于2018年之前的成績。

然而,在市場和美國政策的雙重壓力下,特別是近期美國政府將壁仞科技和摩爾線程列入了實體清單,使得它們設計出的芯片難以拿到先進制程產能,再加上市場寒冬,以及在生態(tài)系統(tǒng)方面與英偉達的巨大差距,生存和發(fā)展愈加艱難,裁員難以避免。

01GPU及生態(tài)系統(tǒng)建設1999年10月,英偉達發(fā)布了GeForce 256,這是一款基于臺積電220nm制程工藝、集成了2300萬個晶體管的圖形處理芯片。英偉達把Graphics Processing Unit的首字母“GPU“提煉出來,把GeForce 256冠以“世界上第一塊GPU”稱號,巧妙地定義了GPU這個新品類,并占據(jù)這個詞的用戶心智直到今天。憑借先發(fā)優(yōu)勢,不僅在芯片端,英偉達在GPU生態(tài)系統(tǒng)建設方面也是統(tǒng)治者,直到今天,也沒有哪家廠商能夠動搖它的根基。

GPU原本是為圖像而生的,它把CPU從圖像顯示的苦力活中解放了出來,大量的流水線架構,使得GPU非常適合巨量、重復性的工作,自從GPU大規(guī)模應用以后,CPU就擺脫了這些原本由它負責的頭疼工作,轉而去做更擅長的指令判斷和控制類的“大腦“型工作。

在發(fā)展的很長一段時間內,由GPU組成的顯卡主要用于大型游戲、CAD制圖和視頻剪輯等圖像處理工作,后來,隨著應用和技術的發(fā)展,GPU又滲透到自動駕駛、醫(yī)療影像、金融模型、生物信息等多個領域。如今,GPU是人工智能AI),特別是AI訓練應用領域的明星,火遍全球。

發(fā)展了這么多年,GPU芯片賽道高度壟斷,全球90%的市場被少數(shù)幾家大企業(yè)占領,在集顯市場,英特爾AMD平分天下,在獨顯賽道,AMD、英偉達二八分成;在GPGPU(主要用于AI等高性能計算)市場,英偉達的市占率高達90%以上。

生態(tài)系統(tǒng)方面,2006年,英偉達推出了并行計算平臺和編程模型CUDA,它讓GPU擁有了解決復雜計算問題的能力,開發(fā)者們可以通過CUDA平臺,更方便地調度底層的GPU算力。當前,CUDA擁有400多萬開發(fā)者,大部分GPU和AI芯片創(chuàng)業(yè)公司的產品也都通過兼容CUDA來進入用戶端。

為了追趕英偉達,英特爾于2022年發(fā)布了全新架構的第一款獨立顯卡,擁有超過一萬名軟件工程師的英特爾,在顯卡發(fā)布后的一年里,其顯卡驅動更新了21次,平均半年更新10版。

為了與CUDA競爭,AMD于2016年推出了開放的ROCm平臺,不過,從目前的發(fā)展情況來看,ROCm的市場接受度和應用規(guī)模依然與CUDA有非常大的差距。

02中國GPU的發(fā)展近況 近些年,中國GPU取得了一些突破。

2019-2020年,中國本土出現(xiàn)了GPU、AI芯片創(chuàng)業(yè)熱潮,壁仞科技、摩爾線程、燧原科技、沐曦集成電路、天數(shù)智芯等一批明星企業(yè)涌現(xiàn)出來,相關GPU芯片新品不斷。

2022年3月,摩爾線程公布了首批顯卡產品,包括面向電腦和工作站的MTT S60,以及面向服務器的MTT S2000。兩張顯卡都采用了第一代MUSA架構(Moore Threads Unified System Architecture,中文名為“蘇堤”)。2022年11月,該公司公布了第二批產品,包括面向電腦和工作站的顯卡MTT S80,以及面向服務器的MTT S3000,這兩款產品采用了新一代MUSA架構“春曉”,并使用了PCIe Gen5插槽。

壁仞科技的高光時刻,是在2022年8月發(fā)布了首款GPGPU芯片BR100,并宣布該產品從800多個參選項目中脫穎而出,榮膺當年世界人工智能大會最高獎項SAIL獎。據(jù)悉,BR100峰值算力達到國際廠商在售旗艦產品3倍以上,創(chuàng)下國內互連帶寬紀錄,還是國內率先采用Chiplet技術、率先采用PCIe 5.0、率先支持CXL互連協(xié)議的GPGPU芯片。

今年6月,沐曦集成電路宣布完成AI訓練GPU MXC500的功能測算工作,同時,MXMACA 2.0計算平臺基礎測試完成。

據(jù)悉,MXC500是沐曦對標英偉達A100/A800的芯片,目標算力為FP32 15 TFLOPS(A100為FP32 19.5 TFLOPS),兼容CUDA,預計今年底規(guī)模出貨。

以上這些廠商推出的產品,目標都是要奪取英偉達和AMD在中國本土的市場份額。然而,英偉達經歷了30年的持續(xù)積累,才取得今天的成績,中國本土GPU廠商不可能在5年左右的時間內研發(fā)出具有同樣水平和市場影響力的產品。不過,如果中國GPU芯片能達到英偉達H100芯片性能的70%,也是很有意義的。接下來的重點工作就是本土GPU生態(tài)系統(tǒng)建設。

03中國GPU生態(tài)系統(tǒng)建設 比提升芯片性能更難的,是構建生態(tài)系統(tǒng)。英偉達不僅強在芯片硬件,更強在其軟件生態(tài)CUDA,其GPU+CUDA,就像英特爾和微軟構建的Wintel,后來者要想再創(chuàng)建一整套軟硬件系統(tǒng)的成本非常高,而且非常難,不僅僅是錢的問題。假設投入和英偉達相當?shù)娜瞬藕唾Y源,以3倍的發(fā)展速度追趕,至少需要10年時間才能接近英偉達的水平。

以摩爾線程為例,理論上講,無論是GPGPU,還是桌面級應用,該公司的產品性能已經達到了英偉達中端產品水準,但實際表現(xiàn)并非如此。以MTT S80為例,從游戲愛好者的測試結果來看,其早期實際性能接近GTX1050Ti,今年更新驅動后,性能可以媲美GTX1650,能流暢運行英雄聯(lián)盟等網游,也可以跑4K游戲,但與RTX3060相比,依然有很大差距。

MTT S80強勁的硬件卻難以發(fā)揮理論性能,關鍵問題就是軟件適配,摩爾線程差的就是底層技術和驅動經驗的積累。據(jù)悉,MUSA架構源于IMG的PowerVR,這也從一個側面體現(xiàn)出該公司在GPU IP方面缺乏核心技術。

通過購買IP研發(fā)GPU是中國本土大多數(shù)廠商的選擇,包括芯動、壁仞科技等企業(yè)都是如此。該模式能夠以最小代價設計出商用產品,但是,芯片生產出來以后,軟硬件打磨就要考驗廠家的技術實力了,而這些軟實力是沒有地方購買的。

中國老牌GPU芯片企業(yè)景嘉微曾表示,做GPU,三分靠硬件,七分靠軟件。英偉達在初期的產品性能也不好,還一度被ATI壓制,后期的成功除了全新架構的助攻,驅動的打磨功不可沒。

中國本土這些GPU芯片新星大多都想兼容英偉達的CUDA,但是,在驅動軟件的適配上還差強人意,例如,早期的MTT S80只支持DX9游戲,雖然現(xiàn)在歷經9次版本驅動更新后,能支持更高的DX11游戲,但是其性能表現(xiàn)遠未達到硬件實際水平。

正是看到了差距,中國本土GPU廠商一直在生態(tài)系統(tǒng)建設方面增加投入。例如,今年,弘信電子與摩爾線程和燧原科技分別簽署了《戰(zhàn)略合作框架協(xié)議》,以打造人工智能軟硬件基礎設施。

目前,摩爾線程已經將大部分資源分配給軟件,占比達到70%,重點關注元宇宙和AI。沐曦已與服務器OEM、大數(shù)據(jù)中心、互聯(lián)網、運營商等行業(yè)客戶建立了合作關系,并與眾多知名高校和研究機構開展產學研合作,快速推進產業(yè)上下游生態(tài)系統(tǒng)建設。

04GPU的新動向 全球范圍內,在已有基礎上,GPU技術及其生態(tài)依然在向前發(fā)展,目前來看,有兩點很值得關注:一是GPU與CPU的融合,二是RISC-V的融入。

GPU 比 CPU 簡單得多;它可以更快地執(zhí)行簡單的指令,執(zhí)行是并行進行的,這也是GPU與CPU的最大不同之處。然而,并非所有軟件都可以輕松地并行化執(zhí)行。CUDA生態(tài)系統(tǒng)旨在提供工具來構建可以利用GPU進行并行計算的軟件應用程序,但是,大多數(shù)軟件應用程序仍然需要CPU才能運行。

基于 CPU 的應用程序不僅更容易開發(fā),而且大多已經構建完成。很難想象哪些公司會花費時間和精力將已經在 CPU 上運行的東西移植到GPU上。

目前,AMD、英特爾和英偉達都在CPU-GPU融合技術方面下重注。

2023上半年,AMD首席技術官Mark Papermaster表示,該公司將在2024年推出CPU-GPU 芯片,它將基于第4代Epyc架構的CPU內核與基于新一代CDNA 3架構的GPU結合在一起,也就是AMD近些年一直在宣傳的APU概念。

英特爾的CPU-GPU芯片F(xiàn)alcon Shores具有x86 CPU內核和Xe GPU內核,成熟產品將在2025年量產。

下面看一下RISC-V與GPU的融合。

最近,Ventana Micro Systems與Imagination Technologies合作推出了基于RISC-V的CPU-GPU平臺。

Ventana計劃推出一個仿真模型,展示其基于RISV-C的CPU如何與Imagination開發(fā)的GPU協(xié)同工作。這次演示將結合Ventana的新CPU產品Veyron V2。據(jù)悉,V2將對RISC-V指令集架構進行增強,使其能與x86和Arm同臺競技。

目前來看,Imagination與Ventana的合作項目距離產品量產和規(guī)?;瘧眠€有較大距離,但是,RISC-V CPU和GPU IP融合的可用性,可能會帶來針對不同客戶端應用的新一波RISC-V平臺開發(fā)熱潮。

從目前的市場和應用需求來看,RISC-V與GPU的結合是有基礎的。

在一些垂直市場,例如5G/6G通信、AI推理和視頻處理等,傳統(tǒng)CPU已經無法滿足這些應用的計算量需求,需要新計算方法的出現(xiàn)。對于圖像處理來說,內存訪問瓶頸問題已經非常凸出,需要新的解決方案,甚至是新的計算架構,看看市場上最近發(fā)布的一些人工智能和RISC-V產品,會發(fā)現(xiàn)一些公司發(fā)布的處理器里面有新的ISA,它們已經開始將RISC-V和GPU IP融合使用了。

通過指令擴展將GPU功能添加到RISC-V架構中很有創(chuàng)意,然而,二者融合這條路并不好走,最大的攔路虎就是架構融合,以及生態(tài)系統(tǒng)建設,需要的時間可能很長。要將RISC-V指令集改編成非常適合GPU任務的指令集,需要大量投資來定義ISA擴展,構建高度復雜的微架構,并對開源工具進行重大調整。如果將RISC-V指令集融入GPU架構,幾乎所有RISC-V的固有優(yōu)勢都將被定制化稀釋掉,另外,RISC-V核心ISA功能會限制GPU在特定領域的可用性。

雖然,有諸多挑戰(zhàn),但鑒于RISC-V迅猛的發(fā)展勢頭,以及其在高性能計算領域的滲透決心,與同樣在高性能計算應用領域如魚得水的GPU融合,前景還是很值得期待的。

不僅是國際巨頭,中國本土GPU廠商,特別是更具前瞻性的幾家創(chuàng)業(yè)公司,在發(fā)展GPU方面也需要研發(fā)更具競爭力的技術和產品,而在當下美國政府推出各種限制政策的大環(huán)境下,中國本土GPU芯片技術和生態(tài)系統(tǒng)建設可以拓展更多思路,將更多先進的技術和理念融入相關產品。在本土企業(yè)客戶給出更多采用和試錯空間的情況下,中國芯片企業(yè)或許可以加快追趕國際先進GPU的步伐。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    455

    文章

    50851

    瀏覽量

    423971
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10870

    瀏覽量

    211896
  • RISC-V
    +關注

    關注

    45

    文章

    2287

    瀏覽量

    46184

原文標題:?GPU芯片新技術出現(xiàn),中國廠商值得借鑒

文章出處:【微信號:ICViews,微信公眾號:半導體產業(yè)縱橫】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    6家計算芯片廠商業(yè)績兩極分化!GPU、CPU卷向高端,AI芯片加速滲透至大模型產業(yè)

    ,業(yè)績如何呢? 計算芯片包括AI芯片、CPU、GPU等關鍵環(huán)節(jié),電子發(fā)燒友網統(tǒng)計了海光信息、瀾起科技、景嘉微、寒武紀、云天勵飛、龍芯中科等不同產業(yè)鏈環(huán)節(jié)的企業(yè)在2023年的財報,從他們的財報來看,計算
    的頭像 發(fā)表于 04-28 05:54 ?5086次閱讀
    6家計算<b class='flag-5'>芯片</b><b class='flag-5'>廠商</b>業(yè)績兩極分化!<b class='flag-5'>GPU</b>、CPU卷向高端,AI<b class='flag-5'>芯片</b>加速滲透至大模型產業(yè)

    《算力芯片 高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    在數(shù)據(jù)挖掘工作中,我經常需要處理海量數(shù)據(jù)的深度學習任務,這讓我對GPU架構和張量運算充滿好奇。閱讀《算力芯片》第7-9章,讓我對這些關鍵技術有了全新認識。 GPU架構從早期的固定功能流
    發(fā)表于 11-24 17:12

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解算力芯片GPU

    應用上具有獨特優(yōu)勢和技術特點,英偉達在GPU上具有技術引領優(yōu)勢。這部分也是比較理論框架化些,通過閱讀可以對GPU有些整體了解與熟悉。
    發(fā)表于 11-03 12:55

    GPU與VR技術結合應用

    一、GPU與VR技術的基本原理 GPU的基本概念 GPU是一種專門用于處理圖形和圖像數(shù)據(jù)的處理器,相較于CPU(中央處理器),GPU在處理圖
    的頭像 發(fā)表于 10-27 11:23 ?358次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    、GPU、NPU,給我們剖析了算力芯片的微架構。書中有對芯片方案商處理器的講解,理論聯(lián)系實際,使讀者能更好理解算力芯片。 全書共11章,由淺入深,較系統(tǒng)全面進行講解。下面目錄對全書
    發(fā)表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構分析

    。本書對華為等廠商推出的NPU芯片設計也做了架構描述,中國也擁有獨立自主知識產權的高算力芯片,并且支持多芯片、高帶寬互連。本書也回顧了近20
    發(fā)表于 09-02 10:09

    什么是GPU技術?它有哪些應用?

    GPU技術,即圖形處理器(Graphics Processing Unit)技術,是一種專門設計用于處理圖像和圖形數(shù)據(jù)的微處理器技術。隨著計算機圖形學和計算機視覺
    的頭像 發(fā)表于 08-22 14:34 ?2549次閱讀

    戴森新款吹風機HD16發(fā)布對國內廠商的啟示

    的無刷電機驅動方案商,本文我將圍繞以下2個方面,淺談戴森能成為全球個護領域巨頭的主要原因,以及戴森的成長對國內廠商的啟示。 其利天下技術分享 技術創(chuàng)新是核心 戴森一直以來都致力于技術
    發(fā)表于 05-15 18:37

    手持激光焊接設備廠商哪家值得選擇?

    、航空航天等。選擇一款性能優(yōu)越的手持激光焊接設備,對于企業(yè)提高生產效率和產品質量具有重要意義。 那么,我們如何選擇一款值得信賴的手持激光焊接設備廠商呢?在此,我們向您推薦以下幾點: 第一,強大的技術實力。一家
    的頭像 發(fā)表于 04-29 10:09 ?653次閱讀
    手持激光焊接設備<b class='flag-5'>廠商</b>哪家<b class='flag-5'>值得</b>選擇?

    英偉達發(fā)布新一代AI芯片架構Blackwell GPU

    近日,英偉達首席執(zhí)行官黃仁勛在GTC 2024會議上發(fā)表主題演講,重磅推出全新AI芯片架構Blackwell GPU。這一創(chuàng)新技術的首款芯片產品命名為GB200,標志著英偉達在人工智能
    的頭像 發(fā)表于 03-26 11:19 ?889次閱讀

    Groq聲稱碾壓英偉達GPU 國產芯片如何借鑒?

    洞見分析
    電子發(fā)燒友網官方
    發(fā)布于 :2024年03月15日 09:30:26

    科普 | 一文了解FPGA技術知識

    廠商的距離,國產廠商需要突破國產FPGA技術瓶頸,突破國產FPGA芯片技術瓶頸突破國產FPGA的質量瓶頸。以“質量第一”為目標,當
    發(fā)表于 03-08 14:57

    中移芯昇獲高新技術企業(yè)證書

    近日,中國移動旗下專業(yè)芯片公司芯昇科技有限公司(以下簡稱“中移芯昇”)順利通過“高新技術企業(yè)”認定,獲高新技術企業(yè)證書。創(chuàng)新是企業(yè)發(fā)展的內在動力。高
    的頭像 發(fā)表于 03-06 08:17 ?440次閱讀
    中移芯昇獲高<b class='flag-5'>新技術</b>企業(yè)證書

    為什么芯片工藝要借鑒“望聞問切”?

    有朋友看到這個題目很疑惑,“望聞問切”不是醫(yī)學術語嗎?和芯片工藝有什么聯(lián)系嗎?兩個風馬牛不相及的行業(yè)能有什么共通之處?當然這不是牽強附會,是我從事多年工作的深切體會,當然不僅僅用在芯片行業(yè)中,很多行業(yè)都可以借鑒其先進的辯證思想。
    的頭像 發(fā)表于 01-18 11:10 ?507次閱讀
    為什么<b class='flag-5'>芯片</b>工藝要<b class='flag-5'>借鑒</b>“望聞問切”?

    汽車AI技術還能怎么卷?CES 2024五大廠商新技術燃爆智能出行市場

    、操作系統(tǒng)到智能汽車企業(yè)都展示其在AI趨勢下的最新技術和應用趨勢。 ? 高通、Intel、英偉達、黑芝麻科技、Google、奔馳、寶馬等都已經隆重亮相,當眾多車企和芯片廠商把目光聚焦智能座艙、AI上車的研發(fā)和生產,本文將重點揭示
    的頭像 發(fā)表于 01-12 00:02 ?1988次閱讀
    汽車AI<b class='flag-5'>技術</b>還能怎么卷?CES 2024五大<b class='flag-5'>廠商</b><b class='flag-5'>新技術</b>燃爆智能出行市場