0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

曙光已現(xiàn)!通用GPU芯片加速破局,國內(nèi)企業(yè)突破量產(chǎn)瓶頸

Monika觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:莫婷婷 ? 2022-03-08 07:23 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)當(dāng)下,英偉達(dá)、AMD兩大巨頭占據(jù)全球超過80%的通用GPU市場。在算力需求激增的情況下,多家國內(nèi)企業(yè)選擇加入通用GPU賽道,例如天數(shù)智芯、沐曦、壁仞科技、登臨科技等。就在2021年3月,天數(shù)智芯發(fā)布全自研云端訓(xùn)練通用GPU芯片——天垓100芯片,這也是國內(nèi)第一款全自研、GPU架構(gòu)下的7nm制程通用GPU訓(xùn)練芯片。

電子發(fā)燒友網(wǎng)記者了解到,天數(shù)智芯的7nm 通用GPU訓(xùn)練芯片已經(jīng)獲得安防、人工智能、超算中心等多個(gè)應(yīng)用領(lǐng)域的客戶訂單,未來將持續(xù)往5nm、3nm等更高級(jí)的制程發(fā)力。那么,國內(nèi)通用GPU芯片量產(chǎn)的技術(shù)瓶頸在哪里,國內(nèi)企業(yè)如何實(shí)現(xiàn)突圍?記者就相關(guān)問題與天數(shù)智芯副總裁郭為進(jìn)行了交流。

為什么國產(chǎn)通用GPU芯片量產(chǎn)難度大?

通用GPU即通用圖形處理器,可用于人工智能模型訓(xùn)練與推理,以及高性能計(jì)算。與CPU相比,GPU的平行處理能力、處理速度都優(yōu)于CPU,這也加強(qiáng)了GPU的通用性,而通用GPU的出現(xiàn)讓GPU更加專注通用性。可以說,通用GPU就是GPU里的另一個(gè)快速發(fā)展的細(xì)分市場。

市場機(jī)構(gòu)的數(shù)據(jù)顯示,2019年我國通用GPU芯片的市場規(guī)模已達(dá)86億元,預(yù)計(jì)到2025年將保持32%的年復(fù)合增長率,達(dá)458億元。面對(duì)如此巨大的市場,國內(nèi)企業(yè)涉足通用GPU市場,面臨哪些挑戰(zhàn)?郭為向記者表示,通用GPU芯片在設(shè)計(jì)上主要面臨的是兩大挑戰(zhàn),一是通用架構(gòu),二是軟件生態(tài)。

在架構(gòu)方面,通用架構(gòu)需要適配各種各樣的算法,包括基礎(chǔ)計(jì)算;同時(shí)考慮到應(yīng)用場景的特殊性,對(duì)芯片功耗也有要求,這就需要對(duì)芯片架構(gòu)的優(yōu)化和設(shè)計(jì),實(shí)現(xiàn)低功耗高算力;另一方面,記者了解到國內(nèi)在人才方面還面臨較大的缺口,培養(yǎng)一位成熟的工程師需要10年的時(shí)間。

在軟件生態(tài)方面,通用GPU不僅僅是一顆芯片硬件,還涉及到整個(gè)軟件棧、編譯器等一系列的軟件生態(tài)系統(tǒng)。

為了突破技術(shù)瓶頸,天數(shù)智芯從2018年開始正式啟動(dòng)通用GPU芯片設(shè)計(jì),歷時(shí)三年最終量產(chǎn)國內(nèi)首款全自研的7nm 通用GPU芯片。據(jù)了解,該芯片采用2.5D CoWoS晶圓封裝技術(shù),集成240億晶體管,支持多精度數(shù)據(jù)類型支持標(biāo)準(zhǔn)/混合訓(xùn)練。在軟件上,該芯片兼容主流生態(tài)系統(tǒng),采用自主研發(fā)的軟件棧,從多方面實(shí)現(xiàn)算力升級(jí)。

目前,一些國際巨頭在GPU行業(yè)中仍處于領(lǐng)先位置,國內(nèi)廠商需要突破重重挑戰(zhàn)才能實(shí)現(xiàn)GPU突圍。郭為也提到,英偉達(dá)經(jīng)過十幾年的發(fā)展,不僅有自主完善芯片架構(gòu),同樣也有完善的軟件生態(tài),相對(duì)于軟件生態(tài),它具有豐富的軟件接口、底層加速庫,通用GPU芯片的入場門檻更高,這些都是國產(chǎn)企業(yè)需要追趕的。

正是因?yàn)橥ㄓ肎PU行業(yè)的高門檻,天數(shù)智芯的不易與成功也讓國產(chǎn)企業(yè)看到了另一個(gè)可能性。

天數(shù)智芯推出7nm通用GPU芯片時(shí)便得到了業(yè)內(nèi)人士的認(rèn)可。中國工程院院士倪光南表示,該芯片在性能指標(biāo)方面并不亞于國外主流產(chǎn)品。電子發(fā)燒友網(wǎng)了解到,天數(shù)智芯的“天垓100芯片”比業(yè)內(nèi)同類芯片的面積小了一半,卻實(shí)現(xiàn)單精FP32性能37TFlops,半精FP16/BF16性能147TFlops。

國產(chǎn)通用GPU芯片落地,深挖應(yīng)用場景

國產(chǎn)通用GPU芯片在AI領(lǐng)域?qū)⒋蜷_大規(guī)模的應(yīng)用市場,而這些都需要云端訓(xùn)練。以安防攝像頭為例,攝像頭在工作過程中,需要進(jìn)行車輛識(shí)別、人臉識(shí)別等,這部分更重要的是依賴云端訓(xùn)練出的模型,進(jìn)行大量推理。

郭為提到,通用GPU芯片還可以用于安檢機(jī),以及快遞行業(yè),對(duì)大量的物品進(jìn)行識(shí)別,不管是安防還是快遞行業(yè),這些行業(yè)對(duì)模型訓(xùn)練以及模型推理的速度要求都非常高。在這方面,天數(shù)智芯已有客戶帶來了落地應(yīng)用案例。

通用GPU芯片最典型的應(yīng)用場景是在人工智能,但隨著技術(shù)的成熟,通用GPU芯片在5G、自動(dòng)駕駛、大數(shù)據(jù)等領(lǐng)域的應(yīng)用不斷擴(kuò)增。

自動(dòng)駕駛最重要的是安全性,車上有大量的傳感器獲取路面情況,這些數(shù)據(jù)將被整合,再通過預(yù)先訓(xùn)練的模型預(yù)測路況,可以迅速作出決定。郭為指出,在這個(gè)過程中,需要大量的算力,同時(shí)考慮到汽車空間、電池功耗等問題,將大功耗或者大算力系統(tǒng)放在汽車內(nèi)部也不太適合,最值得考慮的解決方案是將系統(tǒng)放在邊緣側(cè),同時(shí)因?yàn)樗枰杆僮鞒鰶Q定,要求邊緣側(cè)和汽車之間的通訊盡量地做到低時(shí)延,5G恰好可以實(shí)現(xiàn)這樣的低時(shí)延。

在這些處理過程中,都需要用到通用GPU芯片。郭為認(rèn)為,在達(dá)到理想的高算力低功耗的技術(shù)下,未來可以把高端的高算力的芯片直接放在汽車上面,應(yīng)用場景也就更廣了,這也是未來幾年業(yè)內(nèi)的研究方向。

對(duì)于未來的發(fā)展戰(zhàn)略,天數(shù)智芯副總裁郭為提到了三大方面:

一是更強(qiáng)的算力。任何一個(gè)AI應(yīng)用的模型都會(huì)越來越復(fù)雜,要求提供更高的算力,同時(shí)芯片制成提升會(huì)帶來邊際效應(yīng)收窄,這時(shí)該如何進(jìn)一步提升算力,實(shí)際上是任何一個(gè)通用GPU芯片都會(huì)面臨的技術(shù)挑戰(zhàn)。另一方面,自動(dòng)駕駛、智慧醫(yī)療等各個(gè)行業(yè)的算法也在不斷演進(jìn),此時(shí),對(duì)于訓(xùn)練芯片來講,更高的算力才能支持相應(yīng)的算法運(yùn)行。

二是更高的通用性。由于技術(shù)的快速迭代,云端訓(xùn)練芯片一定要有更高的通用性才能跟上智能駕駛、智慧醫(yī)療等高端市場需求。

三是隱私計(jì)算。智慧醫(yī)療場景涉及到患者,甚至醫(yī)院的醫(yī)療數(shù)據(jù)隱私。而任何一個(gè)AI模型都需要大量的數(shù)據(jù)做訓(xùn)練,這時(shí)需要用到隱私計(jì)算,通過隱私加解密的方式,讓這些敏感的數(shù)據(jù)做到可用。

“對(duì)于醫(yī)療這樣的場景,隱私保護(hù)是相當(dāng)重要的。云端訓(xùn)練芯片關(guān)于隱私保護(hù)這部分的解決方案,以及通用計(jì)算,也應(yīng)當(dāng)是后面的發(fā)展趨勢。”郭為表示,天數(shù)智芯在未來會(huì)深挖隱私保護(hù)的相關(guān)應(yīng)用場景,并且推出解決方案。

小結(jié)

如今,國內(nèi)企業(yè)不斷發(fā)力通用GPU芯片市場,隨著技術(shù)的成熟也將給更多的應(yīng)用場景帶來多樣化的可能性。當(dāng)然,國內(nèi)企業(yè)還需正視與國際企業(yè)的差距,并且在追趕的過程中,不斷縮小差距,讓國內(nèi)的通用GPU芯片打開真正的用武之地。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31027

    瀏覽量

    269363
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    303

    瀏覽量

    5841
  • 天數(shù)智芯
    +關(guān)注

    關(guān)注

    0

    文章

    95

    瀏覽量

    5550
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    禾賽科技累計(jì)量產(chǎn)定點(diǎn)車型突破100款

    今日,全球領(lǐng)先的激光雷達(dá)企業(yè)禾賽科技(納斯達(dá)克:HSAI)宣布,新獲國內(nèi)三家銷量 Top 5 車企的十余款量產(chǎn)車型定點(diǎn)*,加上近期獲得的長城、長安等頭部主機(jī)廠的多個(gè)新車型定點(diǎn),禾賽科技
    的頭像 發(fā)表于 12-27 17:06 ?275次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    許可證模型的加速令牌或SIMULIA統(tǒng)一許可證模型的SimUnit令牌或積分授權(quán)。 4. GPU計(jì)算的啟用 - 交互式模擬:通過加速對(duì)話框啟用,打開求解器對(duì)話框,點(diǎn)擊“加速”按鈕,打
    發(fā)表于 12-16 14:25

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    CPU、GPU的演進(jìn)歷程,AI專用芯片或?qū)⒁I(lǐng)未來計(jì)算平臺(tái)的新方向。正如愛因斯坦所說:\"想象力比知識(shí)更重要\" —— 在芯片設(shè)計(jì)領(lǐng)域,創(chuàng)新思維帶來的突破往往令人驚嘆。
    發(fā)表于 11-24 17:12

    GPU加速計(jì)算平臺(tái)是什么

    GPU加速計(jì)算平臺(tái),簡而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來加速科學(xué)計(jì)算、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等復(fù)雜計(jì)算任務(wù)的軟硬件結(jié)合系統(tǒng)。
    的頭像 發(fā)表于 10-25 09:23 ?258次閱讀

    英偉達(dá)Blackwell GPU量產(chǎn)加速,Q4營收沖刺百億美元大關(guān)

    近日,全球領(lǐng)先的圖形處理單元(GPU)及人工智能芯片制造商英偉達(dá)傳來重大利好消息。據(jù)摩根士丹利最新發(fā)布的行業(yè)分析報(bào)告指出,英偉達(dá)基于Blackwell架構(gòu)的新一代GPU已成功進(jìn)入量產(chǎn)
    的頭像 發(fā)表于 09-26 15:58 ?339次閱讀

    報(bào)名開啟!深圳(國際)通用人工智能大會(huì)將啟幕,國內(nèi)外大咖齊聚話AI

    ,得到了華為、騰訊、優(yōu)必選、中煤科工、中國聯(lián)通、云天勵(lì)飛、考拉悠然、智航、力維智聯(lián)等國內(nèi)人工智能企業(yè)的深度參與和大力支持。 報(bào)名后即可到現(xiàn)場領(lǐng)取禮品,總計(jì)5000份,先到先選! 點(diǎn)擊報(bào)名:https://bbs.elecfans.com/jishu_2447254_1
    發(fā)表于 08-22 15:00

    國產(chǎn)芯片原廠的出路:從風(fēng)潮到現(xiàn)實(shí)的之路

    國產(chǎn)芯片原廠的出路:從風(fēng)潮到現(xiàn)實(shí)的之路
    的頭像 發(fā)表于 08-12 17:54 ?806次閱讀

    1200V GaN又有新玩家入場,進(jìn)入量產(chǎn)

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)最近,又有國內(nèi)GaN廠商成功突破1200V GaN器件技術(shù)。7月26日,宇騰科技在社交平臺(tái)上宣布公司自主研發(fā)生產(chǎn)的藍(lán)寶石基GaN功率器件工作電壓達(dá)到1200V,進(jìn)入
    的頭像 發(fā)表于 07-31 01:06 ?3576次閱讀

    摩爾線程與國內(nèi)EDA企業(yè)合作加速GPU芯片設(shè)計(jì)

    7月19日,摩爾線程公司正式宣布與國內(nèi)EDA(電子設(shè)計(jì)自動(dòng)化)領(lǐng)域的領(lǐng)軍企業(yè)締結(jié)戰(zhàn)略伙伴關(guān)系,此舉標(biāo)志著雙方在推動(dòng)中國半導(dǎo)體設(shè)計(jì)核心技術(shù)自主化進(jìn)程上邁出了堅(jiān)實(shí)步伐。EDA,被譽(yù)為半導(dǎo)體行業(yè)的“基石”,其全球市場份額長期由歐美三強(qiáng)主導(dǎo),而
    的頭像 發(fā)表于 07-19 14:48 ?1899次閱讀

    中科微感MEMS氣體傳感器量產(chǎn)技術(shù)再次突破瓶頸,良品率接近98%

    中科微感MEMS氣體傳感器量產(chǎn)技術(shù)再次突破瓶頸。以CM-A107S氫氣傳感器為例,晶圓級(jí)萬顆批量生產(chǎn),單顆LGA封裝的MEMS氫氣傳感器初始阻值和響應(yīng)值一致性偏差逼近5%,良品率接近98%。
    的頭像 發(fā)表于 05-09 09:03 ?679次閱讀
    中科微感MEMS氣體傳感器<b class='flag-5'>量產(chǎn)</b>技術(shù)再次<b class='flag-5'>突破</b><b class='flag-5'>瓶頸</b>,良品率接近98%

    國內(nèi)GPU新勢力:能否成為英偉達(dá)的“終結(jié)者”?

    在當(dāng)今的信息技術(shù)時(shí)代,圖形處理器(GPU)和人工智能(AI)加速卡在計(jì)算領(lǐng)域中扮演著至關(guān)重要的角色。英偉達(dá)(NVIDIA),作為全球GPU和AI技術(shù)的領(lǐng)軍企業(yè),長期以來一直占據(jù)著市場的
    的頭像 發(fā)表于 04-24 11:07 ?473次閱讀
    <b class='flag-5'>國內(nèi)</b><b class='flag-5'>GPU</b>新勢力:能否成為英偉達(dá)的“終結(jié)者”?

    FPGA芯片你了解多少?

    ,F(xiàn)PGA芯片未來五年勢必會(huì)迎來加速放量期,盡管國內(nèi)企業(yè)和世界頂級(jí)企業(yè)還有較大差距,但在國產(chǎn)替代的核心邏輯下,摘取低處的果實(shí)也足以吃飽,不出
    發(fā)表于 04-17 11:13

    未來來,多傳感器融合感知是自動(dòng)駕駛的關(guān)鍵

    方面表示,這是L4級(jí)自動(dòng)駕駛公司和車企為了打造Robotaxi量產(chǎn)車,在國內(nèi)成立的首個(gè)合資公司。首款車型已完成產(chǎn)品定義,正在進(jìn)行設(shè)計(jì)造型的聯(lián)合評(píng)審,計(jì)劃明年實(shí)現(xiàn)量產(chǎn)。未來來,2024
    發(fā)表于 04-11 10:26

    國內(nèi)首枚!合肥造量子芯片重大突破

    記者3月19日從合肥中安創(chuàng)谷科技園獲悉,位于該園的合肥硅臻芯片研發(fā)的量子隨機(jī)數(shù)發(fā)生器芯片QRNG-10,日前通過了國家密碼管理商用密碼檢測中心的密碼檢測。 這是國內(nèi)第一枚
    的頭像 發(fā)表于 03-21 08:42 ?643次閱讀
    <b class='flag-5'>國內(nèi)</b>首枚!合肥造量子<b class='flag-5'>芯片</b>重大<b class='flag-5'>突破</b>

    新入圍企業(yè)翻倍 芯片電感助力磁性元件

    2023年,新能源整個(gè)產(chǎn)業(yè)也加入了價(jià)格戰(zhàn)的廝殺,日益激烈的競爭,讓越來越多的企業(yè)開始將目光投向技術(shù),希望以技術(shù)過渡內(nèi)卷的行業(yè)現(xiàn)狀,本屆優(yōu)霸杯入圍企業(yè)數(shù)量相比往屆大幅增加,就是這一現(xiàn)
    的頭像 發(fā)表于 01-25 15:14 ?517次閱讀
    新入圍<b class='flag-5'>企業(yè)</b>翻倍 <b class='flag-5'>芯片</b>電感助力磁性元件<b class='flag-5'>破</b>卷