電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)當(dāng)下,英偉達(dá)、AMD兩大巨頭占據(jù)全球超過80%的通用GPU市場。在算力需求激增的情況下,多家國內(nèi)企業(yè)選擇加入通用GPU賽道,例如天數(shù)智芯、沐曦、壁仞科技、登臨科技等。就在2021年3月,天數(shù)智芯發(fā)布全自研云端訓(xùn)練通用GPU芯片——天垓100芯片,這也是國內(nèi)第一款全自研、GPU架構(gòu)下的7nm制程通用GPU訓(xùn)練芯片。
電子發(fā)燒友網(wǎng)記者了解到,天數(shù)智芯的7nm 通用GPU訓(xùn)練芯片已經(jīng)獲得安防、人工智能、超算中心等多個(gè)應(yīng)用領(lǐng)域的客戶訂單,未來將持續(xù)往5nm、3nm等更高級(jí)的制程發(fā)力。那么,國內(nèi)通用GPU芯片量產(chǎn)的技術(shù)瓶頸在哪里,國內(nèi)企業(yè)如何實(shí)現(xiàn)突圍?記者就相關(guān)問題與天數(shù)智芯副總裁郭為進(jìn)行了交流。
為什么國產(chǎn)通用GPU芯片量產(chǎn)難度大?
通用GPU即通用圖形處理器,可用于人工智能模型訓(xùn)練與推理,以及高性能計(jì)算。與CPU相比,GPU的平行處理能力、處理速度都優(yōu)于CPU,這也加強(qiáng)了GPU的通用性,而通用GPU的出現(xiàn)讓GPU更加專注通用性。可以說,通用GPU就是GPU里的另一個(gè)快速發(fā)展的細(xì)分市場。
市場機(jī)構(gòu)的數(shù)據(jù)顯示,2019年我國通用GPU芯片的市場規(guī)模已達(dá)86億元,預(yù)計(jì)到2025年將保持32%的年復(fù)合增長率,達(dá)458億元。面對(duì)如此巨大的市場,國內(nèi)企業(yè)涉足通用GPU市場,面臨哪些挑戰(zhàn)?郭為向記者表示,通用GPU芯片在設(shè)計(jì)上主要面臨的是兩大挑戰(zhàn),一是通用架構(gòu),二是軟件生態(tài)。
在架構(gòu)方面,通用架構(gòu)需要適配各種各樣的算法,包括基礎(chǔ)計(jì)算;同時(shí)考慮到應(yīng)用場景的特殊性,對(duì)芯片功耗也有要求,這就需要對(duì)芯片架構(gòu)的優(yōu)化和設(shè)計(jì),實(shí)現(xiàn)低功耗高算力;另一方面,記者了解到國內(nèi)在人才方面還面臨較大的缺口,培養(yǎng)一位成熟的工程師需要10年的時(shí)間。
在軟件生態(tài)方面,通用GPU不僅僅是一顆芯片硬件,還涉及到整個(gè)軟件棧、編譯器等一系列的軟件生態(tài)系統(tǒng)。
為了突破技術(shù)瓶頸,天數(shù)智芯從2018年開始正式啟動(dòng)通用GPU芯片設(shè)計(jì),歷時(shí)三年最終量產(chǎn)國內(nèi)首款全自研的7nm 通用GPU芯片。據(jù)了解,該芯片采用2.5D CoWoS晶圓封裝技術(shù),集成240億晶體管,支持多精度數(shù)據(jù)類型支持標(biāo)準(zhǔn)/混合訓(xùn)練。在軟件上,該芯片兼容主流生態(tài)系統(tǒng),采用自主研發(fā)的軟件棧,從多方面實(shí)現(xiàn)算力升級(jí)。
目前,一些國際巨頭在GPU行業(yè)中仍處于領(lǐng)先位置,國內(nèi)廠商需要突破重重挑戰(zhàn)才能實(shí)現(xiàn)GPU突圍。郭為也提到,英偉達(dá)經(jīng)過十幾年的發(fā)展,不僅有自主完善芯片架構(gòu),同樣也有完善的軟件生態(tài),相對(duì)于軟件生態(tài),它具有豐富的軟件接口、底層加速庫,通用GPU芯片的入場門檻更高,這些都是國產(chǎn)企業(yè)需要追趕的。
正是因?yàn)橥ㄓ肎PU行業(yè)的高門檻,天數(shù)智芯的不易與成功也讓國產(chǎn)企業(yè)看到了另一個(gè)可能性。
天數(shù)智芯推出7nm通用GPU芯片時(shí)便得到了業(yè)內(nèi)人士的認(rèn)可。中國工程院院士倪光南表示,該芯片在性能指標(biāo)方面并不亞于國外主流產(chǎn)品。電子發(fā)燒友網(wǎng)了解到,天數(shù)智芯的“天垓100芯片”比業(yè)內(nèi)同類芯片的面積小了一半,卻實(shí)現(xiàn)單精FP32性能37TFlops,半精FP16/BF16性能147TFlops。
國產(chǎn)通用GPU芯片落地,深挖應(yīng)用場景
國產(chǎn)通用GPU芯片在AI領(lǐng)域?qū)⒋蜷_大規(guī)模的應(yīng)用市場,而這些都需要云端訓(xùn)練。以安防攝像頭為例,攝像頭在工作過程中,需要進(jìn)行車輛識(shí)別、人臉識(shí)別等,這部分更重要的是依賴云端訓(xùn)練出的模型,進(jìn)行大量推理。
郭為提到,通用GPU芯片還可以用于安檢機(jī),以及快遞行業(yè),對(duì)大量的物品進(jìn)行識(shí)別,不管是安防還是快遞行業(yè),這些行業(yè)對(duì)模型訓(xùn)練以及模型推理的速度要求都非常高。在這方面,天數(shù)智芯已有客戶帶來了落地應(yīng)用案例。
通用GPU芯片最典型的應(yīng)用場景是在人工智能,但隨著技術(shù)的成熟,通用GPU芯片在5G、自動(dòng)駕駛、大數(shù)據(jù)等領(lǐng)域的應(yīng)用不斷擴(kuò)增。
自動(dòng)駕駛最重要的是安全性,車上有大量的傳感器獲取路面情況,這些數(shù)據(jù)將被整合,再通過預(yù)先訓(xùn)練的模型預(yù)測路況,可以迅速作出決定。郭為指出,在這個(gè)過程中,需要大量的算力,同時(shí)考慮到汽車空間、電池功耗等問題,將大功耗或者大算力系統(tǒng)放在汽車內(nèi)部也不太適合,最值得考慮的解決方案是將系統(tǒng)放在邊緣側(cè),同時(shí)因?yàn)樗枰杆僮鞒鰶Q定,要求邊緣側(cè)和汽車之間的通訊盡量地做到低時(shí)延,5G恰好可以實(shí)現(xiàn)這樣的低時(shí)延。
在這些處理過程中,都需要用到通用GPU芯片。郭為認(rèn)為,在達(dá)到理想的高算力低功耗的技術(shù)下,未來可以把高端的高算力的芯片直接放在汽車上面,應(yīng)用場景也就更廣了,這也是未來幾年業(yè)內(nèi)的研究方向。
對(duì)于未來的發(fā)展戰(zhàn)略,天數(shù)智芯副總裁郭為提到了三大方面:
一是更強(qiáng)的算力。任何一個(gè)AI應(yīng)用的模型都會(huì)越來越復(fù)雜,要求提供更高的算力,同時(shí)芯片制成提升會(huì)帶來邊際效應(yīng)收窄,這時(shí)該如何進(jìn)一步提升算力,實(shí)際上是任何一個(gè)通用GPU芯片都會(huì)面臨的技術(shù)挑戰(zhàn)。另一方面,自動(dòng)駕駛、智慧醫(yī)療等各個(gè)行業(yè)的算法也在不斷演進(jìn),此時(shí),對(duì)于訓(xùn)練芯片來講,更高的算力才能支持相應(yīng)的算法運(yùn)行。
二是更高的通用性。由于技術(shù)的快速迭代,云端訓(xùn)練芯片一定要有更高的通用性才能跟上智能駕駛、智慧醫(yī)療等高端市場需求。
三是隱私計(jì)算。智慧醫(yī)療場景涉及到患者,甚至醫(yī)院的醫(yī)療數(shù)據(jù)隱私。而任何一個(gè)AI模型都需要大量的數(shù)據(jù)做訓(xùn)練,這時(shí)需要用到隱私計(jì)算,通過隱私加解密的方式,讓這些敏感的數(shù)據(jù)做到可用。
“對(duì)于醫(yī)療這樣的場景,隱私保護(hù)是相當(dāng)重要的。云端訓(xùn)練芯片關(guān)于隱私保護(hù)這部分的解決方案,以及通用計(jì)算,也應(yīng)當(dāng)是后面的發(fā)展趨勢。”郭為表示,天數(shù)智芯在未來會(huì)深挖隱私保護(hù)的相關(guān)應(yīng)用場景,并且推出解決方案。
小結(jié)
如今,國內(nèi)企業(yè)不斷發(fā)力通用GPU芯片市場,隨著技術(shù)的成熟也將給更多的應(yīng)用場景帶來多樣化的可能性。當(dāng)然,國內(nèi)企業(yè)還需正視與國際企業(yè)的差距,并且在追趕的過程中,不斷縮小差距,讓國內(nèi)的通用GPU芯片打開真正的用武之地。
-
AI
+關(guān)注
關(guān)注
87文章
31027瀏覽量
269363 -
GPU芯片
+關(guān)注
關(guān)注
1文章
303瀏覽量
5841 -
天數(shù)智芯
+關(guān)注
關(guān)注
0文章
95瀏覽量
5550
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論