電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)智能化美好新時(shí)代,計(jì)算產(chǎn)業(yè)的發(fā)展是必然趨勢(shì),而算力是計(jì)算產(chǎn)業(yè)的基石,談到算力就必然離不開(kāi)AI芯片。
長(zhǎng)期以來(lái)市場(chǎng)和生態(tài)制約著國(guó)產(chǎn)芯片產(chǎn)業(yè)的發(fā)展,國(guó)外芯片巨頭定義了傳統(tǒng)芯片生態(tài)的規(guī)則,壟斷了國(guó)內(nèi)市場(chǎng),在智能化新時(shí)代,國(guó)內(nèi)的AI芯片又面臨怎樣的機(jī)遇和挑戰(zhàn)?AI芯片產(chǎn)業(yè)落地需要關(guān)注哪些問(wèn)題?
如今AI算法的應(yīng)用越來(lái)越廣泛,對(duì)AI算力提出了很高的要求,而傳統(tǒng)處理器架構(gòu)性能提升受限,那么AI芯片架構(gòu)又該有怎樣的改進(jìn)?
日前在百度技術(shù)論壇上,昆侖芯科技研發(fā)總監(jiān)羅航、昆侖芯科技NPU架構(gòu)負(fù)責(zé)人王京、昆侖芯科技基礎(chǔ)工具鏈開(kāi)發(fā)負(fù)責(zé)人張釗從各個(gè)角度對(duì)上述問(wèn)題進(jìn)行了闡述。
國(guó)內(nèi)AI芯片的機(jī)遇和挑戰(zhàn)
國(guó)內(nèi)AI芯片面臨怎樣的機(jī)遇和挑戰(zhàn)?羅航從需求側(cè)和供給側(cè)談到了這個(gè)話題,他認(rèn)為,從需求側(cè)來(lái)看,機(jī)遇方面,近幾年的中美博弈為國(guó)產(chǎn)芯片打開(kāi)了市場(chǎng)空間,新基建、雙循環(huán)、自主可控等政策扶持也給AI芯片帶了新的機(jī)遇,另外AI芯片是一個(gè)全新的市場(chǎng),全球生態(tài)格局沒(méi)有固化,這是與傳統(tǒng)芯片不同的地方;挑戰(zhàn)方面,AI產(chǎn)業(yè)仍處于早期階段,商業(yè)化不成熟,需求尚未爆發(fā),對(duì)產(chǎn)業(yè)拉動(dòng)效應(yīng)未顯現(xiàn)。
從供給測(cè)來(lái)看,機(jī)遇方面,摩爾定律逼近極限,領(lǐng)先者和追趕者代差會(huì)逐步縮小,大陸已有28nm工藝儲(chǔ)備,中國(guó)具有資本、技術(shù)、人才的后發(fā)優(yōu)勢(shì);挑戰(zhàn)方面,與第一梯隊(duì)還存在非常巨大的代際差距,產(chǎn)品和生態(tài)還很不完善,芯片設(shè)計(jì)等底層EDA還依賴國(guó)外技術(shù)。
那么AI芯片產(chǎn)業(yè)產(chǎn)業(yè)化落地重點(diǎn)需要關(guān)注和解決的問(wèn)題是什么?羅航談到幾點(diǎn):1、芯片量產(chǎn)是前提,芯片研發(fā)和流片的先期投入成本巨大,通過(guò)量產(chǎn)平攤成本是實(shí)現(xiàn)盈利的唯一方法,量產(chǎn)規(guī)模也是衡量芯片成熟度的指標(biāo)之一;2、構(gòu)建軟件生態(tài):軟件生態(tài)由軟件技術(shù)棧、開(kāi)發(fā)者社區(qū)和用戶構(gòu)成。構(gòu)建在芯片之上的軟件生態(tài)決定芯片的可用性和市場(chǎng)接受度,是芯片商業(yè)模式的護(hù)城河;3、做產(chǎn)品而不是做項(xiàng)目:產(chǎn)品力是芯片商業(yè)模式可持續(xù)成長(zhǎng)的關(guān)鍵因素,成熟的產(chǎn)品促進(jìn)量產(chǎn)規(guī)模,形成業(yè)務(wù)飛輪閉環(huán)。
在羅航看來(lái),AIoT相當(dāng)于是萬(wàn)物數(shù)據(jù)+超強(qiáng)算力,數(shù)據(jù)是生產(chǎn)資料,算力是生產(chǎn)力。物聯(lián)網(wǎng)負(fù)責(zé)海量數(shù)據(jù)生產(chǎn)和消費(fèi),AI芯片負(fù)責(zé)這些數(shù)據(jù)的處理和再造,二者相輔相成,缺一不可,計(jì)算速度、計(jì)算方法、通信能力、數(shù)據(jù)總量代表未來(lái)國(guó)與國(guó)之間的競(jìng)爭(zhēng)力。
通用AI芯片架構(gòu)昆侖芯XPU的優(yōu)勢(shì)
昆侖芯科技是一家AI芯片公司,2021年4月完成了獨(dú)立融資,前身是百度智能芯片及架構(gòu)部,昆侖芯在AI芯片上經(jīng)歷了超過(guò)10年的發(fā)展歷程,2017年發(fā)布自研架構(gòu)昆侖芯XPU;2020年昆侖芯1代大規(guī)模部署;2021年昆侖芯2代量產(chǎn)。
為什么要自研AI芯片架構(gòu),王京談到,如今各行各業(yè)都需要用到語(yǔ)音、圖像、自然語(yǔ)言處理等技術(shù),AI算法的廣泛應(yīng)用對(duì)AI算力提出更高要求,根據(jù)OpenAI分析報(bào)告,每3.5個(gè)月計(jì)算量就要翻倍,而傳統(tǒng)處理器架構(gòu),根據(jù)摩爾定律,晶體管數(shù)量翻倍要18-24個(gè)月,而且工作頻率、功耗、單線程性能以及核心數(shù)量的發(fā)展速度已經(jīng)非常緩慢,受限于此,傳統(tǒng)處理器架構(gòu)實(shí)際性能提升更慢了。因此,有必要開(kāi)發(fā)一款通用的AI芯片架構(gòu)。
相比于傳統(tǒng)的CPU、GPU,昆侖芯科技開(kāi)發(fā)的通用AI計(jì)算處理器XPU-R改變了通用計(jì)算單元和加速計(jì)算單元的數(shù)量和分布,從高性能、TCO、通用性、易編程幾個(gè)指標(biāo)來(lái)看,通用AI計(jì)算處理器XPU-R相比于CPU、GPU都表現(xiàn)出比較明顯的優(yōu)勢(shì)。
昆侖芯2代,具有高性能分布式AI系統(tǒng),芯片間互聯(lián)支持訓(xùn)練和推理中模型并行&數(shù)據(jù)并行策略的通訊要求;支持硬件虛擬化,計(jì)算單元和存儲(chǔ)單元的物理隔離,優(yōu)化了加速芯片的利用率在保證延時(shí)和吞吐量的情況下支持推理和訓(xùn)練等混合工作負(fù)載;增強(qiáng)的通用計(jì)算能力,XPU-R架構(gòu)為CLUSTER的算力提升2-3倍,進(jìn)一步擴(kuò)展通用AI計(jì)算能力。
以昆侖芯AI加速卡R200為例,與業(yè)界主流150W GPU相比,它的通用矩陣乘法性能加速為后者的1.7倍;視覺(jué)的目標(biāo)檢測(cè)算法YOLO性能加速為1.3倍;自然語(yǔ)言處理約典型算法Bert性能加速為1.4倍;視覺(jué)的圖像分類模型ResNet50性能加速為1.2倍。
張釗詳細(xì)來(lái)介紹了新一代架構(gòu)XPU-R,如下圖。SDNN,軟件定位神經(jīng)網(wǎng)絡(luò)引擎,自研核心張量計(jì)算單元,加速卷積和矩陣乘等計(jì)算;CLUSTER,負(fù)責(zé)除了卷積和矩陣乘法之外的通用計(jì)算部分;GDDR6,高速內(nèi)存,提供高達(dá)512GB/s的存儲(chǔ)帶寬,具有較高能效比和性價(jià)比,是國(guó)內(nèi)業(yè)界率先支持GDDR6的廠商之一;SHARED MEMORY,片上共享內(nèi)存,保證所有計(jì)算單元高并發(fā),低延時(shí)訪問(wèn);片間互聯(lián),提供高達(dá)200GB/s芯片間互聯(lián)帶寬,有效提升大規(guī)模分布式訓(xùn)練中數(shù)據(jù)傳輸效率,減少通信延時(shí);PCIe 4.0*16,支持PCIe第四代接口,雙向帶寬可達(dá)64GB/s,同時(shí)兼容PCIe 3.0接口規(guī)范,可靈活搭配業(yè)界已上市AI服務(wù)器。
昆侖芯原生支持開(kāi)源深度學(xué)習(xí)框架飛槳(PaddlePaddle)、百度機(jī)器學(xué)習(xí)平臺(tái)BML及各種類的AI能力引擎;已經(jīng)適配90%以上主流模型,推理高效支持飛槳、TensorFlow/Pytorch等框架,訓(xùn)練與飛槳社區(qū)進(jìn)行協(xié)同生態(tài)建設(shè),已經(jīng)開(kāi)源;昆侖芯+飛槳是百度人工智能生態(tài)端到端軟硬件一體解決方案的獨(dú)特產(chǎn)品組合,已與多款國(guó)產(chǎn)操作系統(tǒng)、國(guó)產(chǎn)通用處理器完成端到端的系統(tǒng)適配,實(shí)現(xiàn)國(guó)產(chǎn)AI計(jì)算生態(tài)解決方案。
如今昆侖芯已經(jīng)在互聯(lián)網(wǎng)、智慧城市、智慧工業(yè)、生物計(jì)算、智慧金融、智慧政務(wù)、智算中心以及智慧交通等各行業(yè)AI應(yīng)用場(chǎng)景中落地。
-
處理器
+關(guān)注
關(guān)注
68文章
19286瀏覽量
229853 -
AI芯片
+關(guān)注
關(guān)注
17文章
1887瀏覽量
35027 -
AI算法
+關(guān)注
關(guān)注
0文章
251瀏覽量
12261
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論