有網(wǎng)友問(wèn)昇騰910和含光800性能對(duì)比;華為推出的昇騰910性能強(qiáng)大,而含光800則是阿里巴巴發(fā)布的含光800AI芯片。
2019年9月25日,阿里巴巴發(fā)布含光800AI芯片;含光800是高性能的AI推理芯片。該芯片推理性能達(dá)到78563 IPS,能效比500 IPS/W。
含光800AI芯片基于RISC-V和阿里自有算法,含光800芯片性能的突破得益于軟硬件的協(xié)同創(chuàng)新:硬件層面采用自研芯片架構(gòu),通過(guò)推理加速等技術(shù)有效解決芯片性能瓶頸問(wèn)題;軟件層面集成了達(dá)摩院先進(jìn)算法,針對(duì)CNN及視覺(jué)類算法深度優(yōu)化計(jì)算、存儲(chǔ)密度,可實(shí)現(xiàn)大網(wǎng)絡(luò)模型在一顆NPU上完成計(jì)算。
含光800AI芯片相比傳統(tǒng)GPU算力,性價(jià)比提升100%。根據(jù)云棲大會(huì)的現(xiàn)場(chǎng)演示結(jié)果顯示,比如拍立淘商品庫(kù)每天新增10億商品圖片,使用傳統(tǒng)GPU算力識(shí)別需要1小時(shí),使用含光800后可縮減至5分鐘。
據(jù)阿里介紹含光NPU采用TSMC 12nm工藝制程,可提供全球最高單芯片AI推理性能。 在HGAI模型的推理應(yīng)用中,含光NPU每秒鐘可處理高達(dá)78000 IPS的圖片,是同類處理器的數(shù)十倍性能。
目前含光800目前已被應(yīng)用到阿里巴巴旗下的的多個(gè)業(yè)務(wù)場(chǎng)景,比如圖像視頻分析、城市大腦、搜索優(yōu)化等等。
2019年8月23日,華為發(fā)布AI芯片Ascend 910(昇騰910)。
據(jù)華為官方介紹,昇騰910AI處理器,基于自研華為達(dá)芬奇架構(gòu)3D Cube技術(shù),實(shí)現(xiàn)業(yè)界最佳AI性能與能效,架構(gòu)靈活伸縮,支持云邊端全棧全場(chǎng)景應(yīng)用。
除了基于達(dá)芬奇架構(gòu)的AI核外,昇騰910還集成了多個(gè)CPU、DVPP和任務(wù)調(diào)度器(Task Scheduler),因而具有自我管理能力,可以充分發(fā)揮其高算力的優(yōu)勢(shì)。
昇騰910集成了HCCS、PCIe 4.0和RoCE v2接口,為構(gòu)建橫向擴(kuò)展(Scale Out)和縱向擴(kuò)展(Scale Up)系統(tǒng)提供了靈活高效的方法。HCCS是華為自研的高速互聯(lián)接口,片內(nèi)RoCE可用于節(jié)點(diǎn)間直接互聯(lián)。最新的PCIe 4.0的吞吐量比上一代提升一倍。
昇騰910算力是國(guó)際頂尖AI芯片的2倍,相當(dāng)50個(gè)當(dāng)前最新最強(qiáng)的CPU;其訓(xùn)練速度,也比當(dāng)前最新最強(qiáng)的芯片提升了50%-100%。同時(shí)華為還發(fā)布了配套的新一代AI開(kāi)源計(jì)算框架MindSpore。兩者搭配性能最大化利用芯片算力。
新一代的AI開(kāi)源計(jì)算框架MindSpore創(chuàng)新編程范式,使得工程師更容易使用;該計(jì)算框架可滿足終端、邊緣計(jì)算、云全場(chǎng)景需求,能更好保護(hù)數(shù)據(jù)隱私;可開(kāi)源,形成廣闊應(yīng)用生態(tài)。
昇騰910半精度(FP16)算力達(dá)256 TFLOPS。(還有一個(gè)說(shuō)法是昇騰910的半精度(FP16)算力達(dá)到320 TFLOPS);而整數(shù)精度(INT8)算力達(dá)到 640 TOPS,(還有一個(gè)說(shuō)法是整數(shù)精度(INT8)算力達(dá)到512 Tera-OPS;小編認(rèn)為一個(gè)數(shù)值可能是設(shè)計(jì)參數(shù)值,一個(gè)可能是極值)功耗 310W,采用 7nm 先進(jìn)工藝。此外,昇騰 910 集成了 HCCS、PCIe 4.0 和 RoCE v2 接口,為構(gòu)建橫向擴(kuò)展 (Scale Out)和縱向擴(kuò)展(Scale Up)系統(tǒng)提供了靈活高效的方法。
比如華為的Atlas 900 AI訓(xùn)練集群,算力達(dá)到了256 PFLOPS。要實(shí)現(xiàn)這樣的算力,如果采用通用CPU需要6195個(gè)機(jī)柜,用GPU需要208個(gè)機(jī)柜,而NPU如昇騰只要128個(gè)機(jī)柜,這歸功于昇騰架構(gòu)對(duì)深度學(xué)習(xí)業(yè)務(wù)的優(yōu)化。而且最終,華為只用了16個(gè)機(jī)柜來(lái)實(shí)現(xiàn)。
此外,昇騰910為國(guó)產(chǎn)AI芯片助力,華為盤古大模型從算力(昇騰算力,昇騰的底層架構(gòu)也是華為自創(chuàng)的)、芯片使能、AI框架(MindSpore AI計(jì)算框架)到AI平臺(tái)(AI開(kāi)發(fā)生產(chǎn)線ModelArts)實(shí)現(xiàn)了全棧自主創(chuàng)新。
-
gpu
+關(guān)注
關(guān)注
28文章
4740瀏覽量
128953 -
NPU
+關(guān)注
關(guān)注
2文章
285瀏覽量
18614 -
AI芯片
+關(guān)注
關(guān)注
17文章
1887瀏覽量
35028 -
昇騰910
+關(guān)注
關(guān)注
0文章
14瀏覽量
6801 -
含光800
+關(guān)注
關(guān)注
0文章
3瀏覽量
1704
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論