燧原科技于7月7日在上海發(fā)布第二代人工智能訓(xùn)練產(chǎn)品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”訓(xùn)練加速卡和“云燧T21”訓(xùn)練OAM模組,全面升級的“馭算TopsRider”軟件平臺以及全新的“云燧集群”,成為國內(nèi)首家發(fā)布第二代人工智能訓(xùn)練產(chǎn)品組合的公司。
這是繼2019年12年發(fā)布第一代訓(xùn)練芯片,邃思1.0及云燧T10/T11,2020年12月發(fā)布第一代推理產(chǎn)品云燧i10之后,燧原科技的又一力作。
?
燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發(fā)布“云燧T20”訓(xùn)練加速卡和“邃思2.0”芯片
燧原產(chǎn)品的商業(yè)落地場景包括,液冷超大規(guī)模集群,加速視頻內(nèi)容生產(chǎn);強化學(xué)習(xí)使能游戲AI,改變數(shù)字娛樂的方式;強大的視覺能力,保駕護航金融安全;邊緣部署融合多數(shù)據(jù),構(gòu)建新型智能化交通;高效推理算力集群,建設(shè)園區(qū)AI視頻云。
隨著第二代產(chǎn)品的發(fā)布,將加速這些場景的商業(yè)化落地。
云燧智算集群
隨著自然語言處理、強化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、多模態(tài)和認(rèn)知模型等的發(fā)展,在知識圖譜、智慧大腦、游戲引擎、融合媒體和通用人工智能的應(yīng)用上,綠色一體化的超級智算集群是關(guān)鍵趨勢。
燧原發(fā)布CloudBlazer Matrix云燧智算集群,它代表世界最高水平,最高8192Enflame CloudBlazer訓(xùn)練卡和DTU芯片,最高1.3E(130000T)單精度智能算力集群。液冷/每一體化PUE降到1.15以下。最高160T單精度張量訓(xùn)練卡以及80%的線性度。
這是為智能計算和新基建算力而推出的集群化產(chǎn)品。CloudBlazer Matrix 2.0將包括邃思DTU2.0,云燧CloudBlazer T20/T21板卡,和馭算軟件Topsrider2.0。
打造中國最大的計算芯片,邃思DTU2.0性能強悍
邃思DTU2.0是中國最大的計算芯片,突破封裝的極限。DTU2.0采用2.5D高級封裝,整合9顆芯片,其中1顆DTU芯片、4顆三星HBM2E等構(gòu)成先進封裝。封裝尺寸為57.5mm*57.5mm。
?
DTU2.0的計算能力,單精度FP32達(dá)40FLOPS,支持單精度張量TF32,達(dá)160T FLOPS。TF32格式被認(rèn)為是在數(shù)據(jù)中心最先進的數(shù)據(jù)模式。
此外,DTU2.0植入完全可編程的數(shù)據(jù)流,軟件指令驅(qū)動的傳輸和數(shù)據(jù)計算,標(biāo)量、向量和張量的高效數(shù)據(jù)處理,和多地址廣播等。
存儲方面,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64GB內(nèi)存,帶寬達(dá)1.8TB/s,是中國第一個支持世界最先進存儲HBM2E和單芯片64 GB內(nèi)存的產(chǎn)品。
6個LARE卡間互聯(lián)端口,每一個端口雙向50GB/s,總集群互聯(lián)帶寬300GB/s。
云燧T21\T20訓(xùn)練產(chǎn)品,分別為OAM標(biāo)準(zhǔn)模組和全高全長PCIE板卡。
以Benchmark數(shù)據(jù)來看,云燧T20與友商次旗艦相比,在圖像識別/分類、NLP、目標(biāo)檢測、圖像分割、推薦等均有明顯優(yōu)勢。
馭算Topsrider2.0架構(gòu)
馭算TopsRider是燧原科技自主知識產(chǎn)權(quán)的計算及編程平臺,通過軟硬件協(xié)同架構(gòu)設(shè)計,充分發(fā)揮邃思2.0的性能;基于算子泛化技術(shù)及圖優(yōu)化策略,支持主流深度學(xué)習(xí)框架下的各類模型訓(xùn)練;利用Horovod分布式訓(xùn)練框架與GCU-LARE互聯(lián)技術(shù)相互配合,為超大規(guī)模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。
云端訓(xùn)練計算產(chǎn)品路線圖
訓(xùn)練產(chǎn)品方面,燧原計劃第三代T30/T31產(chǎn)品將于2023年發(fā)布,每瓦的能效將提升14倍。同時升級到Matrix3.0。
推理計算方面,2021年下半年將發(fā)布i20推理芯片,以及2023年將發(fā)布i30。其每瓦能效將分別提升4倍和16倍。
另外,在Topsrider2.x的基礎(chǔ)上,還將進一步升級至Topsrider3.x,致力于泛AI生態(tài)。
生態(tài)建設(shè)
AI生態(tài)也是跨行業(yè)的、復(fù)雜的生態(tài)競爭。燧原推出的異構(gòu)計算生態(tài)燎原計劃,將聚集生態(tài)的三大特征:原始創(chuàng)新、標(biāo)準(zhǔn)化和生態(tài)共建。
燎原計劃將建立繁榮開放的開發(fā)者生態(tài),健康互利的產(chǎn)業(yè)生態(tài),持續(xù)創(chuàng)新的科研生態(tài)。打造以人工智能為起點構(gòu)建通用異構(gòu)計算生態(tài),構(gòu)建標(biāo)準(zhǔn)化的技術(shù)體系,共建完整生態(tài)服務(wù)數(shù)字中國。將涵蓋深度學(xué)習(xí)計算,通用異構(gòu)計算以及視覺計算。
趙立東表示,未來行業(yè)的發(fā)展趨勢表明,以芯片為核心的算力,是工業(yè)4.0兵家必爭之地。工業(yè)4.0時代,人工智能是關(guān)鍵動力。摩爾定律放緩,異構(gòu)計算加速,基于小芯片、封裝技術(shù),人工智能落地將改變互聯(lián)網(wǎng)重塑傳統(tǒng)行業(yè)。算力需示爆炸,算力成為人工智能技術(shù)發(fā)展的基礎(chǔ)。燧原科技要建立世界水平的本土化研發(fā)和工程化團隊,開發(fā)國產(chǎn)自主創(chuàng)新的核心技術(shù),布局云端AI+高端芯片雙賽道。我們?yōu)閿?shù)據(jù)中心打造最優(yōu)的云端AI產(chǎn)品,形成訓(xùn)練推理完整的閉環(huán)解決方案。
本文由電子發(fā)燒友原創(chuàng),作者黃晶晶,微信號kittyhjj,轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com。
這是繼2019年12年發(fā)布第一代訓(xùn)練芯片,邃思1.0及云燧T10/T11,2020年12月發(fā)布第一代推理產(chǎn)品云燧i10之后,燧原科技的又一力作。
?
燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發(fā)布“云燧T20”訓(xùn)練加速卡和“邃思2.0”芯片
燧原產(chǎn)品的商業(yè)落地場景包括,液冷超大規(guī)模集群,加速視頻內(nèi)容生產(chǎn);強化學(xué)習(xí)使能游戲AI,改變數(shù)字娛樂的方式;強大的視覺能力,保駕護航金融安全;邊緣部署融合多數(shù)據(jù),構(gòu)建新型智能化交通;高效推理算力集群,建設(shè)園區(qū)AI視頻云。
隨著第二代產(chǎn)品的發(fā)布,將加速這些場景的商業(yè)化落地。
云燧智算集群
隨著自然語言處理、強化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、多模態(tài)和認(rèn)知模型等的發(fā)展,在知識圖譜、智慧大腦、游戲引擎、融合媒體和通用人工智能的應(yīng)用上,綠色一體化的超級智算集群是關(guān)鍵趨勢。
燧原發(fā)布CloudBlazer Matrix云燧智算集群,它代表世界最高水平,最高8192Enflame CloudBlazer訓(xùn)練卡和DTU芯片,最高1.3E(130000T)單精度智能算力集群。液冷/每一體化PUE降到1.15以下。最高160T單精度張量訓(xùn)練卡以及80%的線性度。
這是為智能計算和新基建算力而推出的集群化產(chǎn)品。CloudBlazer Matrix 2.0將包括邃思DTU2.0,云燧CloudBlazer T20/T21板卡,和馭算軟件Topsrider2.0。
打造中國最大的計算芯片,邃思DTU2.0性能強悍
邃思DTU2.0是中國最大的計算芯片,突破封裝的極限。DTU2.0采用2.5D高級封裝,整合9顆芯片,其中1顆DTU芯片、4顆三星HBM2E等構(gòu)成先進封裝。封裝尺寸為57.5mm*57.5mm。
?
燧原科技第二代通用人工智能訓(xùn)練芯片“邃思2.0”
DTU2.0的計算能力,單精度FP32達(dá)40FLOPS,支持單精度張量TF32,達(dá)160T FLOPS。TF32格式被認(rèn)為是在數(shù)據(jù)中心最先進的數(shù)據(jù)模式。
此外,DTU2.0植入完全可編程的數(shù)據(jù)流,軟件指令驅(qū)動的傳輸和數(shù)據(jù)計算,標(biāo)量、向量和張量的高效數(shù)據(jù)處理,和多地址廣播等。
存儲方面,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64GB內(nèi)存,帶寬達(dá)1.8TB/s,是中國第一個支持世界最先進存儲HBM2E和單芯片64 GB內(nèi)存的產(chǎn)品。
6個LARE卡間互聯(lián)端口,每一個端口雙向50GB/s,總集群互聯(lián)帶寬300GB/s。
云燧T21\T20訓(xùn)練產(chǎn)品,分別為OAM標(biāo)準(zhǔn)模組和全高全長PCIE板卡。
以Benchmark數(shù)據(jù)來看,云燧T20與友商次旗艦相比,在圖像識別/分類、NLP、目標(biāo)檢測、圖像分割、推薦等均有明顯優(yōu)勢。
馭算Topsrider2.0架構(gòu)
馭算TopsRider是燧原科技自主知識產(chǎn)權(quán)的計算及編程平臺,通過軟硬件協(xié)同架構(gòu)設(shè)計,充分發(fā)揮邃思2.0的性能;基于算子泛化技術(shù)及圖優(yōu)化策略,支持主流深度學(xué)習(xí)框架下的各類模型訓(xùn)練;利用Horovod分布式訓(xùn)練框架與GCU-LARE互聯(lián)技術(shù)相互配合,為超大規(guī)模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。
云端訓(xùn)練計算產(chǎn)品路線圖
訓(xùn)練產(chǎn)品方面,燧原計劃第三代T30/T31產(chǎn)品將于2023年發(fā)布,每瓦的能效將提升14倍。同時升級到Matrix3.0。
推理計算方面,2021年下半年將發(fā)布i20推理芯片,以及2023年將發(fā)布i30。其每瓦能效將分別提升4倍和16倍。
另外,在Topsrider2.x的基礎(chǔ)上,還將進一步升級至Topsrider3.x,致力于泛AI生態(tài)。
生態(tài)建設(shè)
AI生態(tài)也是跨行業(yè)的、復(fù)雜的生態(tài)競爭。燧原推出的異構(gòu)計算生態(tài)燎原計劃,將聚集生態(tài)的三大特征:原始創(chuàng)新、標(biāo)準(zhǔn)化和生態(tài)共建。
燎原計劃將建立繁榮開放的開發(fā)者生態(tài),健康互利的產(chǎn)業(yè)生態(tài),持續(xù)創(chuàng)新的科研生態(tài)。打造以人工智能為起點構(gòu)建通用異構(gòu)計算生態(tài),構(gòu)建標(biāo)準(zhǔn)化的技術(shù)體系,共建完整生態(tài)服務(wù)數(shù)字中國。將涵蓋深度學(xué)習(xí)計算,通用異構(gòu)計算以及視覺計算。
趙立東表示,未來行業(yè)的發(fā)展趨勢表明,以芯片為核心的算力,是工業(yè)4.0兵家必爭之地。工業(yè)4.0時代,人工智能是關(guān)鍵動力。摩爾定律放緩,異構(gòu)計算加速,基于小芯片、封裝技術(shù),人工智能落地將改變互聯(lián)網(wǎng)重塑傳統(tǒng)行業(yè)。算力需示爆炸,算力成為人工智能技術(shù)發(fā)展的基礎(chǔ)。燧原科技要建立世界水平的本土化研發(fā)和工程化團隊,開發(fā)國產(chǎn)自主創(chuàng)新的核心技術(shù),布局云端AI+高端芯片雙賽道。我們?yōu)閿?shù)據(jù)中心打造最優(yōu)的云端AI產(chǎn)品,形成訓(xùn)練推理完整的閉環(huán)解決方案。
本文由電子發(fā)燒友原創(chuàng),作者黃晶晶,微信號kittyhjj,轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
AI
+關(guān)注
關(guān)注
87文章
30887瀏覽量
269063 -
燧原科技
+關(guān)注
關(guān)注
0文章
122瀏覽量
8312
發(fā)布評論請先 登錄
相關(guān)推薦
《中國汽車芯片聯(lián)盟白名單》2.0版本發(fā)布,覆蓋300多家廠商的超1800款產(chǎn)品
電子發(fā)燒友網(wǎng)報道(文/吳子鵬)日前,為了及時向行業(yè)提供更加準(zhǔn)確有效的產(chǎn)品信息,更好地推動國產(chǎn)汽車芯片得到廣泛應(yīng)用,中國汽車芯片產(chǎn)業(yè)創(chuàng)新戰(zhàn)略聯(lián)盟在其官方微信公眾號正式發(fā)布了《
清華光芯片取得新突破,邁向AI光訓(xùn)練
電子發(fā)燒友網(wǎng)報道(文/吳子鵬)近日,清華大學(xué)發(fā)布官方消息稱,清華大學(xué)電子工程系方璐教授課題組、自動化系戴瓊海院士課題組另辟蹊徑,首創(chuàng)了全前向智能光計算訓(xùn)練架構(gòu),研制了“太極-II”光訓(xùn)練
燧原科技亮相2024中國人工智能大會
近日,燧原科技創(chuàng)新研究院首席研究員石恒博士受邀在2024中國人工智能大會的“AI芯片與智能計算創(chuàng)新生態(tài)”專題論壇上,發(fā)表了《面向
亞馬遜轉(zhuǎn)向Trainium芯片,全力投入AI模型訓(xùn)練
,亞馬遜AWS推出了兩款芯片:Inferentia和Trainium。其中,Inferentia主要用于AI推理,而Trainium則專注于AI模型的訓(xùn)練。 然而,隨著生成式
2024深圳 | 中國AI芯片開發(fā)者論壇
“2024中國AI芯片開發(fā)者論壇”將于12月5-6日在深圳舉辦。本次論壇由車乾信息&熱設(shè)計網(wǎng)主辦,深圳工業(yè)展協(xié)辦,本次論壇重點探討:高算力AI芯片
Untether發(fā)布人工智能(AI)芯片
初創(chuàng)企業(yè)Untether發(fā)布了一款專為汽車、農(nóng)業(yè)裝備及極端環(huán)境AI應(yīng)用設(shè)計的人工智能(AI)芯片。
相較于英偉達(dá)和AMD的旗艦AI
AI算力芯片供電電源測試?yán)?費思低壓大電流系列電子負(fù)載
AI算力芯片作為驅(qū)動復(fù)雜計算任務(wù)的核心引擎,其性能與穩(wěn)定性成為了決定應(yīng)用成敗的關(guān)鍵因素。而在這背后,供電電源的穩(wěn)定性和高效性則是保障AI算力芯片
燧原科技啟動IPO輔導(dǎo),加速AI算力底座布局
近日,中國證監(jiān)會正式披露了上海燧原科技股份有限公司(簡稱:燧原科技)的IPO輔導(dǎo)備案報告,標(biāo)志著這家AI芯片領(lǐng)域的獨角獸企業(yè)正式踏上了上市征
AI芯片的混合精度計算與靈活可擴展
、NPU、DSP等。 ? 而無論是哪種架構(gòu),如何判斷其性能優(yōu)劣都至關(guān)重要,而這就涉及到AI芯片的各項性能指標(biāo),如算力、能效、時延等。其中AI芯片的算力精度是衡量其處理數(shù)據(jù)能力的重要指標(biāo)
中國Wi-Fi7 FEM F4誕生
。在2024年年初,三伍微推出了Wi-Fi7 FEM,性能不輸國際廠商。腳步不能停留,Wi-Fi8已經(jīng)在路上。有未來的路,是幸福的路。
至此,中國Wi-Fi7 FEM的F4正式誕生,可以量產(chǎn)供應(yīng)
發(fā)表于 07-31 11:14
蘋果承認(rèn)使用谷歌芯片來訓(xùn)練AI
蘋果公司最近在一篇技術(shù)論文中披露,其先進的人工智能系統(tǒng)Apple Intelligence背后的兩個關(guān)鍵AI模型,是在谷歌設(shè)計的云端芯片上完成預(yù)訓(xùn)練的。這一消息標(biāo)志著在尖端AI
AI初出企業(yè)Cerebras已申請IPO!稱發(fā)布的AI芯片比GPU更適合大模型訓(xùn)練
美國加州,專注于研發(fā)比GPU更適用于訓(xùn)練AI模型的晶圓級芯片,為復(fù)雜的AI應(yīng)用構(gòu)建計算機系統(tǒng),并與阿布扎比科技集團G42等機構(gòu)合作構(gòu)建超級
risc-v多核芯片在AI方面的應(yīng)用
得RISC-V多核芯片能夠更好地適應(yīng)AI算法的不同需求,包括深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等,從而提高芯片的性能和效率,降低成本,使AI邊緣計算晶片更具
發(fā)表于 04-28 09:20
聯(lián)想向燧弘華創(chuàng)交付首臺搭載國產(chǎn)AI算力芯片的問天WA5480 G3服務(wù)器
3月19日,在聯(lián)想集團(全球)最大的智能計算設(shè)備研發(fā)和制造基地——聯(lián)寶科技,聯(lián)想集團向燧弘華創(chuàng)交付聯(lián)想首臺可搭載國產(chǎn)AI算力芯片的聯(lián)想問天W
評論