0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新一代數(shù)據(jù)中心加速卡Alveo U55C,最大功耗低至150W

荷葉塘 ? 來(lái)源:電子發(fā)燒友 ? 作者:程文智 ? 2021-12-06 09:37 ? 次閱讀

(文/程文智)近年來(lái),在數(shù)字化浪潮的推動(dòng)下,傳感器及其產(chǎn)生的數(shù)據(jù)量呈現(xiàn)出了爆炸式的增長(zhǎng),對(duì)數(shù)據(jù)處理基礎(chǔ)架構(gòu)的需求也隨之增長(zhǎng)。根據(jù)國(guó)際超級(jí)計(jì)算大會(huì)(ISC)的統(tǒng)計(jì),在HPC領(lǐng)域,超算系統(tǒng)架構(gòu)正變得越來(lái)越多元化,在近幾年的TOP500超算榜單中,使用GPUFPGA等加速卡的異構(gòu)計(jì)算系統(tǒng)占比呈上升趨勢(shì)。


圖:Alveo U55C數(shù)據(jù)中心加速器卡


近日,賽靈思(Xilinx)在SC21全球超級(jí)計(jì)算大會(huì)上推出了新的Alveo U55C數(shù)據(jù)中心加速器卡,以及一款基于標(biāo)準(zhǔn)、API-driven 的集群解決方案,用于大規(guī)模部署 FPGA。據(jù)賽靈思數(shù)據(jù)中心事業(yè)部高性能計(jì)算( HPC )產(chǎn)品經(jīng)理Nathan Chang介紹,Alveo U55C加速器卡結(jié)合了非常多當(dāng)今HPC和大數(shù)據(jù)工作負(fù)載需要的關(guān)鍵功能。該加速器卡能夠提供Alveo 加速器產(chǎn)品系列中的最高計(jì)算密度和 HBM2容量。結(jié)合賽靈思基于 RoCE v2 的全新集群解決方案,可令運(yùn)行大規(guī)模計(jì)算工作負(fù)載的各類客戶大獲裨益,支持其利用現(xiàn)有數(shù)據(jù)中心基礎(chǔ)架構(gòu)和網(wǎng)絡(luò),實(shí)現(xiàn)強(qiáng)大的基于 FPGA 的 HPC 集群。


圖:賽靈思數(shù)據(jù)中心事業(yè)部高性能計(jì)算( HPC )產(chǎn)品經(jīng)理Nathan Chang

Alveo U55C最重要的特性

Alveo U55C卡融合了當(dāng)前 HPC工作負(fù)載所需的眾多關(guān)鍵特性。它能提供更高的數(shù)據(jù)流水線并行度、卓越的存儲(chǔ)器管理、優(yōu)化的整個(gè)流水線的數(shù)據(jù)遷移,以及Alveo產(chǎn)品系列中最高的單位功耗性能。

Alveo U55C與其前一代產(chǎn)品Alveo U280相比,有了很多升級(jí)。從外觀上來(lái)看,Alveo U55C采用了單插槽、全高半長(zhǎng)( FHHL )外形尺寸;從算力上來(lái)看,雖然Alveo U55C提供的算力沒(méi)變,但體積更小了,計(jì)算密度得到了很大的提升;從功耗上來(lái)看,Alveo U55C的最大功耗為150W,而Alveo U280的功耗為225W。而且,Alveo U55C還將HBM2的容量翻倍至16GB。

Nathan Chang解釋說(shuō),功耗降低的原因是Alveo U55C去掉了DDR,在存儲(chǔ)器卡方面讓HBM2增加了一倍,這就相當(dāng)于讓高帶寬的數(shù)量增加了4倍,由于去掉了DDR,所以Alveo U55C整個(gè)TDP功耗也下降了。


圖:Alveo U55C與其前一代產(chǎn)品Alveo U280的參數(shù)對(duì)比



在Nathan Chang看來(lái),Alveo U55C有三個(gè)非常重要的特性:一是采用了RoCE v2、DCBx,還有MPI,在現(xiàn)有網(wǎng)絡(luò)和基礎(chǔ)架構(gòu)上,為現(xiàn)在的數(shù)據(jù)中心提供了最尖端的計(jì)算集群。第二,現(xiàn)有的應(yīng)用開(kāi)發(fā)人員可以利用Vitis平臺(tái)上的一些已有的API、庫(kù)以及MPI,來(lái)擴(kuò)展他們的工作負(fù)載。第三就是高性能。

據(jù)他介紹,通過(guò)RoCE v2和 DCBx技術(shù),再結(jié)合200 Gbps帶寬,Alveo U55C構(gòu)建的集群解決方案使Alveo網(wǎng)絡(luò)可在性能和時(shí)延方面媲美 InfiniBand 網(wǎng)絡(luò),且無(wú)需對(duì)廠商加鎖。MPI (信息傳遞接口)集成功能使 HPC 開(kāi)發(fā)人員能以賽靈思 Vitis統(tǒng)一軟件平臺(tái)擴(kuò)展Alveo數(shù)據(jù)流水線。利用現(xiàn)有開(kāi)放標(biāo)準(zhǔn)和框架,現(xiàn)在能跨數(shù)百?gòu)?Alveo 卡上進(jìn)行性能擴(kuò)展,無(wú)需考慮服務(wù)器平臺(tái)和網(wǎng)絡(luò)基礎(chǔ)架構(gòu),同時(shí)還能共享工作負(fù)載和存儲(chǔ)器。


借助面向應(yīng)用和集群的高層次編程,軟件開(kāi)發(fā)者和數(shù)據(jù)科學(xué)家能夠運(yùn)用 Vitis 平臺(tái),解鎖 Alveo 和自適應(yīng)計(jì)算的優(yōu)勢(shì)。賽靈思大力投入于 Vitis 開(kāi)發(fā)平臺(tái)和工具流程,旨在令不具備硬件專業(yè)知識(shí)的軟件開(kāi)發(fā)者和數(shù)據(jù)科學(xué)家,也能更容易地使用自適應(yīng)計(jì)算。Vitis 平臺(tái)支持 Pytorch 和 Tensorflow 等主流 AI 框架,還支持 C、C++Python 等高層次編程語(yǔ)言,使開(kāi)發(fā)者能利用特定 API 和庫(kù)來(lái)構(gòu)建領(lǐng)域解決方案,或者使用賽靈思軟件開(kāi)發(fā)套件,從而在現(xiàn)有數(shù)據(jù)中心內(nèi)輕松加速關(guān)鍵 HPC 工作負(fù)載。

應(yīng)用案例

談到Alveo U55C的應(yīng)用,Nathan Chang列舉了幾個(gè)常用的應(yīng)用場(chǎng)景,比如幾乎每一家汽車廠商都會(huì)用到的碰撞仿真軟件LS-DYNA。汽車廠商主要是用它賴進(jìn)行汽車的撞擊測(cè)試,以便查看仿真效果,確保汽車在設(shè)計(jì)方面的安全性和結(jié)構(gòu)方面的完整性。而安全性和結(jié)構(gòu)系統(tǒng)的設(shè)計(jì)往往取決于模型性能,因其能以計(jì)算機(jī)輔助設(shè)計(jì)有限元方法( FEM )仿真來(lái)降低物理碰撞測(cè)試的成本。FEM求解器是驅(qū)動(dòng)具備數(shù)億個(gè)自由度仿真的主要算法,而這些龐大的算法可以細(xì)分為更基本的求解器,如 PCG、稀疏矩陣、ICCG。與 x86 CPU 相比,利用超并行數(shù)據(jù)流水線在大量 Alveo 卡上進(jìn)行性能擴(kuò)展,LS-DYNA 能夠?qū)崿F(xiàn)超過(guò) 5 倍的性能加速。這能在一個(gè) Alveo 流水線中提高單位時(shí)鐘周期的工作效率,令 LS-DYNA 客戶受益于突破性的仿真時(shí)間。


另外,他還介紹了一個(gè)圖分析的案例,“在加入賽靈思之前,我是一個(gè)創(chuàng)業(yè)者,當(dāng)時(shí)我處于油氣行業(yè),主要做的工作是做地殼震動(dòng)圖解決的AI和機(jī)器學(xué)習(xí)。我們知道,數(shù)據(jù)工程師、科學(xué)家、分析師在處理此類課題的時(shí)候,都會(huì)尋找數(shù)據(jù)的一些相關(guān)性。在尋找的過(guò)程中,我們發(fā)現(xiàn)了一個(gè)巨大的痛點(diǎn),那就是數(shù)據(jù)的孤島越來(lái)越多,如果想要把這些不同孤島上的數(shù)據(jù)聯(lián)系起來(lái),真的非常困難。”他感嘆。


不過(guò),Nathan Chang表示,圖庫(kù)數(shù)據(jù)是科學(xué)家認(rèn)為非常具有顛覆性的一個(gè)平臺(tái),它能夠?qū)?shù)據(jù)從孤島中提取出來(lái),讓偶讓數(shù)據(jù)科學(xué)家可以專注于數(shù)據(jù)之間的關(guān)系,而不是看單張圖。賽靈思的合作伙伴,TigerGraph 是一家圖分析平臺(tái)提供商,他們正使用多張 Alveo U55C 卡為兩種最高效算法進(jìn)行集群與加速,以驅(qū)動(dòng)基于圖的推薦和集群引擎。圖從信息孤島中采集數(shù)據(jù)并重點(diǎn)關(guān)注數(shù)據(jù)間的關(guān)系。圖領(lǐng)域的下一個(gè)前沿是實(shí)時(shí)查找答案。Alveo U55C 將推薦引擎的查詢和預(yù)測(cè)時(shí)間從數(shù)分鐘縮短至數(shù)毫秒。與基于 CPU 的集群相比,使用多張 U55C 卡擴(kuò)展分析所提供的出色計(jì)算能力和存儲(chǔ)器帶寬,可將圖查詢速度提升高達(dá) 45 倍。質(zhì)量評(píng)分也提升高達(dá) 35%,從而顯著提升置信度,將誤報(bào)幾率降至低個(gè)位數(shù)

另外,他還列舉了Alveo U55C在信號(hào)處理、醫(yī)療和金融方面的應(yīng)用。

總結(jié)

隨著高性能計(jì)算邁向百億億級(jí)大關(guān),功耗將成為下一個(gè)難關(guān)。而典型的高性能計(jì)算架構(gòu),即CPU和GPU的架構(gòu),難以提供可接收的單位功耗性能,因此,現(xiàn)在越來(lái)越多的高性能計(jì)算集群開(kāi)始采用一機(jī)構(gòu)計(jì)算架構(gòu),預(yù)計(jì)未來(lái)將會(huì)有更多的算力會(huì)部署在專門(mén)的加速器上,而不是通用CPU上。對(duì)于整個(gè)HPC服務(wù)器集群的降功耗目標(biāo)來(lái)說(shuō),使用加速器卡的效果更好,功耗更低。未來(lái)加速器卡的市場(chǎng)前景將會(huì)更加廣闊。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1630

    文章

    21782

    瀏覽量

    604980
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1298

    瀏覽量

    56831
  • 異構(gòu)計(jì)算
    +關(guān)注

    關(guān)注

    2

    文章

    102

    瀏覽量

    16321
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AMD Alveo媒體加速產(chǎn)品組合SDK 1.2.1發(fā)布

    我們很高興地宣布AMD Alveo 媒體加速產(chǎn)品組合( AMA )SDK 1.2.1 版本發(fā)布,從而進(jìn)步擴(kuò)展 AMD Alveo MA35D 媒體
    的頭像 發(fā)表于 12-18 16:01 ?312次閱讀

    PCIe加速卡在數(shù)據(jù)中心的應(yīng)用

    隨著數(shù)據(jù)中心的快速發(fā)展,對(duì)計(jì)算能力的需求也在不斷增長(zhǎng)。PCIe(Peripheral Component Interconnect Express)加速卡作為種高性能的計(jì)算設(shè)備,已經(jīng)在數(shù)據(jù)中
    的頭像 發(fā)表于 11-06 09:32 ?688次閱讀

    AMD 以全球極快的纖薄尺寸電子交易加速卡擴(kuò)展 Alveo 產(chǎn)品組合,助力廣泛且具性價(jià)比的服務(wù)器部署

    商和金融機(jī)構(gòu)提供了款針對(duì)機(jī)架空間和成本進(jìn)行優(yōu)化的纖薄型加速卡,旨在快速部署到各種服務(wù)器中。 Alveo UL3422 加速卡
    發(fā)表于 10-16 14:35 ?131次閱讀
    AMD 以全球極快的纖薄尺寸電子交易<b class='flag-5'>加速卡</b>擴(kuò)展 <b class='flag-5'>Alveo</b> 產(chǎn)品組合,助力廣泛且具性價(jià)比的服務(wù)器部署

    AMD 以全球極快的纖薄尺寸電子交易加速卡擴(kuò)展 Alveo 產(chǎn)品組合,助力廣泛且具性價(jià)比的服務(wù)器部署

    商和金融機(jī)構(gòu)提供了款針對(duì)機(jī)架空間和成本進(jìn)行優(yōu)化的纖薄型加速卡,旨在快速部署到各種服務(wù)器中。 Alveo UL3422 加速卡
    發(fā)表于 10-16 14:16 ?175次閱讀

    AMD推出新款纖薄尺寸電子交易加速卡

    AMD(超威,納斯達(dá)克股票代碼:AMD)今日宣布推出 AMD Alveo UL3422 加速卡 ,這是其創(chuàng)紀(jì)錄的加速卡系列1的最新成員,專為超低時(shí)延電子交易應(yīng)用而設(shè)計(jì)。AMD Alveo
    的頭像 發(fā)表于 10-16 09:14 ?486次閱讀

    請(qǐng)問(wèn)OPA1632的最大功耗是看最大輸出電流嗎?

    OPA1632的最大功耗是看最大輸出電流嗎
    發(fā)表于 10-16 07:13

    EPSON差分晶振SG3225VEN頻點(diǎn)312.5mhz應(yīng)用于AI加速卡

    AI加速卡,通常也被稱為AI算力,是種專為加速人工智能(AI)應(yīng)用和算法而設(shè)計(jì)的硬件設(shè)備。AI加速卡在數(shù)據(jù)中心、云計(jì)算、邊緣計(jì)算和高性能
    發(fā)表于 09-10 14:56 ?0次下載

    東盟能源和華為主編的《東盟下一代數(shù)據(jù)中心建設(shè)白皮書(shū)》正式發(fā)布

    2024年5月17日,在2024全球數(shù)據(jù)中心產(chǎn)業(yè)論壇上,由東盟能源中心(ASEAN Center for Energy)和華為主編的《東盟下一代數(shù)據(jù)中心建設(shè)白皮書(shū)》(以下簡(jiǎn)稱《白皮書(shū)》)重磅發(fā)布,旨在推動(dòng)?xùn)|盟
    的頭像 發(fā)表于 05-19 14:19 ?878次閱讀
    東盟能源和華為主編的《東盟下<b class='flag-5'>一代數(shù)據(jù)中心</b>建設(shè)白皮書(shū)》正式發(fā)布

    借助全新 AMD Alveo? V80 計(jì)算加速卡釋放計(jì)算能力

    靈活應(yīng)變能力以實(shí)現(xiàn)工作負(fù)載優(yōu)化。Alveo V80 加速卡現(xiàn)已量產(chǎn)出貨,其能提供較之上一代加速卡至高 2 倍的帶寬與計(jì)算密度1,并為使用 AMD Vivado? 設(shè)計(jì)套件的 FPGA
    發(fā)表于 05-16 14:09 ?244次閱讀
    借助全新 AMD <b class='flag-5'>Alveo</b>? V80 計(jì)算<b class='flag-5'>加速卡</b>釋放計(jì)算能力

    AMD Alveo V80計(jì)算加速卡實(shí)現(xiàn)量產(chǎn)

    AMD公司近日迎來(lái)了個(gè)重要的里程碑,其專為大型數(shù)據(jù)集和內(nèi)存受限型應(yīng)用設(shè)計(jì)的Alveo V80計(jì)算加速卡,已正式進(jìn)入量產(chǎn)出貨階段。這款創(chuàng)新產(chǎn)品針對(duì)高性能計(jì)算(HPC)、
    的頭像 發(fā)表于 05-16 11:40 ?646次閱讀

    儲(chǔ)能逆變器最大功率有多大??jī)?chǔ)能逆變器最大可以逆變多少w

    和應(yīng)用需求等。本文將詳細(xì)介紹儲(chǔ)能逆變器的最大功率、逆變能力以及影響因素。 儲(chǔ)能逆變器的最大功率 儲(chǔ)能逆變器的最大功率可以從幾百瓦(W)到幾兆瓦(MW)不等。市場(chǎng)上常見(jiàn)的儲(chǔ)能逆變器功率范
    的頭像 發(fā)表于 04-29 14:37 ?2521次閱讀

    1A、3V17V、–55°C+150°CIQ 降壓轉(zhuǎn)換器TPS629210E數(shù)據(jù)

    電子發(fā)燒友網(wǎng)站提供《1A、3V17V、–55°C+150°C
    發(fā)表于 03-29 09:15 ?0次下載
    1A、3V<b class='flag-5'>至</b>17V、–<b class='flag-5'>55</b>°<b class='flag-5'>C</b><b class='flag-5'>至</b>+<b class='flag-5'>150</b>°<b class='flag-5'>C</b><b class='flag-5'>低</b>IQ 降壓轉(zhuǎn)換器TPS629210E<b class='flag-5'>數(shù)據(jù)</b>表

    英偉達(dá)發(fā)布最強(qiáng)AI加速卡Blackwell GB200

    英偉達(dá)在最近的GTC開(kāi)發(fā)者大會(huì)上發(fā)布了其最新、最強(qiáng)大的AI加速卡——GB200。這款加速卡采用了新一代AI圖形處理器架構(gòu)Blackwell,標(biāo)志著英偉達(dá)在AI圖形處理領(lǐng)域邁入了個(gè)新的
    的頭像 發(fā)表于 03-20 11:38 ?1202次閱讀

    1A、3V 17V、–55°C +150°C IQ 降壓轉(zhuǎn)換器TPS629210E數(shù)據(jù)

    電子發(fā)燒友網(wǎng)站提供《1A、3V 17V、–55°C +150°C
    發(fā)表于 03-08 13:45 ?0次下載
    1A、3V <b class='flag-5'>至</b> 17V、–<b class='flag-5'>55</b>°<b class='flag-5'>C</b> <b class='flag-5'>至</b> +<b class='flag-5'>150</b>°<b class='flag-5'>C</b> <b class='flag-5'>低</b> IQ 降壓轉(zhuǎn)換器TPS629210E<b class='flag-5'>數(shù)據(jù)</b>表

    Arm縮短數(shù)據(jù)中心處理器研發(fā)周期年內(nèi)

    事實(shí)證明,ARM的數(shù)據(jù)中心處理器技術(shù)受到了亞馬遜、微軟以及為Oracle供貨的安培計(jì)算的青睞。同時(shí),ARM也宣布了新一代數(shù)據(jù)中心芯片“核心”的設(shè)計(jì)方案。
    的頭像 發(fā)表于 02-22 09:20 ?606次閱讀