0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

今天發(fā)布!詳解賽靈思加速卡Alveo U50的輕與重

堅白 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:陸楠,電子發(fā)燒友 ? 2019-08-07 09:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

目前,數(shù)據(jù)中心在異構(gòu)計算和算法標(biāo)準(zhǔn)上不斷變化,越來越多的應(yīng)用領(lǐng)域需要專用的架構(gòu),使得硬件能夠和算法去進行匹配以達到最佳運行效果或者是提高它的運行速度。網(wǎng)絡(luò)上有很多不同的數(shù)據(jù),這些數(shù)據(jù)在運行過程當(dāng)中有不同的要求,而且網(wǎng)絡(luò)自身也在不斷迭代,計算、網(wǎng)絡(luò)和存儲對加速的要求都在水漲船高。對于硬件而言,理想的方式是能在不改變硬件的情況下,加速任何工作負(fù)載,并能降低總體擁有成本。
針對這一需求趨勢,去年10月份的時候,賽靈思推出了Alveo系列加速卡。賽靈思數(shù)據(jù)中心業(yè)務(wù)部產(chǎn)品規(guī)劃和市場營銷總監(jiān)Jamon Bowen將這一系列產(chǎn)品的規(guī)劃目的總結(jié)為三個:快速、靈活應(yīng)變和方便易用。即高吞吐量同時具有超低時延,能夠為多種工作負(fù)載進行加速,并且可以運用于云和本地各種場景。Alveo系列包括U200、U250和U280,區(qū)別主要是FPGA中的LUT規(guī)模和總線資源。今天,該公司宣布推出了Alveo系列最新的一款加速卡Alveo U50。

輕——輕量級加速

和該系列之前的產(chǎn)品不同,Alveo U50是業(yè)界首款輕量級PCIe Gen4自適應(yīng)計算加速卡,并且面向所有服務(wù)器、各種云和邊緣的數(shù)據(jù)中心應(yīng)用,包括網(wǎng)絡(luò)和存儲加速?!斑@是之前的產(chǎn)品做不到的?!盉owen說。
圖:從賽靈思提供的資料看,U50似乎是U280的迷你版。
Alveo U50支持PCIe Gen4這一最新的服務(wù)器總線和CCIX互聯(lián)標(biāo)準(zhǔn),不同于GPU加速器的尺寸,U50要小的多,“GPU加速器的尺寸適合電腦,但不適用于網(wǎng)絡(luò)和存儲,”Bowen說,“采用賽靈思UltraScale+架構(gòu)以及集成超高帶寬的HBM2存儲器技術(shù)大大減少了U50的尺寸。”
采用HBM2這種片上存儲不僅僅是出于體積的考慮,還在于這能提升性能——HBM性能是DDR的10倍。U50內(nèi)置8GB HBM2,可實現(xiàn)超過400Gbps的數(shù)據(jù)傳輸速度。PCIe Gen4也是目前最快的總線技術(shù),這些都是存儲加速的要素。在網(wǎng)絡(luò)端口方面,U50的QSFP28端口可以實現(xiàn)100Gbps的網(wǎng)絡(luò)連接,并支持多種前沿應(yīng)用,如VMe-oF(NVM Express over Fabrics)、解耦計算存儲和專業(yè)金融服務(wù)應(yīng)用。滿足所有這些性能只需要不到75W的功耗,這可以讓很多應(yīng)用不再為功耗預(yù)算而擔(dān)心。
在一組針對語音翻譯(深度學(xué)習(xí)推斷加速)、數(shù)據(jù)庫分析(數(shù)據(jù)分析加速)、數(shù)據(jù)壓縮(計算存儲加速)、電子交易(網(wǎng)絡(luò)加速)和金融建模(網(wǎng)格計算)的加速測試中,與GPU和CPU加速相比,U50的表現(xiàn)優(yōu)異。其中,語音翻譯的時延降低25倍,吞吐量擴大10倍,在翻譯性能方面,和英偉達T4 相比,U50 性能提升高達10倍;在運行TPC-H Query基準(zhǔn)測試(數(shù)據(jù)庫分析)時,相比CPU,U50每小時吞吐量提升4倍,運營成本降低3倍;在數(shù)據(jù)壓縮上,U50將壓縮/解壓縮吞吐量提高了20倍,實現(xiàn)了更快的Hadoop和大數(shù)據(jù)分析,同時相比僅CPU節(jié)點將每節(jié)點成本降低了40%;在電子交易中,U50相比僅CPU的10us延時,能將時延降低20%,交易時間不到500ns;在金融建模時,運行蒙特卡洛模擬,U50的功效相比GPU提升了7倍。
圖:U50在吞吐量,延遲和功效方面實現(xiàn)了10-20倍的改善
總的來說,U50在吞吐量,延遲和功效方面實現(xiàn)了10-20倍的改善。“我們的戰(zhàn)略是致力于讓賽靈思靈活應(yīng)變的加速技術(shù)應(yīng)用于數(shù)據(jù)中心的所有領(lǐng)域,具體來說就是計算、網(wǎng)絡(luò)和存儲,”Bowen說,“所有的計算工作負(fù)載都是這三個領(lǐng)域的一部分,這也是我們看到Alveo可以大展宏圖的地方?!?/div>

重——兩個重要堆棧

計算、網(wǎng)絡(luò)和存儲為什么需要加速?因為諸如AlexNet、GoogleNet、DenseNet這些網(wǎng)絡(luò)結(jié)構(gòu)都需要不同的硬件架構(gòu)來實現(xiàn)高吞吐量、低時延和高效率。對于應(yīng)用而言,加速可以靈活適應(yīng)不同的需求。而數(shù)據(jù)中心要優(yōu)化性能,需要定制數(shù)據(jù)路徑、定制精度和定制存儲器層級,沒有比可編程的硬件更適合來進行定制化的加速了。不過,對于數(shù)據(jù)中心開發(fā)者而言,F(xiàn)PGA編程是個令人頭痛的事情。
“我們從數(shù)據(jù)中心的客戶那里聽到的一個最大的抱怨就是FPGA的編程非常困難,”Bowen說,“Alveo提供開放的平臺和開發(fā)環(huán)境,讓開發(fā)者能夠更加便捷地使用,隨著越來越多的開發(fā)者到這個平臺上來開發(fā),會有更多的云和相關(guān)產(chǎn)品加入,并且能夠?qū)崿F(xiàn)原來只有在軟件部分才有可能實現(xiàn)的硬件IP的靈活應(yīng)變能力。”
對于賽靈思而言,這個開放平臺正在形成一個解決方案的堆棧,好消息是,自去年10月份推出Alveo以來,目前已發(fā)布的應(yīng)用已經(jīng)是當(dāng)初的2倍,而其培訓(xùn)的開發(fā)者已經(jīng)是當(dāng)初的4倍。
圖:解決方案堆棧
開發(fā)堆棧解決了FPGA加速卡的開發(fā)難題,接下來就是大規(guī)模部署落地的難題。Alveo系列的應(yīng)用領(lǐng)域包括數(shù)據(jù)分析、視頻與圖象處理、機器學(xué)習(xí)、生命科學(xué)和金融計算——不僅是云的覆蓋,還要部署落地。在諸多調(diào)動IT業(yè)者積極性的因素中,“充分商業(yè)化的標(biāo)準(zhǔn)化產(chǎn)品”是重要的一個,這使得賽靈思的標(biāo)準(zhǔn)產(chǎn)品的開源框架很容易被Kubernetes和docker這類免費的微服務(wù)內(nèi)容平臺連接。
“因為我們是一個非常標(biāo)準(zhǔn)化的產(chǎn)品,所以Kubernetes可以在系統(tǒng)內(nèi)反映出Alveo插件,開發(fā)者也可以把它和docker配合起來,通過對Alveo進行編程而在系統(tǒng)中體現(xiàn)出加速應(yīng)用?!盉owen解釋道,“所有編排、云管理和應(yīng)用都和這些免費的生態(tài)系統(tǒng)結(jié)合,如果沒有這樣一個標(biāo)準(zhǔn)化的產(chǎn)品配置,客戶可能需要花費大量的投資才能夠?qū)崿F(xiàn)這樣一個功能,這對于一些超大規(guī)模數(shù)據(jù)中心的應(yīng)用來說是非常有必要的,既可以在云端,也可以用Alveo在本地進行加速,而且是一個非常開放式的框架,可以進行全面的加速?!?/strong>
這個生態(tài)就是一個大規(guī)模部署堆棧,賽靈思在其中開發(fā)了一個標(biāo)準(zhǔn)框架,然后提供Alveo產(chǎn)品,讓開發(fā)者像加速軟件那樣給服務(wù)器加速——重要的是,通過開發(fā)這個標(biāo)準(zhǔn)框架,賽靈思決定了應(yīng)用場景的加速方式。
圖:大規(guī)模部署堆棧
據(jù)悉,賽靈思選擇在今天(8月7日)發(fā)布Alveo U50,是因為這兩天(8月6-8日),閃存峰會(Flash Memory Summit (FMS) 2019)正在美國加州圣克拉拉會議中心舉辦,賽靈思執(zhí)行副總裁兼數(shù)據(jù)中心部總經(jīng)理Salil Raje將發(fā)表有關(guān)高速存儲系統(tǒng)加速的的主題演講,該公司同時也會在現(xiàn)場演示這款最新的產(chǎn)品。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 賽靈思
    +關(guān)注

    關(guān)注

    33

    文章

    1797

    瀏覽量

    132304
  • 加速卡
    +關(guān)注

    關(guān)注

    1

    文章

    63

    瀏覽量

    11173
收藏 1人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    智算加速卡是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!

    隨著AI技術(shù)火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計算",可真到了落地環(huán)節(jié),算力才是硬通貨。你有沒有發(fā)現(xiàn),現(xiàn)在越來越多的AI企業(yè)不光用GPU,也不怎么迷信TPU了?他們嘴里多了一個新詞兒——智算加速卡。
    的頭像 發(fā)表于 06-05 13:39 ?530次閱讀
    智算<b class='flag-5'>加速卡</b>是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!

    410?基于?XCVU9P+?C6678?的?100G?光纖的加速卡

    基于 XCVU9P+ C6678 的 100G 光纖的加速卡
    的頭像 發(fā)表于 05-08 08:32 ?236次閱讀
    410?基于?XCVU9P+?C6678?的?100G?光纖的<b class='flag-5'>加速卡</b>

    寒武紀(jì)基于思元370芯片的MLU370-X8 智能加速卡產(chǎn)品手冊詳解

    MLU370-X8智能加速卡是全面升級的數(shù)據(jù)中心訓(xùn)推一體AI加速卡,基于寒武紀(jì)全新一代元370芯片,接口為PCIe 4.0 X16,是全高全長雙寬(FHFL-Dual-Slot)的標(biāo)準(zhǔn)PCIe
    的頭像 發(fā)表于 04-24 17:57 ?1358次閱讀
    寒武紀(jì)基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>產(chǎn)品手冊<b class='flag-5'>詳解</b>

    低溫失效的原因,有沒有別的方法或者一些見解?

    低溫失效的原因,有沒有別的方法或者一些見解。就是芯片工作溫度在100°--40°區(qū)間,然后呢我們到了0°以下就不工作了,然后在低溫的情況下監(jiān)測了電流和電壓都正常,頻率也都正常,頻率不是FPGA的頻率是晶振的頻率,焊接的話七
    發(fā)表于 12-30 16:28

    AMD Alveo媒體加速產(chǎn)品組合SDK 1.2.1發(fā)布

    我們很高興地宣布AMD Alveo 媒體加速產(chǎn)品組合( AMA )SDK 1.2.1 版本發(fā)布,從而進一步擴展 AMD Alveo MA35D 媒體
    的頭像 發(fā)表于 12-18 16:01 ?744次閱讀

    S7t-VG6 VectorPath加速卡的特性和功能

    S7t-VG6 VectorPath加速卡是Achronix公司聯(lián)合BittWare公司(Molex旗下的領(lǐng)先企業(yè)級FPGA加速器產(chǎn)品供應(yīng)商)推出的一類全新的、面向高性能計算和數(shù)據(jù)加速應(yīng)用的FPGA
    的頭像 發(fā)表于 11-14 11:19 ?817次閱讀

    U50的AMD Vivado Design Tool flow設(shè)置

    AMD Alveo 加速卡使用有兩種流程,AMD Vitis Software Platform flow 和 AMD Vivado Design Tool flow。比較常見的是 Vitis
    的頭像 發(fā)表于 11-13 10:14 ?839次閱讀
    <b class='flag-5'>U50</b>的AMD Vivado Design Tool flow設(shè)置

    AMD Alveo V80計算加速器網(wǎng)絡(luò)研討會

    V80 計算加速卡由 AMD Versal HBM 自適應(yīng) SoC 提供支持,具有 Alveo 產(chǎn)品系列中最高的邏輯密度、內(nèi)存帶寬、網(wǎng)絡(luò)吞吐量和 DSP 計算能力。
    的頭像 發(fā)表于 11-08 09:35 ?622次閱讀

    PCIe加速卡在數(shù)據(jù)中心的應(yīng)用

    隨著數(shù)據(jù)中心的快速發(fā)展,對計算能力的需求也在不斷增長。PCIe(Peripheral Component Interconnect Express)加速卡作為一種高性能的計算設(shè)備,已經(jīng)在
    的頭像 發(fā)表于 11-06 09:32 ?1752次閱讀

    AMD 以全球極快的纖薄尺寸電子交易加速卡擴展 Alveo 產(chǎn)品組合,助力廣泛且具性價比的服務(wù)器部署

    — AMD Alveo UL3422 加速卡為高頻交易員在爭奪最快交易執(zhí)行的競爭中提供了優(yōu)勢,同時降低了進入門檻 — ? 2024 年 10 月 14 日,加利福尼亞州圣克拉拉 — AMD(超威
    發(fā)表于 10-16 14:35 ?211次閱讀
    AMD 以全球極快的纖薄尺寸電子交易<b class='flag-5'>加速卡</b>擴展 <b class='flag-5'>Alveo</b> 產(chǎn)品組合,助力廣泛且具性價比的服務(wù)器部署

    AMD 以全球極快的纖薄尺寸電子交易加速卡擴展 Alveo 產(chǎn)品組合,助力廣泛且具性價比的服務(wù)器部署

    — AMD Alveo UL3422 加速卡為高頻交易員在爭奪最快交易執(zhí)行的競爭中提供了優(yōu)勢,同時降低了進入門檻 — ? 2024 年 10 月 14 日,加利福尼亞州圣克拉拉 — AMD(超威
    發(fā)表于 10-16 14:16 ?342次閱讀

    AMD推出新款纖薄尺寸電子交易加速卡

    AMD(超威,納斯達克股票代碼:AMD)今日宣布推出 AMD Alveo UL3422 加速卡 ,這是其創(chuàng)紀(jì)錄的加速卡系列1的最新成員,專為超低時延電子交易應(yīng)用而設(shè)計。AMD Alveo
    的頭像 發(fā)表于 10-16 09:14 ?797次閱讀

    大模型向邊端側(cè)部署,AI加速卡朝高算力、小體積發(fā)展

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)AI加速卡是專門用于處理人工智能應(yīng)用中的大量計算任務(wù)的模塊。它集成了高性能的計算核心和大量的內(nèi)存,旨在加速機器學(xué)習(xí)、深度學(xué)習(xí)等算法的計算過程。當(dāng)前,AI加速卡市場呈現(xiàn)出
    的頭像 發(fā)表于 09-17 00:18 ?5123次閱讀

    EPSON差分晶振SG3225VEN頻點312.5mhz應(yīng)用于AI加速卡

    AI加速卡,通常也被稱為AI算力,是一種專為加速人工智能(AI)應(yīng)用和算法而設(shè)計的硬件設(shè)備。AI加速卡在數(shù)據(jù)中心、云計算、邊緣計算和高性能計算(HPC)環(huán)境中廣泛應(yīng)用,用于
    發(fā)表于 09-10 14:56 ?0次下載

    基于菲數(shù)科技FA728Q加速卡實現(xiàn)低時延LLT應(yīng)用

    菲數(shù)科技使用Stratix 10 FPGA和開源的開放式FPGA堆棧(OFS)基礎(chǔ)設(shè)施開發(fā)高性能FPGA加速卡
    的頭像 發(fā)表于 08-30 17:13 ?949次閱讀
    基于菲數(shù)科技FA728Q<b class='flag-5'>加速卡</b>實現(xiàn)低時延LLT應(yīng)用

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品