0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

大模型算力新選擇——寶德AI服務器采用8顆英特爾Gaudi?2加速器

科技訊息 ? 來源:科技訊息 ? 作者:科技訊息 ? 2023-07-19 14:43 ? 次閱讀

近日,英特爾專門針對中國市場推出深度學習加速器Habana?Gaudi?2.以領先的性價比優(yōu)勢,加速AI訓練及推理,提高深度學習性能和效率,從而成為大規(guī)模部署AI的更優(yōu)解。作為英特爾在中國最重要的戰(zhàn)略合作伙伴和中國AI服務器市場的TOP3.寶德計算積極攜手英特爾,推出了支持8顆Gaudi?2加速器的AI加速計算服務器——PR8908WG,具有高性能、可擴展性強、高能效和開箱即用等優(yōu)勢,能夠為AI客戶尤其是大模型訓練和推理提供超高性價比的算力支撐。

全新Gaudi?2訓練加速器,專為深度學習而生

Gaudi?2采用7nm制程工藝,擁有高性能架構,具備24個可編程Tensor處理器核心(TPCs),21個100Gbps(RoCEv2)以太網(wǎng)接口,96GB HBM2E內(nèi)存容量,2.4TB/秒的總內(nèi)存帶寬,48MB片上SRAM,并且集成多媒體處理引擎,為訓練大語言模型提供高性能、高可擴展性和高能效的AI算力,在MLCommons?MLPerf@基準測試之GPT-3模型、計算機視覺模型ResNet-50、Unet3D、以及自然語言處理模型BERT等方面均取得了優(yōu)異的成績。

生成式AI和大語言模型需要服務器集群來滿足大規(guī)模且更加復雜的計算要求。英特爾Gaudi?2處理器作為一款高性能、完全可編程的AI處理器,整合了多項技術創(chuàng)新,具有高內(nèi)存帶寬/容量和基于標準以太網(wǎng)技術的縱向擴展能力,并支持使用外接網(wǎng)卡通過PCle接口實現(xiàn)橫向擴展,可滿足多節(jié)點集群需要。同時,英特爾不斷打造領先、成熟的軟件生態(tài)支持,SynapseAI?軟件套件就針對Gaudi平臺深度學習業(yè)務進行了優(yōu)化,它集成了對TensorFlow和PyTorch框架的支持,并提供眾多流行的計算機視覺和自然語言參考模型,能夠滿足深度學習開發(fā)者的多樣化需求。

寶德AI服務器PR8908WG+ Gaudi?2.大模型算力新選擇

寶德AI服務器PR8908WG采用第三代英特爾?至強?可擴展處理器,8U空間支持8顆OAM高速互聯(lián)的Gaudi?2 AI加速器,每顆Gaudi?2芯片配置96GB HBM高速內(nèi)存,GPU與 GPU 之間互聯(lián)帶寬達到400GB/s,提供2.1Tbps的P2P互聯(lián)帶寬,支持全互聯(lián)拓撲,全面滿足大模型訓練的海量通信需求;它支持200Gb ETH和HDR高速智能網(wǎng)卡,支持GPU Direct RDMA,完美滿足集群和超大規(guī)模擴展應用。

PR8908WG擁有32個DDR4 DIMM插槽,最大支持8TB 32x 256 GB DRAM;支持24塊2.5英寸SAS/SATA熱插拔硬盤位,默認支持8塊直連SATA硬盤,4塊NVMe U.2 SSD,同時內(nèi)置2個NVMe M.2 SSD,實現(xiàn) CPU 直通設計,降低 I/O 延遲;它提供2個PCIe 4.0 x16 FHFL插槽和2 個PCIe 4.0 x8 FHFL插槽;支持以太網(wǎng)、InfiniBand、OPA等多種不同網(wǎng)絡選擇和互聯(lián)需求。

PR8908WG整機采用模塊化設計,獨立的GPU和CPU 熱量分區(qū)設計確保系統(tǒng)在最苛刻的工作負載下性能和穩(wěn)定性不受影響;同時板載集成BMC、支持通過RAID卡超級電容、支持IPMI 2.0遠程管理等,非常方便用戶對AI算力設備的維護管理。

綜上,寶德AI加速計算服務器PR8908WG可以滿足AI不同場景下海量數(shù)據(jù)的計算和推理需求,特別適用于大模型訓練和推理、深度學習、自動駕駛、智能城市、醫(yī)療健康、大數(shù)據(jù)、高性能計算(HPC)和虛擬現(xiàn)實等應用場景,幫助加速更多AI技術的落地和應用。

大模型將帶來AI新價值,“百模大戰(zhàn)時代”已經(jīng)來臨。隨著各大模型的爭奇斗艷和對成本、盈利模式等的日益關注,性價比為王將成為AI算力的新標準。作為中國領先的計算產(chǎn)品方案提供商,寶德計算將繼續(xù)發(fā)揮AI服務器領域的技術優(yōu)勢和市場經(jīng)驗,攜手英特爾等合作伙伴不斷創(chuàng)新,探索大模型算力的更多選擇,打造更具性價比的AI算力和解決方案,助力中國大模型更多細分場景的落地和商業(yè)變現(xiàn),共同加速中國大模型技術的發(fā)展步伐,推動中國人工智能產(chǎn)業(yè)的整體升級!

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    9967

    瀏覽量

    171793
  • 加速器
    +關注

    關注

    2

    文章

    799

    瀏覽量

    37876
  • 服務器
    +關注

    關注

    12

    文章

    9165

    瀏覽量

    85436
  • AI
    AI
    +關注

    關注

    87

    文章

    30898

    瀏覽量

    269128
收藏 人收藏

    評論

    相關推薦

    英特爾帶您解鎖云上智新引擎

    在近日舉辦的2024火山引擎FORCE原動力大會上,英特爾與火山引擎聯(lián)合發(fā)布基于英特爾 至強 6 性能核處理的第四代服務器實例,以打造彈性
    的頭像 發(fā)表于 12-23 14:05 ?178次閱讀

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出了全新的企業(yè)AI一體化方案。該方案以英特爾至強處理英特爾Gaudi
    的頭像 發(fā)表于 12-03 11:20 ?231次閱讀

    英特爾發(fā)布全新企業(yè)AI一體化解決方案

    近日,英特爾正式推出了其全新的企業(yè)AI一體化解決方案,這一方案旨在為企業(yè)提供更加開放、可擴展且高效的端到端服務。 該方案的核心在于其全棧硬件的支撐,包括英特爾至強處理
    的頭像 發(fā)表于 12-02 10:48 ?502次閱讀

    英特爾助力百度智能云千帆大模型平臺加速LLM推理

    “大模型在各行業(yè)的廣泛應用驅(qū)動了新一輪產(chǎn)業(yè)革命,也凸顯了在AI方面的瓶頸。通過攜手英特爾釋放英特爾
    的頭像 發(fā)表于 11-25 16:59 ?413次閱讀
    <b class='flag-5'>英特爾</b>助力百度智能云千帆大<b class='flag-5'>模型</b>平臺<b class='flag-5'>加速</b>LLM推理

    Inflection AI轉向英特爾Gaudi 3,放棄英偉達GPU

    近日,人工智能技術公司Inflection AI宣布了一項重要決策,其最新的企業(yè)平臺將放棄采用英偉達(Nvidia)的GPU,轉而選擇英特爾Gau
    的頭像 發(fā)表于 10-10 17:21 ?492次閱讀

    Inflection AI攜手英特爾推出企業(yè)級AI系統(tǒng)

    近日,AI初創(chuàng)企業(yè)Inflection AI英特爾聯(lián)合宣布了一項重大合作——推出基于英特爾Gaudi 3
    的頭像 發(fā)表于 10-09 16:40 ?448次閱讀

    英特爾調(diào)降明年AI服務器芯片出貨目標

    近日,有消息稱英特爾為應對內(nèi)部策略調(diào)整及終端需求變化,已對其旗下AI服務器芯片Gaudi 3的明年出貨目標進行了大幅調(diào)整。
    的頭像 發(fā)表于 10-08 15:38 ?281次閱讀

    最強服務器CPU來了!AI性能直接翻倍

    以及AI服務器AI數(shù)據(jù)中心場景的CPU產(chǎn)品。它不僅能支持廣泛的第三方GPU及AI加速器,與它們組合形成強大的異構計算平臺,還能在其中補足G
    的頭像 發(fā)表于 09-29 11:00 ?728次閱讀
    最強<b class='flag-5'>服務器</b>CPU來了!<b class='flag-5'>AI</b>性能直接翻倍

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢挑戰(zhàn)市場

    英特爾近期震撼發(fā)布了專為AI工作負載設計的Gaudi3加速器,這款新芯片雖在速度上不及英偉達熱門型號H100與H200 GPU,但英特爾巧妙
    的頭像 發(fā)表于 09-26 16:16 ?825次閱讀

    IBM Cloud將部署英特爾Gaudi 3 AI芯片

    近日,科技巨頭IBM與英特爾宣布了一項重大合作計劃,雙方將共同在IBM Cloud平臺上部署英特爾最新的Gaudi 3 AI芯片,預計該服務
    的頭像 發(fā)表于 09-03 15:52 ?391次閱讀

    服務器為什么選擇GPU

    隨著人工智能技術的快速普及,需求日益增長。智中心的服務器作為支撐大規(guī)模數(shù)據(jù)處理和計算的核心設備,其性能優(yōu)化顯得尤為關鍵。而GPU服務器
    的頭像 發(fā)表于 07-25 08:28 ?634次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服務器</b>為什么<b class='flag-5'>選擇</b>GPU

    寧暢B5000 G5多節(jié)點服務器采用第五代英特爾至強可擴展處理

    “基于第五代英特爾 至強 可擴展處理的寧暢B5000 G5多節(jié)點服務器,可以在滿足大量AI推理場景在吞吐量、時延、容量、并發(fā)能力等方面的需求,而且與專用的GPU
    的頭像 發(fā)表于 05-27 11:46 ?831次閱讀
    寧暢B5000 G5多節(jié)點<b class='flag-5'>服務器</b><b class='flag-5'>采用</b>第五代<b class='flag-5'>英特爾</b>至強可擴展處理<b class='flag-5'>器</b>

    英特爾確認Ponte Vecchio GPU將以云服務形式推出

    英特爾在公告中強調(diào),隨著AI技術需求的不斷增加,公司重點利用Gaudi AI加速器的性能優(yōu)勢及有競爭
    的頭像 發(fā)表于 05-18 17:14 ?1062次閱讀

    英特爾公布Gaudi 3 AI加速器中國特供版計劃

    這兩款專供版加速卡,分別被命名為HL-328和HL-388,它們代表了英特爾AI加速領域的最新技術成果。
    的頭像 發(fā)表于 04-15 15:19 ?749次閱讀

    英特爾進軍AI芯片市場:推出Gaudi 3 AI加速卡與Xeon 6處理

    Gaudi 3作為英特爾AI領域的最新力作,旨在與英偉達等市場領導者展開競爭。據(jù)英特爾透露,這款芯片在能效和AI
    的頭像 發(fā)表于 04-10 15:37 ?795次閱讀