0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

反思 GTC 和 OFC 2024:沒有一刀切的方法,但上市時(shí)間是關(guān)鍵!

易天小講堂 ? 來源:易天小講堂 ? 作者:易天小講堂 ? 2024-05-31 16:29 ? 次閱讀

在GTC 2024期間,英偉達(dá)宣布了最新的Blackwell B200張量核心GPU,旨在為萬億參數(shù)的AI大型語言模型提供支持。Blackwell B200需要先進(jìn)的800Gbps網(wǎng)絡(luò),完全符合在AI工作負(fù)載的AI網(wǎng)絡(luò)報(bào)告中概述的預(yù)測(cè)。隨著人工智能工作負(fù)載的流量預(yù)計(jì)每?jī)赡暝鲩L(zhǎng)10倍,這些人工智能工作負(fù)載預(yù)計(jì)將超過傳統(tǒng)前端網(wǎng)絡(luò)至少兩個(gè)速度升級(jí)周期。

wKgZomZZimOALHo-AADf9Rimt1w102.png

雖然在OFC上討論了許多關(guān)于跨數(shù)據(jù)中心應(yīng)用的主題和創(chuàng)新解決方案,以及在同一領(lǐng)域內(nèi)擴(kuò)展加速器數(shù)量的計(jì)算互連,但本篇文章將主要關(guān)注數(shù)據(jù)中心內(nèi)的應(yīng)用。具體來說,它將專注于擴(kuò)展連接大型人工智能集群中各種加速節(jié)點(diǎn)所需的網(wǎng)絡(luò),并使用1000個(gè)加速器。這個(gè)網(wǎng)絡(luò)在業(yè)界通常被稱為“人工智能后端網(wǎng)絡(luò)”(還提到;由一些供應(yīng)商提供;作為東西向流量的網(wǎng)絡(luò))。以下是展會(huì)上探討的一些主題和解決方案:

1)線性驅(qū)動(dòng)可插拔光學(xué)vs線性接收光學(xué)vs共封裝光學(xué)

可插拔光學(xué)器件預(yù)計(jì)將在系統(tǒng)級(jí)的功耗中占越來越大的比例。隨著云服務(wù)提供商構(gòu)建以高速光學(xué)擴(kuò)散為特征的下一代人工智能網(wǎng)絡(luò),這個(gè)問題將進(jìn)一步放大。

在OFC 2023上,線性驅(qū)動(dòng)可插拔光學(xué)(LPOs)的引入通過去除DSP來實(shí)現(xiàn)顯著的成本和功耗節(jié)約,引發(fā)了一系列的測(cè)試活動(dòng)??爝M(jìn)到OFC 2024,我們見證了近20場(chǎng)演示?;顒?dòng)期間的對(duì)話顯示了全行業(yè)對(duì)集成到最新51.2Tbps網(wǎng)絡(luò)交換芯片中的高質(zhì)量100G SerDes的熱情,許多人渴望利用這一進(jìn)步,能夠從光可插拔模塊中去除DSP。

然而,盡管令人興奮,但超大規(guī)模企業(yè)的猶豫表明,LPOs可能還沒有做好大規(guī)模采用的準(zhǔn)備。采訪強(qiáng)調(diào),超大規(guī)模企業(yè)不愿承擔(dān)LPOs的資格認(rèn)證和潛在失敗的責(zé)任。相反,他們更傾向于讓轉(zhuǎn)換供應(yīng)商來承擔(dān)這些責(zé)任。

在此期間,預(yù)計(jì)51.2Tbps網(wǎng)絡(luò)芯片的早期部署將繼續(xù)利用可插拔光學(xué),至少到明年年中。然而,如果LPOs 能夠展示大規(guī)模的安全部署,同時(shí)為超大規(guī)模企業(yè)提供顯著的功耗節(jié)省——使他們能夠在每個(gè)機(jī)架上部署更多的加速器——那么采用LPOs 的誘惑可能是不可抗拒的。最終,決定取決于LPOs 能否兌現(xiàn)這些承諾。

此外,半定時(shí)線性光學(xué)(HALO),也被稱為線性接收光學(xué)(LROs)在展會(huì)上進(jìn)行了討論。LRO僅在發(fā)送端集成DSP芯片(而不是在LPOs的情況下完全移除它)。雖然LPOs在100G-PAM4 SerDes下可能是可行的,但在200G-PAM4 SerDes下可能變得具有挑戰(zhàn)性,這時(shí)可能需要LROs。

與此同時(shí),協(xié)同封裝光學(xué)(CPOs)仍處于開發(fā)階段,Broadcom等大型行業(yè)參與者正在展示該技術(shù)的持續(xù)發(fā)展和進(jìn)步。雖然我們相信目前的LPO和LRO解決方案肯定會(huì)像CPOs一樣有更快的上市時(shí)間,但后者最終可能在未來的某個(gè)時(shí)候成為能夠?qū)崿F(xiàn)更高速度的唯一解決方案。

在結(jié)束本節(jié)之前,請(qǐng)不要忘記,在可能的情況下,銅將是比上面討論的所有光連接選項(xiàng)更好的選擇。簡(jiǎn)而言之,盡可能使用銅,必要時(shí)使用光學(xué)。有趣的是,液體冷卻可以促進(jìn)機(jī)架內(nèi)加速器的致密化,從而增加銅的使用,以連接同一機(jī)架內(nèi)的各種加速器節(jié)點(diǎn)。最近在GTC上發(fā)布的NVIDIA GB200 NVL72完美地說明了這一趨勢(shì)。

2)光電路開關(guān)

OFC 2024帶來了一些有趣的光學(xué)電路開關(guān)(OCS)相關(guān)公告。OCS可以帶來許多好處,包括高帶寬和低網(wǎng)絡(luò)延遲,以及顯著的資本支出節(jié)省。這是因?yàn)镺CS開關(guān)可以顯著減少網(wǎng)絡(luò)中所需的電氣開關(guān)數(shù)量,從而消除了與電氣開關(guān)相關(guān)的昂貴的光-電-光轉(zhuǎn)換。此外,與電氣開關(guān)不同,OCS開關(guān)與速度無關(guān),當(dāng)服務(wù)器采用下一代光收發(fā)器時(shí),不需要升級(jí)。

然而,OCS是一項(xiàng)新技術(shù),到目前為止,只有經(jīng)過多年開發(fā)的谷歌能夠在其數(shù)據(jù)中心網(wǎng)絡(luò)中大規(guī)模部署OCS。此外,OCS交換機(jī)可能需要改變光纖的安裝底座。因此,我們?nèi)栽谟^察,除了谷歌之外,是否有其他云服務(wù)提供商計(jì)劃效仿,在網(wǎng)絡(luò)中采用OCS交換機(jī)。

3) 3.2 Tbps的路徑

在OFC 2023上,推出了許多基于200G / lambda的1.6Tbps光學(xué)元件和收發(fā)器。在OFC 2024上,我們見證了這種1.6 Tbps光學(xué)器件的進(jìn)一步技術(shù)演示。雖然我們預(yù)計(jì)到2025/2026年才能實(shí)現(xiàn)1.6Tbps的批量出貨量,但業(yè)界已經(jīng)開始努力探索實(shí)現(xiàn)3.2 Tbps的各種途徑和選擇。

考慮到從100G-PAM4電子通道速度過渡到200G-PAM4所遇到的復(fù)雜性,最初的3.2 Tbps解決方案可能在OSFP-XD外形因素中使用16條200G-PAM4通道,而不是8條400G-PAMx通道。值得注意的是,OSFP-XD最初是在兩年前的OFC 2022上進(jìn)行探索和演示的,由于人工智能集群部署的緊迫性,它可能會(huì)重新投入使用。與1.6Tbps相比,OSFP-XD外形尺寸的3.2Tbps解決方案提供了更高的面板密度和成本節(jié)約。最終,業(yè)界有望找到一種基于8通道400G-PAMx SerDes實(shí)現(xiàn)3.2 Tbps的方法,盡管可能需要一些時(shí)間才能實(shí)現(xiàn)這一目標(biāo)。

總之,OFC 2024展示了許多潛在的解決方案,旨在解決共同的挑戰(zhàn):成本、功率和速度。我們預(yù)計(jì)不同的超大規(guī)模廠商將做出不同的選擇,從而導(dǎo)致市場(chǎng)多樣化。然而,關(guān)鍵的考慮因素之一是上市時(shí)間。值得注意的是,AI后端網(wǎng)絡(luò)的更新周期通常在18到24個(gè)月左右,與用于連接通用服務(wù)器的傳統(tǒng)前端網(wǎng)絡(luò)的5到6年相比,這要短得多。

原文轉(zhuǎn)自:Reflecting on GTC and OFC 2024: No One-Size-Fits-All but Time to Market is Key! - Dell'Oro Group

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4966

    瀏覽量

    72688
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    32490

    瀏覽量

    271701
  • OF
    OF
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    10735
  • 光纖模塊
    +關(guān)注

    關(guān)注

    0

    文章

    20

    瀏覽量

    3805
  • gtc
    gtc
    +關(guān)注

    關(guān)注

    0

    文章

    73

    瀏覽量

    4483
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    電梯按需維保:個(gè)性化定制的電梯維護(hù)方案

    在現(xiàn)代城市生活中,電梯已成為高樓大廈中不可或缺的垂直交通工具。然而,電梯的安全運(yùn)行離不開定期的維護(hù)保養(yǎng)。傳統(tǒng)的電梯維保模式往往采用固定周期的保養(yǎng)計(jì)劃,這種“一刀切”的方式可能無法滿足不同電梯的實(shí)際
    的頭像 發(fā)表于 02-19 17:37 ?161次閱讀

    ADS1259的OFC和FSC寄存器是怎么設(shè)置?

    我想請(qǐng)教下ADS1259的OFC和FSC寄存器是怎么設(shè)置的呢,也就是怎樣確定校準(zhǔn)值呢,有什么對(duì)照標(biāo)準(zhǔn)嗎?如果是芯片自校準(zhǔn)的話,是不是取默認(rèn)值就可以了,另外,全量程校準(zhǔn)的時(shí)候是不是需要準(zhǔn)確的全量程值呢?
    發(fā)表于 01-16 07:43

    銑削加工如何正確選擇走方式

    、總體加工時(shí)間、機(jī)床刀具的使用壽命等多個(gè)方面,最終決定生產(chǎn)效率。 本文通過對(duì)走方式的不同特點(diǎn),及影響其選擇的部分因素的分析,并且針對(duì)銑削過程中工藝方法及走方式的比較,為如何選擇合適
    的頭像 發(fā)表于 12-24 10:20 ?394次閱讀
    銑削加工如何正確選擇走<b class='flag-5'>刀</b>方式

    復(fù)旦提出大模型推理新思路:Two-Player架構(gòu)打破自我反思瓶頸

    更多的訓(xùn)練算力和數(shù)據(jù)資源,不如讓模型「花更多時(shí)間思考」。以 OpenAI 推出的 o1 模型為例,通過增加推理時(shí)間,這種方法讓模型能夠進(jìn)行反思、批評(píng)、回溯和糾正,大幅提升了推理表現(xiàn)。
    的頭像 發(fā)表于 12-06 11:24 ?411次閱讀
    復(fù)旦提出大模型推理新思路:Two-Player架構(gòu)打破自我<b class='flag-5'>反思</b>瓶頸

    從“一刀切”到“按需維?!保弘娞菥S保模式的革新

    隨著城市化進(jìn)程的加速,高樓大廈如雨后春筍般涌現(xiàn),電梯作為現(xiàn)代建筑的垂直交通工具,其安全、高效運(yùn)行顯得尤為重要。傳統(tǒng)的電梯維保模式往往采用定期、固定的維護(hù)周期,這種“一刀切”的方式雖在定程度上保障了
    的頭像 發(fā)表于 11-25 16:37 ?407次閱讀

    數(shù)控車床t指令對(duì)步驟

    數(shù)控車床T指令對(duì)步驟是數(shù)控車床操作中非常重要的環(huán),它關(guān)系到加工精度和生產(chǎn)效率。本文將詳細(xì)介紹數(shù)控車床T指令對(duì)步驟。 、數(shù)控車床T指令對(duì)
    的頭像 發(fā)表于 06-07 09:50 ?2363次閱讀

    深圳恒興隆|自動(dòng)換電主軸:實(shí)現(xiàn)加工自動(dòng)化與高效化的關(guān)鍵.

    深圳恒興?。詣?dòng)換電主軸:實(shí)現(xiàn)加工自動(dòng)化與高效化的關(guān)鍵隨著工業(yè)制造技術(shù)的不斷進(jìn)步,機(jī)床作為制造業(yè)的核心設(shè)備,其性能與效率的提升直是行業(yè)關(guān)注的焦點(diǎn)。其中,電主軸作為數(shù)控機(jī)床的重要組成部分,其技術(shù)
    發(fā)表于 05-08 10:24

    MACOM在OFC 2024上展示其線性驅(qū)動(dòng)每通道100G的組件

    領(lǐng)先的半導(dǎo)體解決方案供應(yīng)商MACOM公司,于近日在OFC 2024上展示其線性驅(qū)動(dòng)每通道100G的組件,并進(jìn)行了從交換機(jī)到服務(wù)器的互操作演示。
    的頭像 發(fā)表于 04-19 17:05 ?660次閱讀

    MACOM于近日舉行的OFC 2024上現(xiàn)場(chǎng)演示其每通道200G的產(chǎn)品

    領(lǐng)先的半導(dǎo)體解決方案供應(yīng)商MACOM公司,于近日舉行的OFC 2024上現(xiàn)場(chǎng)演示了其每通道200G的產(chǎn)品。
    的頭像 發(fā)表于 04-18 11:40 ?2615次閱讀

    度亙核芯精彩亮相2024美國光纖通訊展覽會(huì)及研討會(huì)(OFC

    2024年3月28日,第49屆美國光纖通訊展覽會(huì)及研討會(huì)(OFC2024)于美國加州圣地亞哥會(huì)展中心圓滿落幕。作為全球光通信領(lǐng)域的頂級(jí)盛會(huì),此次展會(huì)吸引了世界各地的光通訊企業(yè)與業(yè)界精英齊聚
    的頭像 發(fā)表于 04-01 08:27 ?630次閱讀
    度亙核芯精彩亮相<b class='flag-5'>2024</b>美國光纖通訊展覽會(huì)及研討會(huì)(<b class='flag-5'>OFC</b>)

    2024年小米汽車產(chǎn)業(yè)鏈分析及新品上市全景洞察報(bào)告

    2024年小米汽車產(chǎn)業(yè)鏈分析及新品上市全景洞察報(bào)告 *附件:小米汽車全面洞察報(bào)告.pdf 本文主要介紹了小米汽車在市場(chǎng)中的布局和優(yōu)勢(shì),以及其面臨的劣勢(shì)與挑戰(zhàn)。小米汽車憑借品牌、技術(shù)和成本三大核心優(yōu)勢(shì)
    發(fā)表于 03-29 13:46

    寧暢服務(wù)器亮相GTC 2024,開啟AI新紀(jì)元

    在舉世矚目的NVIDIA GTC 2024盛會(huì)上,寧暢以贊助商身份再度登上舞臺(tái),為全球AI生態(tài)帶來場(chǎng)視覺與技術(shù)的盛宴。大會(huì)線上線下同步進(jìn)行,匯聚了眾多AI領(lǐng)域的創(chuàng)新力量,共同展望AI和加速計(jì)算的未來。
    的頭像 發(fā)表于 03-27 11:16 ?805次閱讀

    中航光電即將參加2024美國光通訊展(OFC

    2024年3月26日至28日第49屆美國光通訊展(OFC)將于美國加州圣地亞哥會(huì)展中心舉行。
    的頭像 發(fā)表于 03-25 09:39 ?1047次閱讀

    賽勒科技新型高性能800G硅光引擎即將亮相OFC 2024

    南通賽勒光電科技有限公司(簡(jiǎn)稱“賽勒科技”)在近日重磅推出了專為AI集群和數(shù)據(jù)中心設(shè)計(jì)的新代產(chǎn)品——新型高性能800G硅光引擎。這款備受矚目的創(chuàng)新產(chǎn)品即將在盛大的2024年度光纖通信大會(huì)(OFC)上亮相,展出
    的頭像 發(fā)表于 03-22 10:07 ?1070次閱讀

    英偉達(dá)2024GTC人工智能大會(huì)看點(diǎn),黃仁勛發(fā)布最炸裂的B200 GPU,講述人工智能奇跡

    ABSTRACT摘要2024GTC人工智能大會(huì),和過去樣,黃仁勛,這位穿黑色皮夾克的男人用兩個(gè)小時(shí)講述了人工智能的奇跡,發(fā)布最炸裂的B200GPU,以及讓人工智能唱歌跳舞的下代硬
    的頭像 發(fā)表于 03-20 08:24 ?1091次閱讀
    英偉達(dá)<b class='flag-5'>2024</b>年<b class='flag-5'>GTC</b>人工智能大會(huì)看點(diǎn),黃仁勛發(fā)布最炸裂的B200 GPU,講述人工智能奇跡