0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Meta AI數(shù)據(jù)中心網(wǎng)絡(luò)用了哪家的芯片

SSDFans ? 來源:SSDFans ? 2024-11-25 10:05 ? 次閱讀

在Meta,我們相信開放的硬件會(huì)推動(dòng)創(chuàng)新。在當(dāng)今世界,越來越多的數(shù)據(jù)中心基礎(chǔ)設(shè)施致力于支持新興的AI技術(shù),開放硬件在協(xié)助分解方面發(fā)揮著重要作用。通過將傳統(tǒng)數(shù)據(jù)中心技術(shù)分解為其核心組件,我們可以構(gòu)建更加靈活、可擴(kuò)展和高效的新系統(tǒng)。

自2011年幫助創(chuàng)建OCP以來,我們分享了數(shù)據(jù)中心和組件設(shè)計(jì),并開源了網(wǎng)絡(luò)編排軟件,以激發(fā)自己的數(shù)據(jù)中心和整個(gè)行業(yè)的新想法。這些想法使Meta的數(shù)據(jù)中心成為世界上最具可持續(xù)性和效率的數(shù)據(jù)中心之一。現(xiàn)在,通過OCP,我們正在為數(shù)據(jù)中心和更廣泛的行業(yè)帶來新的開放的先進(jìn)網(wǎng)絡(luò)技術(shù),用于先進(jìn)的AI應(yīng)用。

我們宣布了數(shù)據(jù)中心的兩個(gè)新的里程碑:下一代AI網(wǎng)絡(luò)結(jié)構(gòu),以及與多家供應(yīng)商密切合作開發(fā)的新網(wǎng)絡(luò)硬件組合。

7728e184-a865-11ef-93f3-92fbcf53809c.png

DSF:已分解并開放的結(jié)構(gòu)

網(wǎng)絡(luò)性能和可用性在從AI訓(xùn)練集群中提取最佳性能方面起著重要作用。正是出于這個(gè)原因,我們一直在為AI集群推動(dòng)后端網(wǎng)絡(luò)結(jié)構(gòu)的分解。在過去的一年里,我們?yōu)橄乱淮鶤I集群開發(fā)了一個(gè)分解的計(jì)劃結(jié)構(gòu)(DSF),以幫助我們開發(fā)開放的、與供應(yīng)商無關(guān)的系統(tǒng),這些系統(tǒng)具有來自整個(gè)行業(yè)供應(yīng)商的可互換的構(gòu)建塊。基于DSF允許我們構(gòu)建大型、無阻塞的結(jié)構(gòu),以支持高帶寬AI集群。

DSF將我們的分解網(wǎng)絡(luò)系統(tǒng)擴(kuò)展到基于VoQ的交換系統(tǒng),該系統(tǒng)由開放的OCP-SAI標(biāo)準(zhǔn)和FBOSS(Meta自己的網(wǎng)絡(luò)操作系統(tǒng),用于控制網(wǎng)絡(luò)交換機(jī))提供支持?;赩oQ的調(diào)度確保了網(wǎng)絡(luò)中的主動(dòng)擁塞避免,而不是被動(dòng)的擁塞信號(hào)和反應(yīng)。

DSF結(jié)構(gòu)支持一個(gè)開放和標(biāo)準(zhǔn)的基于以太網(wǎng)的RoCE接口,跨越多個(gè)xPU和NIC,包括Meta的MTIA以及來自幾個(gè)供應(yīng)商的端點(diǎn)和加速器。

下一代AI結(jié)構(gòu)的DSF平臺(tái)

Arista 7700R4系列

DSF平臺(tái),Arista 7700R4系列,由專用的葉片和spine系統(tǒng)組成,它們組合在一起形成一個(gè)大型的分布式交換機(jī)。作為一個(gè)分布式系統(tǒng),DSF旨在支持大規(guī)模的AI集群。

7700R4C-38PE: DSF葉片開關(guān)

DSF分布式葉式交換機(jī)(基于Broadcom Jericho3-AI)

18 * 800GE (36 * 400GE) fp800主機(jī)端口

20 *800Gbps (40 *400Gbps)光纖接口

14.4Tbps的無線速度性能和16GB的緩沖區(qū)

7720R4-128PE: DSFspine開關(guān)

DSF分布式主干交換機(jī)(基于Broadcom Ramon3)

加速計(jì)算優(yōu)化流水線

128*800Gbps (256*400Gbps)光纖接口

102.4Tbps的無線速度性能

下一代400G/800G光纖的51T交換機(jī)

Meta將部署兩款下一代400G光纖交換機(jī),Minipack3(最新版本的Minipack,Meta自己的光纖網(wǎng)絡(luò)交換機(jī))和Cisco 8501,這兩款交換機(jī)都可以向后兼容之前的200G和400G交換機(jī),并支持升級(jí)到400G和800G。

Minipack3采用Broadcom最新的Tomahawk5 ASIC,而Cisco 8501則基于Cisco的Silicon One G200 ASIC。這些高性能交換機(jī)的傳輸速率高達(dá)51.2 Tbps,具有64x OSFP端口,并且該設(shè)計(jì)在不需要計(jì)時(shí)器的情況下進(jìn)行了優(yōu)化,以實(shí)現(xiàn)最大的功率效率。與之前的型號(hào)相比,它們也顯著降低了每比特的功率。

Meta將在FBOSS上同時(shí)運(yùn)行Minipack3和Cisco 8501。

光學(xué):2x400G FR4光學(xué)器件,用于400G/800G光互連

Meta的數(shù)據(jù)中心結(jié)構(gòu)已經(jīng)從200 Gbps/400 Gbps發(fā)展到400 Gbps/800 Gbps,我們已經(jīng)在數(shù)據(jù)中心部署了2x400G光學(xué)器件。

DSF中FBOSS和SAI的演化

我們繼續(xù)采用OCP-SAI將新的網(wǎng)絡(luò)結(jié)構(gòu)、交換硬件平臺(tái)和光收發(fā)器搭載到FBOSS。我們與供應(yīng)商和OCP合作,共同發(fā)展SAI。它現(xiàn)在支持新的特性和概念,如DSF和其他增強(qiáng)的路由方案。

來自世界各地的開發(fā)人員和工程師可以使用這個(gè)開放硬件,并貢獻(xiàn)自己的軟件,反過來,他們可以自己使用并與更廣泛的行業(yè)共享。

FBNIC:由Meta設(shè)計(jì)的多主機(jī)基礎(chǔ)網(wǎng)卡

我們正在繼續(xù)設(shè)計(jì)更多的ASIC,包括用于FBNIC的ASIC。FBNIC是一個(gè)真正的多主機(jī)基礎(chǔ)網(wǎng)卡,包含了為服務(wù)器艦隊(duì)和MTIA解決方案設(shè)計(jì)的第一個(gè)元網(wǎng)絡(luò)ASIC。它最多可以支持四個(gè)主機(jī),每個(gè)主機(jī)具有完全的數(shù)據(jù)路徑隔離。FBNIC驅(qū)動(dòng)程序從v6.11內(nèi)核開始可用,NIC模塊由Marvell設(shè)計(jì),并已貢獻(xiàn)給OCP。

FBNIC的主要特點(diǎn)包括:

網(wǎng)絡(luò)接口高達(dá)4*100/4*50/4*25 GE,SerDes支持高達(dá)56G PAM4每通道。

最多4個(gè)獨(dú)立的PCIe Gen5片

HW卸載包括LSO,Checksum

用于PTP的線路速率時(shí)間戳(從PHY一直到每個(gè)主機(jī))

頭數(shù)據(jù)分割,以協(xié)助零拷貝

兼容OCP網(wǎng)卡3.0,版本1.2.0,設(shè)計(jì)規(guī)范

未來是開放的

推進(jìn)AI意味著構(gòu)建超越規(guī)模的數(shù)據(jù)中心基礎(chǔ)設(shè)施。它還必須考慮到靈活性,高效和可持續(xù)地執(zhí)行。在Meta,我們?cè)O(shè)想AI硬件系統(tǒng)的未來不僅是可擴(kuò)展的,而且是開放和協(xié)作的。

我們鼓勵(lì)任何想要幫助推進(jìn)AI網(wǎng)絡(luò)硬件未來的人與OCP和Meta合作,以幫助共享AI基礎(chǔ)設(shè)施的未來。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4778

    瀏覽量

    72123
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30887

    瀏覽量

    269060
  • OCP
    OCP
    +關(guān)注

    關(guān)注

    0

    文章

    79

    瀏覽量

    16428
  • DSF
    DSF
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    2398

原文標(biāo)題:Meta AI數(shù)據(jù)中心網(wǎng)絡(luò)用了哪家的芯片?

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI數(shù)據(jù)中心的能源危機(jī),需要更高效的PSU

    應(yīng)用對(duì)算力的需求,推動(dòng)了AI芯片算力不斷提高,與此同時(shí)帶來的是越來越高的功耗。單顆算力芯片的功耗,從過去的300W左右提升至如今的1000W,大功率AI
    的頭像 發(fā)表于 11-04 02:21 ?3550次閱讀

    簡(jiǎn)述數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的演變

    隨著全球?qū)θ斯ぶ悄埽?b class='flag-5'>AI)的需求不斷增長(zhǎng),數(shù)據(jù)中心作為AI計(jì)算的重要基礎(chǔ)設(shè)施,其網(wǎng)絡(luò)架構(gòu)與連接技術(shù)的發(fā)展變得尤為關(guān)鍵。
    的頭像 發(fā)表于 10-22 16:23 ?296次閱讀

    AI時(shí)代,我們需要怎樣的數(shù)據(jù)中心?AI重新定義數(shù)據(jù)中心

    超過60%的中國(guó)企業(yè)計(jì)劃在未來12至24個(gè)月內(nèi)部署生成式人工智能。AI、模型的構(gòu)建,將顛覆數(shù)據(jù)中心基礎(chǔ)設(shè)施的建設(shè)、運(yùn)維和運(yùn)營(yíng)。一個(gè)全新的數(shù)據(jù)中心智能化時(shí)代已經(jīng)拉開序幕。
    發(fā)表于 07-16 11:33 ?709次閱讀
    <b class='flag-5'>AI</b>時(shí)代,我們需要怎樣的<b class='flag-5'>數(shù)據(jù)中心</b>?<b class='flag-5'>AI</b>重新定義<b class='flag-5'>數(shù)據(jù)中心</b>

    八大科技巨頭攜手推進(jìn)UALink,加速數(shù)據(jù)中心AI互聯(lián)

    近日,英特爾、Google、微軟、Meta等八家科技巨頭宣布共同成立超加速器鏈接(UALink)推廣小組,致力于推動(dòng)數(shù)據(jù)中心內(nèi)AI加速器芯片的連接組件發(fā)展。UALink旨在優(yōu)化
    的頭像 發(fā)表于 05-31 10:59 ?841次閱讀

    HNS 2024:星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時(shí)代新動(dòng)能

    華為數(shù)據(jù)通信創(chuàng)新峰會(huì)2024在巴庫(kù)隆重舉辦,在“星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時(shí)代新動(dòng)能”主題論壇中,華為面向中東中亞地區(qū)發(fā)布星河
    的頭像 發(fā)表于 05-15 09:15 ?657次閱讀
    HNS 2024:星河<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>網(wǎng)絡(luò)</b>,賦<b class='flag-5'>AI</b>時(shí)代新動(dòng)能

    蘋果正在開發(fā)用于數(shù)據(jù)中心AI芯片

    蘋果公司長(zhǎng)期以來一直致力于自主研發(fā)芯片技術(shù),最新的研發(fā)焦點(diǎn)已轉(zhuǎn)移至數(shù)據(jù)中心服務(wù)器芯片。據(jù)悉,該項(xiàng)目的內(nèi)部代號(hào)為ACDC,寓意著“數(shù)據(jù)中心蘋果芯片
    的頭像 發(fā)表于 05-13 10:59 ?465次閱讀

    蘋果正在研發(fā)全新數(shù)據(jù)中心AI芯片

    蘋果正在秘密研發(fā)一款全新的數(shù)據(jù)中心AI芯片,這一項(xiàng)目在公司內(nèi)部被稱為“ACDC”,并且已經(jīng)經(jīng)過了數(shù)年的精心籌備。據(jù)華爾街日?qǐng)?bào)的知情人士透露,這款芯片的設(shè)計(jì)目標(biāo)是為了優(yōu)化蘋果
    的頭像 發(fā)表于 05-08 09:40 ?420次閱讀

    蘋果自研數(shù)據(jù)中心AI芯片

    據(jù)可靠消息透露,蘋果公司正秘密研發(fā)一款全新的AI芯片,旨在為其數(shù)據(jù)中心提供強(qiáng)大的算力支持。這款內(nèi)部代號(hào)為ACDC(Apple Chips in Data Center)的芯片,預(yù)計(jì)將在
    的頭像 發(fā)表于 05-07 14:44 ?388次閱讀

    英特爾AI產(chǎn)品助力其運(yùn)行Meta新一代大語(yǔ)言模型Meta Llama 3

    英特爾豐富的AI產(chǎn)品——面向數(shù)據(jù)中心的至強(qiáng)處理器,邊緣處理器及AI PC等產(chǎn)品為開發(fā)者提供最新的優(yōu)化,助力其運(yùn)行Meta新一代大語(yǔ)言模型Meta
    的頭像 發(fā)表于 04-28 11:16 ?637次閱讀

    #mpo極性 #數(shù)據(jù)中心mpo

    數(shù)據(jù)中心MPO
    jf_51241005
    發(fā)布于 :2024年04月07日 10:05:13

    華為聯(lián)合中國(guó)信通院發(fā)布《華為星河AI數(shù)據(jù)中心網(wǎng)絡(luò)測(cè)試報(bào)告》

    2024 開放數(shù)據(jù)中心委員會(huì)(以下簡(jiǎn)稱ODCC)春季全會(huì)在江西婺源順利召開,全會(huì)由ODCC副主席李潔博士主持。全會(huì)期間,華為聯(lián)合中國(guó)信通院云大所數(shù)據(jù)中心團(tuán)隊(duì)發(fā)布《華為星河AI數(shù)據(jù)中心
    的頭像 發(fā)表于 04-02 09:25 ?1475次閱讀

    一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò),全面釋放AI時(shí)代算力

    華為中國(guó)合作伙伴大會(huì) | 一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò),以網(wǎng)強(qiáng)算,全面釋放AI時(shí)代算力
    的頭像 發(fā)表于 03-22 10:28 ?758次閱讀
    一圖看懂星河<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>網(wǎng)絡(luò)</b>,全面釋放<b class='flag-5'>AI</b>時(shí)代算力

    是德科技推出AI數(shù)據(jù)中心測(cè)試平臺(tái)旨在加速AI/ML網(wǎng)絡(luò)驗(yàn)證和優(yōu)化的創(chuàng)新

    2024年2月29日,是德科技(Keysight Technologies,Inc.)宣布,針對(duì)人工智能(AI)和機(jī)器學(xué)習(xí)(ML)基礎(chǔ)設(shè)施生態(tài)系統(tǒng),推出了 AI數(shù)據(jù)中心測(cè)試平臺(tái),旨在加速AI
    的頭像 發(fā)表于 02-29 09:32 ?636次閱讀
    是德科技推出<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)中心</b>測(cè)試平臺(tái)旨在加速<b class='flag-5'>AI</b>/ML<b class='flag-5'>網(wǎng)絡(luò)</b>驗(yàn)證和優(yōu)化的創(chuàng)新

    Meta將于今年在數(shù)據(jù)中心部署新款定制AI芯片

    Meta近日宣布,計(jì)劃于2024年在其數(shù)據(jù)中心部署新款內(nèi)部定制的AI芯片。這款芯片將用于支持Meta
    的頭像 發(fā)表于 02-04 10:17 ?760次閱讀

    Meta計(jì)劃今年部署自研定制芯片,以加速AI研發(fā)

    Meta公司近日宣布計(jì)劃在今年內(nèi)為其數(shù)據(jù)中心部署一款自研定制芯片,以支持其人工智能(AI)的研發(fā)工作。這一舉措旨在提高Meta
    的頭像 發(fā)表于 02-03 10:48 ?652次閱讀