0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA為數(shù)據(jù)中心運(yùn)營商實(shí)現(xiàn)實(shí)現(xiàn)共享精確計(jì)時(shí)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-14 16:31 ? 次閱讀

Facebook 正在開源 開放計(jì)算項(xiàng)目 Time Appliance 項(xiàng)目( OCP TAP ),該項(xiàng)目以經(jīng)濟(jì)高效的方式跨數(shù)據(jù)中心提供非常精確的計(jì)時(shí)和時(shí)間同步。該解決方案包括一個(gè)時(shí)間卡,它可以將幾乎任何商用現(xiàn)貨( COTS )服務(wù)器轉(zhuǎn)換為精確的時(shí)間設(shè)備,由 NVIDIA ConnectX-6 Dx 網(wǎng)卡( NIC )啟用,并具有精確計(jì)時(shí)協(xié)議,以便與數(shù)據(jù)中心的其他服務(wù)器共享精確的計(jì)時(shí)。

Facebook 的時(shí)間卡和 NVIDIA 的 NIC 相結(jié)合,為數(shù)據(jù)中心運(yùn)營商提供了一個(gè)開源、安全、可靠和可擴(kuò)展的現(xiàn)代化、價(jià)格合理的時(shí)間同步解決方案。

為什么準(zhǔn)確的時(shí)間在數(shù)據(jù)中心很重要

隨著應(yīng)用程序的擴(kuò)展和 IT 運(yùn)營遍布全球,保持?jǐn)?shù)據(jù)中心內(nèi)不同服務(wù)器之間的數(shù)據(jù)同步,或跨大陸的不同數(shù)據(jù)中心之間的數(shù)據(jù)同步,這變得更加重要和困難。如果數(shù)據(jù)庫是分布式的,它必須跟蹤事件的確切順序,以保持一致性并顯示因果關(guān)系。如果兩個(gè)人試圖購買同一只股票,公平性(和合規(guī)性)要求明確知道哪一張訂單先到。同樣,當(dāng)成千上萬的人每小時(shí)發(fā)布內(nèi)容,數(shù)百萬用戶喜歡/大笑/喜愛這些帖子時(shí), Facebook 需要知道每個(gè)帖子、豎起大拇指、回復(fù)或表情符號(hào)的實(shí)際發(fā)生順序。

保持?jǐn)?shù)據(jù)同步的一種方法是讓每個(gè)數(shù)據(jù)中心在每次事務(wù)完成后將其更新發(fā)送給其他數(shù)據(jù)中心,但這很快變得不可行,因?yàn)閿?shù)據(jù)中心之間的延遲太高,無法支持每小時(shí)數(shù)百萬個(gè)事件。

更好的方法是讓每個(gè)服務(wù)器和數(shù)據(jù)中心同步到精確的時(shí)間,彼此之間的同步時(shí)間不超過一微秒。這使每個(gè)站點(diǎn)能夠跟蹤時(shí)間,并且當(dāng)它們與其他數(shù)據(jù)中心共享事件時(shí),每個(gè)事件的順序已經(jīng)正確。

時(shí)間同步越精確,應(yīng)用程序的性能就越快。最近的一項(xiàng)測試表明,使計(jì)時(shí) 80x 更精確(使任何時(shí)間差異減小 80x )使分布式數(shù)據(jù)庫的運(yùn)行速度提高了 3 倍——在相同的服務(wù)器硬件上,這是一個(gè)令人難以置信的性能提升,只是因?yàn)楸3至烁鼫?zhǔn)確、更可靠的時(shí)間。

NIC 和網(wǎng)絡(luò)在時(shí)間同步中的作用

OCP TAP 項(xiàng)目(以及 Facebook 的 博文 關(guān)于開源 Time Appliance )精確定義了時(shí)間卡如何接收和處理來自 GPS 衛(wèi)星網(wǎng)絡(luò)的時(shí)間信號(hào),即使衛(wèi)星信號(hào)暫時(shí)不可用也保持準(zhǔn)確的時(shí)間,并與時(shí)間服務(wù)器共享準(zhǔn)確的時(shí)間。但是網(wǎng)絡(luò)——以及使用的網(wǎng)卡——也至關(guān)重要。

pYYBAGJX3EqAfTu7AABfK25ykME623.png

圖 1 。 OCP 時(shí)間卡保持準(zhǔn)確的時(shí)間,并與支持 PPS 輸入/輸出的 NIC 共享,如 NVIDIA ConnectX-6 Dx (來源: Facebook 工程博客)。時(shí)間設(shè)備中的 NIC 必須具有每秒時(shí)間脈沖( PPS )端口才能連接到時(shí)間卡。這確保了每個(gè)時(shí)間服務(wù)器中的時(shí)間卡和 NIC 之間的精確時(shí)間同步,精確到幾納秒以內(nèi)。 ConnectX-6 Dx 是第一個(gè)支持此功能的現(xiàn)代 25 / 50 / 100 / 200 Gb / s NIC 之一。它還過濾和檢查傳入的 PPS 信號(hào),并使用其 ASIC 中的硬件在內(nèi)部維護(hù)時(shí)間,以確保準(zhǔn)確性和一致性。

時(shí)間設(shè)備中的網(wǎng)卡必須有一個(gè)用于連接Time Card的每秒時(shí)間脈沖(PPS)端口。這能確保每個(gè)時(shí)間服務(wù)器中Time Card和網(wǎng)卡之間的精確時(shí)間同步(精確到幾納秒之內(nèi))。ConnectX-6 Dx是首批支持此功能的現(xiàn)代25/50/100/200Gb/s網(wǎng)卡之一。它還能過濾和檢查傳入的PPS信號(hào),并使用其ASIC中的硬件在內(nèi)部維護(hù)時(shí)間,從而確保精確性和一致性。

計(jì)時(shí)精度達(dá)到次微秒級(jí)的時(shí)間裝置可以與數(shù)百個(gè)使用網(wǎng)絡(luò)時(shí)間協(xié)議(NTP)的普通服務(wù)器或數(shù)萬個(gè)使用精確時(shí)間協(xié)議(PTP)的服務(wù)器共享該計(jì)時(shí)。由于網(wǎng)絡(luò)會(huì)增加時(shí)間信號(hào)的延遲,因此NTP和PTP通過為數(shù)據(jù)包添加時(shí)間戳來測量兩個(gè)方向的傳輸時(shí)間、將抖動(dòng)和延遲考慮在內(nèi)并計(jì)算出每個(gè)服務(wù)器上的正確時(shí)間(PTP的精度更高,因此它開始取代NTP協(xié)議)。

pYYBAGJX3FCAUmsMAAIvOXhw6Mk117.png

圖 2 。 NVIDIA 將 X-6 Dx 與 PPS 輸入/輸出端口連接,以實(shí)現(xiàn)與時(shí)間卡的直接時(shí)間同步。它還對(duì)硬件中的數(shù)據(jù)包執(zhí)行精確的硬件時(shí)間戳。

另一種方法是使用軟件解決方案來添加時(shí)間戳,但在由于擁堵或CPU的干擾,用軟件添加時(shí)間戳的誤差可能達(dá)到幾毫秒,因此以今天的軟件方案添加時(shí)間戳是過于難預(yù)測、不精確、甚至是不可行的。相反,ConnectX-6 Dx網(wǎng)卡和BlueField-2 DPU可以在高達(dá)100Gb/s的速度下,在接收的數(shù)據(jù)包到達(dá)后和發(fā)送的數(shù)據(jù)包進(jìn)入網(wǎng)絡(luò)前,立即為它們添加硬件時(shí)間戳。ConnectX-6 Dx可以為每一個(gè)數(shù)據(jù)包添加時(shí)間戳,即使在網(wǎng)絡(luò)負(fù)載極大的情況下,時(shí)間戳的精度誤差也小于4納秒(4ns)。其他大多數(shù)具有時(shí)間功能的網(wǎng)卡只對(duì)部分?jǐn)?shù)據(jù)包進(jìn)行標(biāo)記并且精度抖動(dòng)很大,因此在網(wǎng)絡(luò)流量大的情況下,它們的時(shí)間精確性就會(huì)下降。

NVIDIA網(wǎng)絡(luò)解決方案為商用網(wǎng)卡提供最精確的延遲測量,從而在所有服務(wù)器上實(shí)現(xiàn)最精確的時(shí)間,應(yīng)用層面的時(shí)間誤差通常低于一微秒(《1us)。網(wǎng)絡(luò)計(jì)時(shí)精度的提升意味著每臺(tái)服務(wù)器上的時(shí)間變得更加精確,這將為分布式應(yīng)用帶來更快的性能(并且為每個(gè)人帶來更多的Facebook“點(diǎn)贊數(shù)”)。

poYBAGJX3FaAJuqtAAGfry8U3G4267.png

圖 3 。使用 OCP 時(shí)間服務(wù)器和 NVIDIA NIC 或 DPU s 部署 NTP 或 PTP 可將極其準(zhǔn)確的時(shí)間傳播到數(shù)據(jù)中心的所有服務(wù)器。

精確時(shí)間同步,人人皆可受益

OCP時(shí)間設(shè)備項(xiàng)目使任何組織都能獲得精準(zhǔn)的計(jì)時(shí)功能。來自Facebook、NVIDIA和OCP的開源時(shí)間服務(wù)器和開源管理工具提供了一個(gè)讓每個(gè)人都可以像超大規(guī)模用戶一樣輕松使用這項(xiàng)功能的方法。

NVIDIA所提供的精確時(shí)間功能網(wǎng)卡和DPU(數(shù)據(jù)處理器)具有精確計(jì)時(shí)設(shè)備所需的超精確時(shí)間戳和網(wǎng)絡(luò)同步功能。當(dāng)使用BlueField DPU時(shí),就可以在其Arm核上運(yùn)行PTP棧,從而將時(shí)間棧與其他服務(wù)器軟件隔離、持續(xù)驗(yàn)證該服務(wù)器內(nèi)的時(shí)間精確性并持續(xù)計(jì)算整個(gè)數(shù)據(jù)中心的最大時(shí)間誤差范圍。

為了發(fā)揮經(jīng)過優(yōu)化的時(shí)間服務(wù)器和時(shí)間同步所帶來的優(yōu)勢(shì),云服務(wù)和數(shù)據(jù)庫已經(jīng)增加了基于時(shí)間的新命令和API。這些解決方案一同開啟了精確計(jì)時(shí)的新時(shí)代,提高了分布式應(yīng)用的性能并為云和企業(yè)帶來新型解決方案。

關(guān)于作者

John Kim 是 NVIDIA 網(wǎng)絡(luò)事業(yè)部的存儲(chǔ)市場總監(jiān),致力于幫助客戶和供應(yīng)商從高性能網(wǎng)絡(luò)連接、智能網(wǎng)卡卸載和遠(yuǎn)程直接數(shù)據(jù)存取 (RDMA) 中獲益,尤其是在存儲(chǔ)、大數(shù)據(jù)和人工智能領(lǐng)域。

Elad Wind 目前擔(dān)任解決方案工程總監(jiān),推動(dòng) Hyperscaler 采用 NVIDIA 互連解決方案。在加入 NVIDIA 之前, Elad 曾在 Mellanox 擔(dān)任各種技術(shù)和銷售職務(wù),包括產(chǎn)品銷售和項(xiàng)目管理。 Elad 也是 Mellanox 新加坡亞太區(qū)總部的創(chuàng)始成員。 ELAD 持有特拉維夫大學(xué) MBA 和巴黎 ESSEC 商學(xué)院,并獲得了來自 Technion 、以色列的 Eel CTR 工程的理學(xué)學(xué)士學(xué)位。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5075

    瀏覽量

    103526
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9296

    瀏覽量

    85857
  • 人工智能
    +關(guān)注

    關(guān)注

    1794

    文章

    47641

    瀏覽量

    239612
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    運(yùn)營商如何實(shí)現(xiàn)差異化連接

    如今,運(yùn)營商正置身于一場關(guān)于如何極致釋放5G投資的高難度挑戰(zhàn)。本期《信觀察》將聚焦于如何通過“差異化連接”推動(dòng)基于性能的服務(wù),進(jìn)而實(shí)現(xiàn)可擴(kuò)展、可持續(xù)的解決方案,助力運(yùn)營商將5G投資的價(jià)值“最大化”。
    的頭像 發(fā)表于 11-18 14:38 ?902次閱讀

    需要合理規(guī)劃數(shù)據(jù)中心不能盲目建設(shè)

    的資源,把現(xiàn)有閑置的服務(wù)器等資源整合起來,建立虛擬的數(shù)據(jù)中心,但是現(xiàn)在的運(yùn)營商卻大肆的購買新設(shè)備,建立大量密集的數(shù)據(jù)中心。原來的服務(wù)器資源有很多是放到那用不到的,為了更好的利用這些資源,才出現(xiàn)了云計(jì)算這種技術(shù)
    的頭像 發(fā)表于 08-21 11:11 ?366次閱讀

    數(shù)據(jù)中心在5G網(wǎng)絡(luò)中的演進(jìn)與發(fā)展

    幾十年來,數(shù)據(jù)中心一直位于或靠近網(wǎng)絡(luò)中心。對(duì)于企業(yè)、電信運(yùn)營商、有線電視運(yùn)營商以及近來的Google和Facebook等服務(wù)提供而言,
    的頭像 發(fā)表于 08-16 16:02 ?456次閱讀

    智慧運(yùn)營中心如何實(shí)現(xiàn)運(yùn)維管理?

    智慧運(yùn)營中心 作為建筑物管理和運(yùn)營的關(guān)鍵樞紐,通過整合先進(jìn)的技術(shù)和數(shù)據(jù)分析手段,實(shí)現(xiàn)了對(duì)建筑設(shè)備和環(huán)境的全面監(jiān)測和智能化控制。在
    的頭像 發(fā)表于 06-24 15:29 ?507次閱讀
    智慧<b class='flag-5'>運(yùn)營</b><b class='flag-5'>中心</b>如何<b class='flag-5'>實(shí)現(xiàn)</b>運(yùn)維管理?

    數(shù)據(jù)中心布線標(biāo)準(zhǔn)有什么

    數(shù)據(jù)中心布線標(biāo)準(zhǔn)是現(xiàn)代IT基礎(chǔ)設(shè)施的基石。它們組織建立可靠和有效的網(wǎng)絡(luò)提供了指導(dǎo)方針和框架。了解這些標(biāo)準(zhǔn)對(duì)于尋求優(yōu)化其數(shù)據(jù)中心運(yùn)營和確保無縫連接的組織至關(guān)重要。 什么是
    的頭像 發(fā)表于 06-14 10:51 ?553次閱讀

    NVIDIA新工業(yè)革命打造 AI 工廠和數(shù)據(jù)中心

    搭載 Grace CPU 以及 NVIDIA 網(wǎng)絡(luò)和基礎(chǔ)設(shè)施,助力于企業(yè)建立 AI 工廠和數(shù)據(jù)中心,推動(dòng)新一輪生成式 AI 突破。 NVIDIA 創(chuàng)始人兼首席執(zhí)行官
    的頭像 發(fā)表于 06-03 18:14 ?1027次閱讀

    里瑞通在日本擴(kuò)大數(shù)據(jù)中心布局,打造NRT14支持AI部署

    全球知名的云和運(yùn)營商中立數(shù)據(jù)中心服務(wù)提供里瑞通(Digital Realty)近日宣布,其位于日本千葉縣印西市的NRT園區(qū)將迎來新的擴(kuò)建項(xiàng)目——NRT14數(shù)據(jù)中心。這座全新的
    的頭像 發(fā)表于 05-22 10:58 ?573次閱讀

    數(shù)據(jù)中心布線光纜設(shè)計(jì)方案

    ,對(duì)于保證數(shù)據(jù)中心的高效、穩(wěn)定運(yùn)行具有重要意義。 數(shù)據(jù)中心的布線光纜類型主要包括單模光纖和多模光纖。單模光纖具有很小的芯徑(一般9微米),只允許一種模式的光通過,因此可以實(shí)現(xiàn)更長距離
    的頭像 發(fā)表于 04-29 11:32 ?601次閱讀

    美國主流運(yùn)營商指南:美國運(yùn)營商認(rèn)證如何選擇?

    不管在中國還是在美國,無線通信市場的競爭都相當(dāng)激烈。中國主流主要是電信、移動(dòng)、聯(lián)通三大運(yùn)營商,而在美國市場也由幾家知名的主要運(yùn)營商主導(dǎo)。如果您的產(chǎn)品有出口美國市場銷售的需求,且產(chǎn)品本身帶有通信功能
    的頭像 發(fā)表于 04-23 17:07 ?924次閱讀
    美國主流<b class='flag-5'>運(yùn)營商</b>指南:美國<b class='flag-5'>運(yùn)營商</b>認(rèn)證如何選擇?

    #mpo極性 #數(shù)據(jù)中心mpo

    數(shù)據(jù)中心MPO
    jf_51241005
    發(fā)布于 :2024年04月07日 10:05:13

    #mpo光纖跳線 #數(shù)據(jù)中心光纖跳線

    光纖數(shù)據(jù)中心
    jf_51241005
    發(fā)布于 :2024年03月22日 10:18:31

    #MPO預(yù)端接 #數(shù)據(jù)中心機(jī)房 #機(jī)房布線

    數(shù)據(jù)中心MPO
    jf_51241005
    發(fā)布于 :2024年03月01日 11:12:47

    #永久鏈路 #信道測試 #數(shù)據(jù)中心

    數(shù)據(jù)中心
    jf_51241005
    發(fā)布于 :2024年02月23日 10:17:58

    第四大運(yùn)營商,攻擊前三大運(yùn)營商

    1&1稱其委托Aetha Consulting開展的研究發(fā)現(xiàn)德國前三大移動(dòng)運(yùn)營商相比歐洲其他有四家移動(dòng)運(yùn)營商的國家的排名前三的運(yùn)營商的頻譜持有量,平均多出38 MHz的低頻段頻率,總計(jì)多出了幾乎120 MHz。
    的頭像 發(fā)表于 01-30 16:00 ?948次閱讀

    #緊套光纜 #松套光纜 #數(shù)據(jù)中心

    數(shù)據(jù)中心光纜
    jf_51241005
    發(fā)布于 :2024年01月26日 09:44:11