0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA ConnectX網(wǎng)卡助力社交網(wǎng)絡(luò)關(guān)鍵任務(wù)的分布式應(yīng)用

世強SEKORM ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2021-08-23 11:18 ? 次閱讀

NVIDIA ConnectX 網(wǎng)卡助力社交網(wǎng)絡(luò)關(guān)鍵任務(wù)的分布式應(yīng)用實現(xiàn)精確計時功能。

Facebook 正在開放其開源計算項目 —— 時間設(shè)備項目(OCP TAP)的源代碼,該項目以經(jīng)濟高效的方式提供高度精確的計時功能,以及跨數(shù)據(jù)中心時間同步功能。在 NVIDIA ConnectX-6 Dx 網(wǎng)卡(NIC)的支持下,這項解決方案中的 Time Card 通過精確計時協(xié)議,可以將幾乎所有商用現(xiàn)成的(COTS)服務(wù)器變成精確的計時設(shè)備,與整個數(shù)據(jù)中心內(nèi)的其他服務(wù)器共享精確計時。

Facebook Time Card 和 NVIDIA 網(wǎng)卡這對組合為數(shù)據(jù)中心運營商提供了一個先進和低成本的時間同步解決方案,并且該解決方案具有開源、安全、可靠和可擴展等特點。

精確的時間為什么對于數(shù)據(jù)中心至關(guān)重要

隨著應(yīng)用的擴展并且 IT 運營遍布全球,保持數(shù)據(jù)中心內(nèi)不同服務(wù)器,或位于各大洲不同數(shù)據(jù)中心的數(shù)據(jù)同步,變得更加重要和困難。

分布式數(shù)據(jù)庫必須追蹤事件的確切順序以保持一致性并顯示因果關(guān)系。如果有兩個人試圖購買同一只股票,那么根據(jù)公平性(和合規(guī)性)原則,就必須知道買單的先后順序。同樣,當每小時有上千萬人發(fā)布內(nèi)容,數(shù)百萬用戶喜歡/稱贊/喜愛這些帖子時,F(xiàn)acebook 必須知道每個帖子、每次點贊、每條回復(fù)或每個表情符號的實際發(fā)生順序。

保持數(shù)據(jù)同步的方法之一是讓每個數(shù)據(jù)中心在每件事務(wù)操作完成后向其他中心發(fā)送更新,但由于數(shù)據(jù)中心之間的延遲太高,以至于無法支持每小時數(shù)百萬個事件,這種做法很快就變得無法維持。

更好的方法是讓每個服務(wù)器和數(shù)據(jù)中心同步到精確的時間,使彼此之間的時間誤差不超過一微秒。這樣每個站點都能追蹤時間,并且當它們與其他數(shù)據(jù)中心共享事件時,能夠正確排序每個事件。

時間同步越精確,應(yīng)用性能就越快。最近的一項測試表明,將計時精度提高 80 倍(將任何時間差異減小 80 倍)能夠使分布式數(shù)據(jù)庫的運行速度提高 3 倍。在相同的服務(wù)器硬件上僅僅通過提高更精確和更可靠的時間就能實現(xiàn)顯著的性能提升。

網(wǎng)卡和網(wǎng)絡(luò)在時間同步中的作用

OCP TAP 項目(以及 Facebook 關(guān)于開源時間設(shè)備的博客文章)確切地定義了 Time Card 如何接收和處理來自 GPS 衛(wèi)星網(wǎng)絡(luò)的時間信號,即使在衛(wèi)星信號暫時不可用時,也能保持精確的時間并與時間服務(wù)器共享這一精確的時間。同時,網(wǎng)絡(luò)以及所使用的網(wǎng)卡也發(fā)揮著至關(guān)重要的作用。

時間設(shè)備中的網(wǎng)卡必須有一個用于連接 Time Card 的每秒時間脈沖(PPS)端口。這能確保每個時間服務(wù)器中 Time Card 和網(wǎng)卡之間的精確時間同步(精確到幾納秒之內(nèi))。ConnectX-6 Dx 是首批支持此功能的現(xiàn)代 25/50/100/200Gb/s網(wǎng)卡之一。它還能過濾和檢查傳入的 PPS 信號,并使用其 ASIC 中的硬件在內(nèi)部維護時間,從而確保精確性和一致性。

計時精度達到次微秒級的時間裝置可以與數(shù)百個使用網(wǎng)絡(luò)時間協(xié)議(NTP)的普通服務(wù)器或數(shù)萬個使用精確時間協(xié)議(PTP)的服務(wù)器共享該計時。由于網(wǎng)絡(luò)會增加時間信號的延遲,因此 NTP 和 PTP 通過為數(shù)據(jù)包添加時間戳來測量兩個方向的傳輸時間、將抖動和延遲考慮在內(nèi)并計算出每個服務(wù)器上的正確時間(PTP 的精度更高,因此它開始取代 NTP 協(xié)議)。

另一種方法是使用軟件解決方案來添加時間戳,但在由于擁堵或 CPU 的干擾,用軟件添加時間戳的誤差可能達到幾毫秒,因此以今天的軟件方案添加時間戳是過于難預(yù)測、不精確、甚至是不可行的。

相反,ConnectX-6 Dx 網(wǎng)卡和 BlueField-2 DPU 可以在高達 100Gb/s的速度下,在接收的數(shù)據(jù)包到達后和發(fā)送的數(shù)據(jù)包進入網(wǎng)絡(luò)前,立即為它們添加硬件時間戳。ConnectX-6 Dx 可以為每一個數(shù)據(jù)包添加時間戳,即使在網(wǎng)絡(luò)負載極大的情況下,時間戳的精度誤差也小于 4 納秒(4ns)。

其他大多數(shù)具有時間功能的網(wǎng)卡只對部分數(shù)據(jù)包進行標記并且精度抖動很大,因此在網(wǎng)絡(luò)流量大的情況下,它們的時間精確性就會下降。

NVIDIA 網(wǎng)絡(luò)解決方案為商用網(wǎng)卡提供最精確的延遲測量,從而在所有服務(wù)器上實現(xiàn)最精確的時間,應(yīng)用層面的時間誤差通常低于一微秒(《1us)。

網(wǎng)絡(luò)計時精度的提升意味著每臺服務(wù)器上的時間變得更加精確,這將為分布式應(yīng)用帶來更快的性能(并且為每個人帶來更多的 Facebook “點贊數(shù)”)。

精確時間同步,人人皆可受益

OCP 時間設(shè)備項目使任何組織都能獲得精準的計時功能。來自 Facebook、NVIDIA 和 OCP 的開源時間服務(wù)器和開源管理工具提供了一個讓每個人都可以像超大規(guī)模用戶一樣輕松使用這項功能的方法。

NVIDIA 所提供的精確時間功能網(wǎng)卡和 DPU(數(shù)據(jù)處理器)具有精確計時設(shè)備所需的超精確時間戳和網(wǎng)絡(luò)同步功能。當使用 BlueField DPU 時,就可以在其 Arm 核上運行 PTP 棧,從而將時間棧與其他服務(wù)器軟件隔離、持續(xù)驗證該服務(wù)器內(nèi)的時間精確性并持續(xù)計算整個數(shù)據(jù)中心的最大時間誤差范圍。

為了發(fā)揮經(jīng)過優(yōu)化的時間服務(wù)器和時間同步所帶來的優(yōu)勢,云服務(wù)和數(shù)據(jù)庫已經(jīng)增加了基于時間的新命令和 API。這些解決方案一同開啟了精確計時的新時代,提高了分布式應(yīng)用的性能并為云和企業(yè)帶來新型解決方案。

關(guān)于 OCP TAP 的技術(shù)規(guī)格、原理圖、機械原理、物料清單和源代碼等詳細信息,歡迎訪問:http://www.ocptap.com。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5055

    瀏覽量

    103372
  • 網(wǎng)卡
    +關(guān)注

    關(guān)注

    4

    文章

    313

    瀏覽量

    27412
  • 源代碼
    +關(guān)注

    關(guān)注

    96

    文章

    2946

    瀏覽量

    66835
  • OCP
    OCP
    +關(guān)注

    關(guān)注

    0

    文章

    80

    瀏覽量

    16457

原文標題:NVIDIA 助力 Facebook 新一代計時系統(tǒng)實現(xiàn)精確計時

文章出處:【微信號:sekorm_info,微信公眾號:世強SEKORM】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    分布式云化數(shù)據(jù)庫有哪些類型

    分布式云化數(shù)據(jù)庫有哪些類型?分布式云化數(shù)據(jù)庫主要類型包括:關(guān)系型分布式數(shù)據(jù)庫、非關(guān)系型分布式數(shù)據(jù)庫、新SQL分布式數(shù)據(jù)庫、以列方式存儲數(shù)據(jù)、
    的頭像 發(fā)表于 01-15 09:43 ?55次閱讀

    基于ptp的分布式系統(tǒng)設(shè)計

    在現(xiàn)代分布式系統(tǒng)中,精確的時間同步對于確保數(shù)據(jù)一致性、系統(tǒng)穩(wěn)定性和性能至關(guān)重要。PTP(Precision Time Protocol)是一種網(wǎng)絡(luò)協(xié)議,用于在分布式系統(tǒng)中實現(xiàn)高精度的時間同步
    的頭像 發(fā)表于 12-29 10:09 ?140次閱讀

    京準電鐘:NTP網(wǎng)絡(luò)授時服務(wù)器在分布式網(wǎng)絡(luò)內(nèi)的應(yīng)用

    京準電鐘:NTP網(wǎng)絡(luò)授時服務(wù)器在分布式網(wǎng)絡(luò)內(nèi)的應(yīng)用
    的頭像 發(fā)表于 11-27 16:09 ?187次閱讀
    京準電鐘:NTP<b class='flag-5'>網(wǎng)絡(luò)</b>授時服務(wù)器在<b class='flag-5'>分布式</b><b class='flag-5'>網(wǎng)絡(luò)</b>內(nèi)的應(yīng)用

    分布式光纖測溫解決方案

    分布式光纖測溫解決方案
    的頭像 發(fā)表于 11-12 01:02 ?194次閱讀
    <b class='flag-5'>分布式</b>光纖測溫解決方案

    WDS分布式存儲系統(tǒng)軟件助力電信工程海量數(shù)據(jù)存儲項目

    WDS分布式存儲系統(tǒng)軟件助力電信工程海量數(shù)據(jù)存儲項目
    的頭像 發(fā)表于 11-11 09:59 ?222次閱讀
    WDS<b class='flag-5'>分布式</b>存儲系統(tǒng)軟件<b class='flag-5'>助力</b>電信工程海量數(shù)據(jù)存儲項目

    分布式輸電線路故障定位中的分布式是指什么

    的全面覆蓋。這些監(jiān)測點之間通過無線網(wǎng)絡(luò)進行數(shù)據(jù)互聯(lián),形成一個分布式的監(jiān)測系統(tǒng); 三相覆蓋:對于三相輸電線路,分布式故障定位系統(tǒng)會在每相上都安裝相應(yīng)的監(jiān)測裝置,以實現(xiàn)對三相導(dǎo)線的全面監(jiān)控。 二、技術(shù)特點 行波測距
    的頭像 發(fā)表于 10-16 11:39 ?313次閱讀
    <b class='flag-5'>分布式</b>輸電線路故障定位中的<b class='flag-5'>分布式</b>是指什么

    分布式電源分配網(wǎng)絡(luò)建模及去耦設(shè)計研究

    電子發(fā)燒友網(wǎng)站提供《分布式電源分配網(wǎng)絡(luò)建模及去耦設(shè)計研究.pdf》資料免費下載
    發(fā)表于 09-19 17:42 ?0次下載

    基于分布式存儲WDS的金融信創(chuàng)云承載數(shù)據(jù)庫類關(guān)鍵應(yīng)用

    基于分布式存儲WDS的金融信創(chuàng)云承載數(shù)據(jù)庫類關(guān)鍵應(yīng)用
    的頭像 發(fā)表于 08-16 09:42 ?297次閱讀
    基于<b class='flag-5'>分布式</b>存儲WDS的金融信創(chuàng)云承載數(shù)據(jù)庫類<b class='flag-5'>關(guān)鍵</b>應(yīng)用

    基于分布式計算的AR光波導(dǎo)中測試圖像的仿真

    各種迭代分發(fā)到網(wǎng)絡(luò)中的計算機上。為了啟用分布式計算,只需導(dǎo)航到相應(yīng)的選項卡,并配置可用的計算機和客戶端的數(shù)量。然后像往常一樣開始模擬,將數(shù)據(jù)傳輸?shù)娇蛻舳撕徒Y(jié)果的收集將自動完成(與本地執(zhí)行的參數(shù)掃描
    發(fā)表于 08-07 14:13

    面向企業(yè)關(guān)鍵業(yè)務(wù)場景的分布式存儲軟件ExponTech WDS

    面向企業(yè)關(guān)鍵業(yè)務(wù)場景的分布式存儲軟件ExponTech WDS
    的頭像 發(fā)表于 06-05 09:41 ?351次閱讀
    面向企業(yè)<b class='flag-5'>關(guān)鍵</b>業(yè)務(wù)場景的<b class='flag-5'>分布式</b>存儲軟件ExponTech WDS

    鴻蒙開發(fā)【分布式任務(wù)調(diào)度】解析

    1.FA 遷移可以打通設(shè)備間的壁壘,有助于不同能力的設(shè)備進行互助。前文以一個簡單的例子介紹如何通過分布式任務(wù)調(diào)度提供的能力,實現(xiàn) FA 跨設(shè)備的遷移(包括 FA 啟動及狀態(tài)數(shù)據(jù)的同步)。 2.FA
    的頭像 發(fā)表于 01-29 18:03 ?745次閱讀

    鴻蒙OS 分布式任務(wù)調(diào)度

    鴻蒙OS 分布式任務(wù)調(diào)度概述 在 HarmonyO S中,分布式任務(wù)調(diào)度平臺對搭載 HarmonyOS 的多設(shè)備構(gòu)筑的“超級虛擬終端”提供統(tǒng)一的組件管理能力,為應(yīng)用定義統(tǒng)一的能力基線、
    的頭像 發(fā)表于 01-29 16:50 ?535次閱讀

    分布式大屏控制系統(tǒng)對網(wǎng)絡(luò)環(huán)境的要求

    分布式大屏控制系統(tǒng)對網(wǎng)絡(luò)環(huán)境的要求較高,主要是因為該系統(tǒng)需要實時傳輸大量的視頻信號數(shù)據(jù),以保證多個顯示屏幕的同步顯示。以下是幾個關(guān)鍵網(wǎng)絡(luò)環(huán)境要求: 高帶寬:
    的頭像 發(fā)表于 01-29 14:52 ?606次閱讀

    訊維分布式大屏控制系統(tǒng)的關(guān)鍵技術(shù)

    訊維分布式大屏控制系統(tǒng)的關(guān)鍵技術(shù)包括以下幾個方面: 分布式架構(gòu):該系統(tǒng)基于純IP化網(wǎng)絡(luò)傳輸架構(gòu),去中心化,只需分布式節(jié)點、
    的頭像 發(fā)表于 01-29 14:23 ?456次閱讀

    設(shè)計高效分布式智慧終端系統(tǒng)的關(guān)鍵要素

    設(shè)計高效分布式智慧終端系統(tǒng)的關(guān)鍵要素包括以下幾個方面: 安全性 :安全性是設(shè)計分布式智慧終端系統(tǒng)的首要考慮因素。由于終端系統(tǒng)涉及到多個節(jié)點和用戶的數(shù)據(jù),因此必須采取有效的安全措施來保護數(shù)據(jù)的安全性
    的頭像 發(fā)表于 01-24 14:52 ?374次閱讀