0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA RDMA網(wǎng)絡(luò)方案助力遠(yuǎn)端計(jì)算和存儲(chǔ)網(wǎng)絡(luò)優(yōu)化

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-01-04 14:45 ? 次閱讀

云原生數(shù)據(jù)庫 TDSQL-C (原 CynosDB,TDSQL for Cloud Native Database) 是騰訊云自研的新一代高性能高可用的企業(yè)級(jí)分布式云數(shù)據(jù)庫, TDSQL-C 使用 NVIDIA UCX RDMA 優(yōu)化了關(guān)鍵路徑系統(tǒng)性能,實(shí)現(xiàn)了超百萬級(jí) QPS 的高吞吐,128TB 海量分布式智能存儲(chǔ),保障了數(shù)據(jù)安全可靠。

云原生數(shù)據(jù)庫 TDSQL-C 實(shí)現(xiàn)高性能面臨挑戰(zhàn)

TDSQL-C 采用計(jì)算存儲(chǔ)分離的架構(gòu),可以快速進(jìn)行節(jié)點(diǎn)的擴(kuò)容,節(jié)點(diǎn)的遷移,但其引入的網(wǎng)絡(luò)開銷對(duì)實(shí)現(xiàn)高性能提出了更高的挑戰(zhàn)。因此需要采用軟件優(yōu)化與新硬件相結(jié)合,通過基于 SPDK 和 UCX RDMA 的零拷貝技術(shù),減少了操作系統(tǒng)上下文切換以及數(shù)據(jù)在用戶態(tài)和內(nèi)核態(tài)之間拷貝引起的性能損耗,進(jìn)一步優(yōu)化關(guān)鍵路徑的系統(tǒng)性能,降低請(qǐng)求延遲。

傳統(tǒng)的 TCP/IP 網(wǎng)絡(luò),存在以下幾個(gè)缺點(diǎn):應(yīng)用的 buffer 發(fā)送到對(duì)端,需要經(jīng)過多次拷貝,對(duì)端收到數(shù)據(jù)到接收到應(yīng)用的接收 buffer,也需要多次拷貝;應(yīng)用的 buffer 拷貝到 TCP/IP 的 buffer,需要從用戶態(tài)進(jìn)入到內(nèi)核態(tài),會(huì)有上下文切換;網(wǎng)絡(luò)協(xié)議棧完全由 CPU 執(zhí)行,耗費(fèi) CPU。

NVIDIA RDMA 網(wǎng)絡(luò)方案+ConnectX 系列網(wǎng)卡

“軟硬” 兼施,賦能數(shù)據(jù)庫業(yè)務(wù)持續(xù)發(fā)展

充分利用軟硬件資源做系統(tǒng)級(jí)別 Scale Out、Scale Up、 RDMA 等 Kernel ByPass 的低延時(shí)網(wǎng)絡(luò)基礎(chǔ)。以底層高性能硬件能力作為支柱,給騰訊云數(shù)據(jù)庫業(yè)務(wù)發(fā)展提供持續(xù)不斷的系統(tǒng)源動(dòng)力。

根據(jù)業(yè)務(wù)部門需求和服務(wù)器新產(chǎn)品導(dǎo)入團(tuán)隊(duì)多年來在 RDMA 技術(shù)上的沉淀, 推薦使用搭載 NVIDIA ConnectX 系列網(wǎng)卡的服務(wù)器,使用 NVIDIA RDMA 網(wǎng)絡(luò)方案來對(duì)數(shù)據(jù)庫場(chǎng)景進(jìn)行專項(xiàng)優(yōu)化,充分利用 RDMA 天然的性能優(yōu)勢(shì):

RDMA 技術(shù)是用戶空間進(jìn)程繞過內(nèi)核直接調(diào)用 RDMA 網(wǎng)卡,實(shí)現(xiàn)和遠(yuǎn)端進(jìn)程的高效快速通訊。RDMA 伴生于 InfiniBand 網(wǎng)絡(luò)技術(shù),由 IBTA 組織對(duì)其進(jìn)行標(biāo)準(zhǔn)化定義和維護(hù)。RDMA 技術(shù)優(yōu)勢(shì)可以解決 TCP 傳輸方式中的各種缺點(diǎn):

整個(gè)數(shù)據(jù)傳輸過程內(nèi)存零拷貝。

網(wǎng)絡(luò)傳輸完全卸載到網(wǎng)卡硬件,不占用 CPU 資源。

使用 RDMA 技術(shù)可以 100% 利用網(wǎng)絡(luò)帶寬。

整個(gè)數(shù)據(jù)傳輸過程由硬件完成,降低了系統(tǒng)延時(shí)。

NVIDIA RDMA 網(wǎng)絡(luò)方案

助力遠(yuǎn)端計(jì)算和存儲(chǔ)網(wǎng)絡(luò)優(yōu)化

NVIDIA RDMA 網(wǎng)絡(luò)方案搭在硬件上使遠(yuǎn)端計(jì)算和存儲(chǔ)網(wǎng)絡(luò)的優(yōu)化效果達(dá)到最優(yōu)。

在 RDMA 與 TCP 性能的關(guān)鍵指標(biāo)的對(duì)比測(cè)試中,RDMA 體現(xiàn)了其優(yōu)勢(shì)。例如從oplog msg 性能數(shù)據(jù)上看,RDMA 測(cè)延遲比 TCP 降低 71.7%,吞吐提高 43.2%;在 page 性能數(shù)據(jù)方面(page 大小為16KB),RDMA 測(cè)延遲比 TCP 降低 70.3%,吞吐提高 52.3%。

“騰訊云數(shù)據(jù)庫是騰訊服務(wù)的基礎(chǔ)架構(gòu),網(wǎng)絡(luò)的延遲和帶寬對(duì)于性能至關(guān)重要, RDMA 技術(shù)的 Kernel Bypass 和 CPU Offload 可以帶來極低的延遲和極高的帶寬。在 NVIDIA 網(wǎng)絡(luò)產(chǎn)品上部署的推薦系統(tǒng)將為騰訊用戶提供業(yè)界一流的性能,使用戶充分享受 RDMA 帶來的技術(shù)紅利。

—— 騰訊云數(shù)據(jù)庫TDSQL-C負(fù)責(zé)人

李志陽

“NVIDIA 作為 RDMA 技術(shù)的推動(dòng)者和領(lǐng)跑者,很高興看到這項(xiàng)技術(shù)在騰訊得到越來越廣泛的應(yīng)用,并正在從傳統(tǒng)的 HPC/AI 業(yè)務(wù)拓展到高性能存儲(chǔ)和數(shù)據(jù)庫領(lǐng)域。UCX 的使用大幅度提高了 RDMA 應(yīng)用的開發(fā)效率和吞吐率,并且使得 RoCE 跟客戶應(yīng)用能迅速整合,從而幫助客戶更快走向市場(chǎng),并提供差異化的云產(chǎn)品和服務(wù)。

——NVIDIA 副總裁Vadim Balahovski

了解更多 NVIDIA RDMA 網(wǎng)絡(luò)助力騰訊云數(shù)據(jù)庫突破性能瓶頸的案例信息,歡迎點(diǎn)擊“閱讀原文”。

NVIDIA DOCA 現(xiàn)已開放接受申請(qǐng),掃描下方海報(bào)二維碼,即可注冊(cè)加入,搶先體驗(yàn),走在技術(shù)前沿!

原文標(biāo)題:NVIDIA RDMA 網(wǎng)絡(luò)助力騰訊云數(shù)據(jù)庫突破性能瓶頸

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4990

    瀏覽量

    103118
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7570

    瀏覽量

    88833
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3807

    瀏覽量

    64427

原文標(biāo)題:NVIDIA RDMA 網(wǎng)絡(luò)助力騰訊云數(shù)據(jù)庫突破性能瓶頸

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Supermicro推出直接液冷優(yōu)化NVIDIA Blackwell解決方案

    【2024年11月22日,加州圣何塞、佐治亞州亞特蘭大及超級(jí)計(jì)算大會(huì)訊】Supermicro, Inc. (NASDAQ:SMCI) 為AI、云端、存儲(chǔ)和5G/邊緣領(lǐng)域的全方位IT解決方案提供企業(yè)
    發(fā)表于 11-25 10:39 ?358次閱讀
    Supermicro推出直接液冷<b class='flag-5'>優(yōu)化</b>的<b class='flag-5'>NVIDIA</b> Blackwell解決<b class='flag-5'>方案</b>

    如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)

    并從計(jì)算節(jié)點(diǎn)成本優(yōu)化、集群網(wǎng)絡(luò)與拓?fù)涞倪x擇等方面論述如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-06 16:03 ?367次閱讀
    如何構(gòu)建及<b class='flag-5'>優(yōu)化</b>GPU云<b class='flag-5'>網(wǎng)絡(luò)</b>

    如何優(yōu)化emc存儲(chǔ)性能

    在當(dāng)今的數(shù)據(jù)中心環(huán)境中,存儲(chǔ)性能對(duì)于業(yè)務(wù)連續(xù)性和數(shù)據(jù)訪問速度至關(guān)重要。EMC作為領(lǐng)先的存儲(chǔ)解決方案提供商,其產(chǎn)品線涵蓋了從入門級(jí)到企業(yè)級(jí)的存儲(chǔ)系統(tǒng)。然而,即使是最好的
    的頭像 發(fā)表于 11-01 15:57 ?300次閱讀

    NVIDIA助力xAI打造全球最大AI超級(jí)計(jì)算機(jī)

    NVIDIA 宣布,xAI 位于田納西州孟菲斯市的Colossus 超級(jí)計(jì)算機(jī)集群達(dá)到了 10 萬顆 NVIDIA Hopper GPU 的巨大規(guī)模。該集群使用了NVIDIA Spe
    的頭像 發(fā)表于 10-30 11:38 ?383次閱讀

    NVIDIA Colossus超級(jí)計(jì)算機(jī)集群突破10萬顆Hopper GPU

    的強(qiáng)大實(shí)力。 Colossus集群不僅規(guī)模龐大,更采用了NVIDIA Spectrum-X以太網(wǎng)網(wǎng)絡(luò)平臺(tái)。該平臺(tái)專為多租戶、超大規(guī)模的AI工廠打造,提供了卓越的RDMA(遠(yuǎn)程直接內(nèi)存訪問)網(wǎng)絡(luò)
    的頭像 發(fā)表于 10-30 10:29 ?303次閱讀

    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)

    市的 Colossus 超級(jí)計(jì)算機(jī)集群達(dá)到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡(luò)平臺(tái),該平臺(tái)
    發(fā)表于 10-30 09:33 ?157次閱讀
    <b class='flag-5'>NVIDIA</b> 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)<b class='flag-5'>計(jì)算</b>機(jī)

    以太網(wǎng)RDMA RoCE的技術(shù)局限

    上期我們講到了RDMA的WHY,WHAT & HOW(AI網(wǎng)絡(luò)背景下RDMA的Why,What & How),這一期我們來談一談RDMA的不足。
    的頭像 發(fā)表于 10-22 10:02 ?418次閱讀
    以太網(wǎng)<b class='flag-5'>RDMA</b> RoCE的技術(shù)局限

    基于RDMA技術(shù)的Mayastor解決方案

    1.? 方案背景和挑戰(zhàn) 1.1. Mayastor簡介 OpenEBS是一個(gè)廣受歡迎的開源云原生存儲(chǔ)解決方案,托管于CNCF(云原生計(jì)算基金會(huì))之下,旨在通過擴(kuò)展Kubernetes的
    的頭像 發(fā)表于 08-20 18:47 ?1270次閱讀
    基于<b class='flag-5'>RDMA</b>技術(shù)的Mayastor解決<b class='flag-5'>方案</b>

    神經(jīng)網(wǎng)絡(luò)優(yōu)化器有哪些

    神經(jīng)網(wǎng)絡(luò)優(yōu)化器是深度學(xué)習(xí)中用于調(diào)整網(wǎng)絡(luò)參數(shù)以最小化損失函數(shù)的重要工具。這些優(yōu)化器通過不同的策略來更新網(wǎng)絡(luò)權(quán)重,以提高訓(xùn)練效率和模型性能。以下
    的頭像 發(fā)表于 07-11 16:33 ?622次閱讀

    如何訓(xùn)練和優(yōu)化神經(jīng)網(wǎng)絡(luò)

    神經(jīng)網(wǎng)絡(luò)是人工智能領(lǐng)域的重要分支,廣泛應(yīng)用于圖像識(shí)別、自然語言處理、語音識(shí)別等多個(gè)領(lǐng)域。然而,要使神經(jīng)網(wǎng)絡(luò)在實(shí)際應(yīng)用中取得良好效果,必須進(jìn)行有效的訓(xùn)練和優(yōu)化。本文將從神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程
    的頭像 發(fā)表于 07-01 14:14 ?480次閱讀

    降本增效:NVIDIA路徑優(yōu)化引擎創(chuàng)下多項(xiàng)世界紀(jì)錄!

    NVIDIA cuOpt 路徑優(yōu)化引擎助力川崎重工實(shí)現(xiàn)鐵路安全,支持 SyncTwin 實(shí)現(xiàn)制造優(yōu)化
    的頭像 發(fā)表于 04-03 11:17 ?443次閱讀

    NVIDIA發(fā)布專為大規(guī)模AI量身訂制的全新網(wǎng)絡(luò)交換機(jī)-X800系列

    NVIDIA Quantum-X800 InfiniBand 網(wǎng)絡(luò)NVIDIA Spectrum?-X800 以太網(wǎng)絡(luò)是全球首批高達(dá) 800Gb/s 端到端吞吐量的
    的頭像 發(fā)表于 03-20 09:54 ?513次閱讀

    NVIDIA 發(fā)布全新交換機(jī),全面優(yōu)化萬億參數(shù)級(jí) GPU 計(jì)算和 AI 基礎(chǔ)設(shè)施

    NVIDIA Quantum-X800 InfiniBand 網(wǎng)絡(luò),打造性能最強(qiáng)大的 AI 專用基礎(chǔ)設(shè)施 NVIDIA Spectrum-X800 以太網(wǎng)絡(luò),數(shù)據(jù)中心必備的
    發(fā)表于 03-19 10:05 ?345次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全新交換機(jī),全面<b class='flag-5'>優(yōu)化</b>萬億參數(shù)級(jí) GPU <b class='flag-5'>計(jì)算</b>和 AI 基礎(chǔ)設(shè)施

    網(wǎng)絡(luò)存儲(chǔ)技術(shù)有哪三種 網(wǎng)絡(luò)存儲(chǔ)技術(shù)包括哪些

    Attached Storage,簡稱NAS) NAS是一種基于網(wǎng)絡(luò)存儲(chǔ)設(shè)備,通過局域網(wǎng)或廣域網(wǎng)連接計(jì)算機(jī),提供文件級(jí)別的存儲(chǔ)服務(wù)。NAS可以看作是一個(gè)獨(dú)立的
    的頭像 發(fā)表于 02-03 11:15 ?2837次閱讀

    RDMA RNIC虛擬化方案

    遠(yuǎn)程直接內(nèi)存訪問(Remote Direct Memory Access,RDMA)技術(shù)允許應(yīng)用程序繞過操作系統(tǒng)內(nèi)核,以零拷貝的方式和遠(yuǎn)程計(jì)算機(jī)進(jìn)行網(wǎng)絡(luò)通信,具有低延遲和高帶寬的優(yōu)勢(shì)。RDMA
    的頭像 發(fā)表于 01-23 17:23 ?2009次閱讀
    <b class='flag-5'>RDMA</b> RNIC虛擬化<b class='flag-5'>方案</b>