0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA GPU加速計(jì)算之路

454398 ? 來(lái)源:愛(ài)活網(wǎng) ? 作者:penylo ? 2019-12-23 09:12 ? 次閱讀

NVIDIA從提出GPU以及CUDA核心開始,NVIDIA便開始逐步邁出游戲圈,不斷向全新的計(jì)算領(lǐng)域發(fā)起攻勢(shì)。時(shí)至今日,NVIDIA GPU計(jì)算從機(jī)器人、自動(dòng)駕駛,一路擴(kuò)展到云計(jì)算、醫(yī)療甚至是NASA火星登錄計(jì)劃。

是的,正如GTC CHINA 2019上,NVIDIA創(chuàng)始人兼CEO黃仁勛所言,就算摩爾定律走向終結(jié),GPU加速計(jì)算將有機(jī)會(huì)成為未來(lái)的發(fā)展方向,GPU正在變得無(wú)所不能,也將無(wú)處不在。

云游戲與光線追蹤全面開花以游戲發(fā)家的NVIDIA開場(chǎng)少不了游戲的戲份。開場(chǎng)黃仁勛便展示了《我的世界》RTX版本,這也是GTC主題演講上首次展示《我的世界》RTX視頻。

通過(guò)對(duì)光影的添加,這款沙盤化的游戲有了全新的演繹,不僅水面變得更為真實(shí),隨著視角、天氣、時(shí)間變化,光影也呈現(xiàn)出不同的效果。

這套實(shí)時(shí)光纖追蹤技術(shù)可以讓開發(fā)者在添加光源之后,依靠GeForce RTX顯卡中的RT Core演算出光線路徑,從而獲得自然的光線效果,同時(shí)也減輕了游戲開發(fā)者手動(dòng)考慮光影貼圖的繁瑣工作。

除了《我的世界》增加的光線追蹤特效,GTC上黃仁勛還宣布了六款游戲正引入光線追蹤,包括《邊境》(Boundary)、《鈴蘭計(jì)劃》(Convallaria)、《暗影火炬》(F.I.S.T.)、Project X(項(xiàng)目代號(hào))、《無(wú)限法則》(Ring of Elysium)以及《軒轅劍柒》(Xuan-Yuan Sword VII)。

同時(shí)老黃還特意在臺(tái)上演示了《光明記憶:無(wú)限》的光線追蹤DEMO。重點(diǎn)在于負(fù)責(zé)《光明記憶》的飛燕群島個(gè)人工作室主力僅有一人,通過(guò)一人之力完成美術(shù)、程序以及最新的光線追蹤技術(shù)功能,也足以見(jiàn)得虛幻引擎對(duì)光線追蹤已經(jīng)提供了相當(dāng)優(yōu)秀的支持,可以更為輕松調(diào)用GeForce RTX的光線追蹤功能。

此外,目前宣布支持光線追蹤游戲陣營(yíng)包括:《光明記憶:無(wú)限》(Bright Memory: Infinite)、《賽博朋克2077》(Cyberpunk 2077)、《消逝的光芒2》(Dying Light 2)、《我的世界》(Minecraft)、《逆水寒》(Justice)、《劍俠情緣叁網(wǎng)絡(luò)版》(JX3 Online)、《重生邊緣》(SYNCED: Off-Planet)、《仙劍奇?zhèn)b傳七》(Sword And Fairy 7)、《看門狗:軍團(tuán)》《Watch Dogs: Legion》以及《吸血鬼:避世血族2》 (Vampire: The Masquerade – Bloodlines 2)。

在推進(jìn)光線追蹤技術(shù)進(jìn)駐預(yù)習(xí)的同時(shí),NVIDIA與騰訊游戲合作的START云游戲服務(wù)也進(jìn)入了測(cè)試階段。

類似NVIDIA在北美和歐洲推出的GeForce NOW云游戲服務(wù),騰訊START可以讓玩家在在配置不足的設(shè)備上也能玩AAA游戲。騰訊游戲計(jì)劃將擴(kuò)展其云游戲產(chǎn)品。

NVIDIA與騰訊還將成立一個(gè)一個(gè)游戲聯(lián)合創(chuàng)新實(shí)驗(yàn)室。雙方將共同探索AI在游戲、游戲引擎優(yōu)化和新光照技術(shù)(包括光線追蹤和光線烘焙)中的新應(yīng)用。借著START服務(wù)東風(fēng),英偉達(dá)的云游戲技術(shù)也終于可以在國(guó)內(nèi)付諸實(shí)踐。

RTX Studio加速內(nèi)容創(chuàng)作顯卡性能也早已不局限在游戲中,英偉達(dá)針對(duì)RTX Studio的產(chǎn)品線覆蓋也已經(jīng)從GeForce RTX 2060筆記本覆蓋到8路Quadro RTX 8000工作站。在加上NVIDIA OMNIVERSE所提供的3D制作流程的協(xié)作平臺(tái),創(chuàng)作者可以通過(guò)不同的分工協(xié)同工作。

現(xiàn)在NVIDIA OMNIVERSE也已經(jīng)正式進(jìn)駐建筑行業(yè)AEC,可以做到無(wú)論本地還是云端,主流應(yīng)用都能依靠NVIDIA RTX展開建模、著色、動(dòng)畫、視覺(jué)效果等等。在演講臺(tái)上,老黃也豪氣的演示如何利用8 路 RTX 8000 的 RTX 服務(wù)器對(duì)深圳華潤(rùn)大廈實(shí)時(shí)渲染。

在電影、視覺(jué)特效領(lǐng)域,瑞云云端渲染平臺(tái)也宣布配備NVIDIA RTX GPU。瑞云目前是全亞洲最大的云渲染平臺(tái),2019年火爆的《戰(zhàn)狼2》、《哪吒》、《流浪地球》渲染均來(lái)自瑞云,超過(guò)85%的中國(guó)電影工作室都是瑞云的客戶。很快,首批5000片RTX GPU也將會(huì)在2020年上線。

在現(xiàn)場(chǎng),黃仁勛也不忘搬出那句經(jīng)典臺(tái)詞:“買的越多,省得越多?!贬槍?duì)渲染工作,RTX GPU能夠做到速度比CPU快12倍,價(jià)格低7倍。原本CPU上需要花費(fèi)485個(gè)小時(shí)的渲染場(chǎng)景,交給RTX GPU現(xiàn)在可能只需要40個(gè)小時(shí)就能完成。

讓未來(lái)所見(jiàn)所得跳出大家耳熟能詳?shù)挠螒?、渲染領(lǐng)域,NVIDIA也已經(jīng)將視野放向了外太空。NASA計(jì)劃在2030年將6位宇航員送向火星,著陸器將以12000千米/小時(shí)的速度進(jìn)入火星大氣層,而且必須精確點(diǎn)火減速并在6分鐘內(nèi)降落在火星表面。

為此NASA借助NVIDIA GPU通過(guò)FUN3D流體李璇軟件進(jìn)行了數(shù)十萬(wàn)次火星著陸場(chǎng)景模擬,將產(chǎn)生的150TB數(shù)據(jù)變成了可視化,現(xiàn)在,NVIDIA DGX-2上已經(jīng)可以借助Magnum IO GPU Direct Storage技術(shù),對(duì)數(shù)據(jù)進(jìn)行可視化處理,這在以前是不敢想象的。

如果登陸火星還不夠,科研人員也正在借助GPU內(nèi)的CUDA核心對(duì)全基因組進(jìn)行測(cè)序。通過(guò)全基因組測(cè)序分析整個(gè)基因序列,可以檢測(cè)由遺傳性疾病引起的DNA變異。為此,NVIDIA推出了一套Parabricks 基因組分析工具包,借助CUDA基因測(cè)序可以加速到30-50倍完成。

而即將到來(lái)的5G與NVIDIA也同樣有關(guān)系。目前NVIDIA已經(jīng)與愛(ài)立信展開合作,通過(guò)CUDA核心,能夠提升5G vRAN性能,特別是在復(fù)雜的空間內(nèi),CUDA能夠加速解決物理空間內(nèi)的信號(hào)優(yōu)化的問(wèn)題。

針對(duì)世界上最普及的ARM,NVIDIA也給出了一套能夠與ARM配套的解決方案。得益于PCIe標(biāo)準(zhǔn),GPU也可以輕松與ARM完成連接?;贏RM,NVIDIA推出了NVIDIA HPC for ARM首個(gè)參考架構(gòu),可以使用Marvell、Ampere、富士通亦或者其他ARM的HPC處理器與Volta GPU連接。更厲害的是,每個(gè)ARM CPU最多可以連接4塊Volta GPU,擴(kuò)展性能極其恐怖。

在現(xiàn)場(chǎng),黃仁勛也毫不吝嗇的通過(guò)VMD ON ARM通過(guò)CUDA演示NAMD分子動(dòng)力學(xué)模型的結(jié)果可視化處理,借助Marvell ThunderX2以及NVIDIA V100,并通過(guò)NVIDIA Optix光線追蹤器,并實(shí)現(xiàn)遠(yuǎn)程流式傳輸。

與此同時(shí),TensorFlow作為當(dāng)今最重要的可言、云計(jì)算、工業(yè)、上也領(lǐng)域的HPC應(yīng)用,也同樣被NVIDIA CUDA on ARM所支持。

而隨著深度學(xué)習(xí)不斷挖掘,NVIDIA在5年左右的時(shí)間內(nèi)將訓(xùn)練性能提高了300倍以上,借助Volta、Tensor Core GPU、Chip-on-wafer封裝、HBM 3D堆棧存儲(chǔ)器、NVLink、DGX系統(tǒng),AI加速變得更快。

事實(shí)上NVIDIA AI已經(jīng)影響到了各行各業(yè),它出現(xiàn)在運(yùn)輸、醫(yī)療、金融、零售中,NVIDIA也不斷為每種場(chǎng)景打造不同的平臺(tái),例如用于深度學(xué)習(xí)訓(xùn)練的DGX,用于超大規(guī)模云的HGX,用于邊緣計(jì)算的EGX,用于自治系統(tǒng)的AGX。

現(xiàn)在,NVIDIA AI也已經(jīng)被運(yùn)用到百度推薦系統(tǒng)中,100多個(gè)推薦模型在百度中付諸實(shí)踐,這些模型每周都會(huì)進(jìn)行更新,自動(dòng)學(xué)習(xí)用戶潛在興趣,新條目和特征被持續(xù)更新。目前百度龐大的用戶潛在興趣數(shù)據(jù)包含了千億維稀疏離散特征和10TB embedding詞表,只有通過(guò)GPU加速訓(xùn)練,才能在如此大規(guī)模的訓(xùn)練中加速且節(jié)省成本。

同樣,阿里巴巴也接祖了NVIDIA加速計(jì)算平臺(tái)大規(guī)模部署先進(jìn)的AI技術(shù),包括T4 GPU、cuBLAS、自定義混合精度和推理加速軟件等。確保雙十一期間2684億人民幣,每秒幾十億次推薦請(qǐng)求,確保全天銷售額順利推進(jìn),所以一切也都借助了NVIDIA AI的運(yùn)算支持。在NVIDA AI加持下,阿里巴巴已經(jīng)嫩鞏固支持比過(guò)去復(fù)雜6倍的模型,從而使點(diǎn)擊率提高10%。相比于CPU,T4將我們最大模型的吞吐量提高了100倍。

TensorRT 7的性能攀升在幫助各大廠商推進(jìn)AI的同時(shí),NVIDIA也發(fā)布了全新的NVIDIA TensorRT 7推理軟件,內(nèi)置新型深度學(xué)習(xí)編譯器。

該編譯器能夠自動(dòng)優(yōu)化和加速遞歸神經(jīng)網(wǎng)絡(luò)與基于轉(zhuǎn)換器的神經(jīng)網(wǎng)絡(luò)。這些日益復(fù)雜的神經(jīng)網(wǎng)絡(luò)是AI語(yǔ)音應(yīng)用所必需的。與在CPU上運(yùn)行時(shí)相比,會(huì)話式AI組件速度提高了10倍以上,從而將延遲降低到實(shí)時(shí)交互所需的300毫秒閾值以下。

也就是說(shuō),在一套端到端的流程中,CPU推理延遲大概在3秒左右,但在T4 GPU上,整個(gè)過(guò)程只需要0.3秒。更重要的,原本TensorRT 5大概智能實(shí)現(xiàn)數(shù)十種不同的計(jì)算變化和優(yōu)化,但到了TensorRT 7,已經(jīng)可以做到1000種以上。

黃仁勛表示,現(xiàn)在技術(shù)已經(jīng)進(jìn)入了一個(gè)機(jī)器可以實(shí)時(shí)理解人類語(yǔ)言的AI新時(shí)代。在原有的TensorRT 5的基礎(chǔ)上,各地開發(fā)人員能夠更快部署會(huì)話式AI服務(wù),從而實(shí)現(xiàn)更自然的AI人機(jī)交互。在首批使用NVIDIA會(huì)話式AI加速能力的企業(yè)中,包括了阿里巴巴、百度、滴滴出行、美團(tuán)、快手、平安、搜狗、騰訊和字節(jié)跳動(dòng)等中國(guó)企業(yè)。

繼續(xù)為自動(dòng)駕駛做足鋪墊針對(duì)自動(dòng)駕駛領(lǐng)域,NVIDIA發(fā)布了Xavier繼任者NVIDIA DRIVE AGX Orin。

顧名思義,Orin是下一代機(jī)器人處理器SoC,它參數(shù)十分亮眼,包括170億個(gè)晶體管,8核64位CPU,200TOPS深度學(xué)習(xí)算例,重點(diǎn)是,它的計(jì)算性能相當(dāng)于Xavier的7倍。這意味著這是一個(gè)從底層架構(gòu)上更新的AGX處理器,它的設(shè)計(jì)最早來(lái)自超算,擁有全新的功能安全特性,可以使CPU、GPU鎖步運(yùn)行而提升容錯(cuò)性,并且配備了全新的安全引擎保護(hù)數(shù)據(jù)不受網(wǎng)絡(luò)攻擊,以及與上一代Xavier兼容。

通過(guò)不同的組合,NVIDIA DRIVE 能夠適配L2到L5級(jí)別的自動(dòng)駕駛功能,其中Orin能做到與Xavier兼容,完全由軟件定義。

在Orin宣布的同時(shí),NVIDIA也宣布為滴滴提供自動(dòng)駕駛和云計(jì)算解決方案,通過(guò)NVIDIA DRIVE,以及數(shù)據(jù)中心的NVIDIA GPU訓(xùn)練機(jī)器學(xué)習(xí)算法,滴滴已經(jīng)能夠?qū)崿F(xiàn)L4幾倍的自動(dòng)駕駛推理能力。

作為滴滴自動(dòng)駕駛AI處理的一部分,NVIDIA DRIVE借助多個(gè)深度神經(jīng)網(wǎng)絡(luò)融合來(lái)自各類傳感器(攝像頭、激光雷達(dá)、雷達(dá)等)的數(shù)據(jù),從而實(shí)現(xiàn)對(duì)汽車周圍環(huán)境360度全方位的理解,并規(guī)劃出安全的行駛路徑。

用軟件定義機(jī)器人平臺(tái)整場(chǎng)演講的重頭戲,最終留給了Isaac SDK。Isaac SDK包括Isaac Robotics Engine(提供應(yīng)用程序框架),Isaac GEM(預(yù)先構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)模型、算法、庫(kù)、驅(qū)動(dòng)程序和API),用于室內(nèi)物流的參考應(yīng)用程序以及Isaac Sim的第一個(gè)版本(提供導(dǎo)航功能)。

全新Isaac SDK可以大大加快研究人員、開發(fā)人員、初創(chuàng)企業(yè)和制造商開發(fā)和測(cè)試機(jī)器人的速度。它使機(jī)器人能夠通過(guò)仿真獲得由人工智能技術(shù)驅(qū)動(dòng)的感知和訓(xùn)練功能,從而可以在各種環(huán)境和情況下對(duì)機(jī)器人進(jìn)行測(cè)試和驗(yàn)證。

這個(gè)套件包含了Training-in-Sim工作流,使用隨機(jī)域生成6D姿態(tài)圖像,用于訓(xùn)練目標(biāo)檢測(cè)、像素分割、2D姿態(tài)、3D姿態(tài)等諸多內(nèi)容。

最后現(xiàn)場(chǎng),NVIDIA也給我們展示了一個(gè)會(huì)賣萌的Leonardo物體操縱機(jī)器人。通過(guò)模擬和真是世界的學(xué)習(xí),Leonardo學(xué)會(huì)了如何遵守物理規(guī)則,在模擬的計(jì)算部分則運(yùn)用到了GPU的PhysX 5.0物理引擎。

寫在最后可以看到長(zhǎng)達(dá)2小時(shí)的GTC CHINA 2019演講中,新推出的芯片只有Orin一塊。NVIDIA更多的重心放在了軟件平臺(tái)和AI智能優(yōu)化上,通過(guò)硬件與軟件配合,發(fā)揮CUDA給GPU帶來(lái)的大規(guī)模并行處理優(yōu)勢(shì),使得GPU走出游戲和渲染,找到了一個(gè)更廣闊的空間。

NVIDIA造GPU無(wú)疑是最擅長(zhǎng)的,如何用好GPU,則需要無(wú)數(shù)工程師努力挖掘答案。無(wú)論是超算、AI、自動(dòng)駕駛、邊緣計(jì)算,NVIDIA都已經(jīng)牢牢占住了自己的位置,足以見(jiàn)得GPU對(duì)專業(yè)領(lǐng)域而言,同樣具備強(qiáng)烈的吸引力。

責(zé)任編輯:wv

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4986

    瀏覽量

    103066
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4740

    瀏覽量

    128951
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計(jì)算效率

    本案例中魯班系統(tǒng)高性能 CAE 軟件利用 NVIDIA 高性能 GPU,實(shí)現(xiàn)復(fù)雜產(chǎn)品的快速仿真,加速產(chǎn)品開發(fā)和設(shè)計(jì)迭代,縮短開發(fā)周期,提升產(chǎn)品競(jìng)爭(zhēng)力。
    的頭像 發(fā)表于 12-27 16:24 ?90次閱讀

    GPU加速云服務(wù)器怎么用的

    GPU加速云服務(wù)器是將GPU硬件與云計(jì)算服務(wù)相結(jié)合,通過(guò)云服務(wù)提供商的平臺(tái),用戶可以根據(jù)需求靈活租用帶有GPU資源的虛擬機(jī)實(shí)例。那么,
    的頭像 發(fā)表于 12-26 11:58 ?47次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    的各個(gè)方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計(jì)算的啟用、NVIDIA和AMD GPU的詳細(xì)信息以及相關(guān)的使用指南和故障排除等內(nèi)容。 1. 硬件支持 -
    發(fā)表于 12-16 14:25

    NVIDIA加速全球大多數(shù)超級(jí)計(jì)算機(jī)推動(dòng)科技進(jìn)步

    HPCwire 讀者和編輯選擇獎(jiǎng)。 自 2006 年發(fā)布 CUDA 以來(lái),NVIDIA 不斷推動(dòng) AI 和加速計(jì)算的進(jìn)步,最新發(fā)布的全球最強(qiáng)超級(jí)計(jì)算機(jī) TOP500 榜單突顯了該公司
    的頭像 發(fā)表于 11-24 14:38 ?324次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>全球大多數(shù)超級(jí)<b class='flag-5'>計(jì)算</b>機(jī)推動(dòng)科技進(jìn)步

    NVIDIA加速計(jì)算引入Polars

    Polars 近日發(fā)布了一款由 RAPIDS cuDF 驅(qū)動(dòng)的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使數(shù)據(jù)科學(xué)家僅在一臺(tái)機(jī)器上就能實(shí)現(xiàn)在數(shù)秒內(nèi)處理數(shù)億行數(shù)據(jù)。
    的頭像 發(fā)表于 11-20 10:03 ?205次閱讀
    將<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b><b class='flag-5'>計(jì)算</b>引入Polars

    NVIDIA加速計(jì)算如何推動(dòng)醫(yī)療健康

    近日,NVIDIA 企業(yè)平臺(tái)副總裁 Bob Pette 在 AI Summit 一場(chǎng)演講中重點(diǎn)談?wù)摿?NVIDIA 加速計(jì)算如何推動(dòng)醫(yī)療健康、網(wǎng)絡(luò)安全和制造等行業(yè)實(shí)現(xiàn)轉(zhuǎn)型。他表示,
    的頭像 發(fā)表于 11-20 09:10 ?296次閱讀

    PyTorch GPU 加速訓(xùn)練模型方法

    在深度學(xué)習(xí)領(lǐng)域,GPU加速訓(xùn)練模型已經(jīng)成為提高訓(xùn)練效率和縮短訓(xùn)練時(shí)間的重要手段。PyTorch作為一個(gè)流行的深度學(xué)習(xí)框架,提供了豐富的工具和方法來(lái)利用GPU進(jìn)行模型訓(xùn)練。 1. 了解GPU
    的頭像 發(fā)表于 11-05 17:43 ?560次閱讀

    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)

    市的 Colossus 超級(jí)計(jì)算機(jī)集群達(dá)到了 10 萬(wàn)顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡(luò)平臺(tái),該平臺(tái)
    發(fā)表于 10-30 09:33 ?153次閱讀
    <b class='flag-5'>NVIDIA</b> 以太網(wǎng)<b class='flag-5'>加速</b> xAI 構(gòu)建的全球最大 AI 超級(jí)<b class='flag-5'>計(jì)算</b>機(jī)

    AMD與NVIDIA GPU優(yōu)缺點(diǎn)

    在圖形處理單元(GPU)市場(chǎng),AMD和NVIDIA是兩大主要的競(jìng)爭(zhēng)者,它們各自推出的產(chǎn)品在性能、功耗、價(jià)格等方面都有著不同的特點(diǎn)和優(yōu)勢(shì)。 一、性能 GPU的性能是用戶最關(guān)心的指標(biāo)之一。在高端市場(chǎng)
    的頭像 發(fā)表于 10-27 11:15 ?705次閱讀

    GPU加速計(jì)算平臺(tái)是什么

    GPU加速計(jì)算平臺(tái),簡(jiǎn)而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來(lái)加速科學(xué)
    的頭像 發(fā)表于 10-25 09:23 ?251次閱讀

    NVIDIA加速計(jì)算和生成式AI領(lǐng)域的創(chuàng)新

    在最新發(fā)布的公司 2024 財(cái)年可持續(xù)發(fā)展報(bào)告開篇的一封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA加速計(jì)算和生成式 AI 領(lǐng)域的創(chuàng)新,以及 AI 技術(shù)在提高生
    的頭像 發(fā)表于 09-09 09:18 ?564次閱讀

    NVIDIA 通過(guò) CUDA-Q 平臺(tái)為全球各地的量子計(jì)算中心提供加速

    德國(guó)、日本和波蘭的超級(jí)計(jì)算機(jī)利用 Grace-Hopper 和量子-經(jīng)典加速超算平臺(tái)推進(jìn)量子計(jì)算研究 ? ? 德國(guó)漢堡 —— 國(guó)際超算大會(huì)(ISC)—— 2024 年 5 月 13 日
    發(fā)表于 05-13 15:21 ?200次閱讀
    <b class='flag-5'>NVIDIA</b> 通過(guò) CUDA-Q 平臺(tái)為全球各地的量子<b class='flag-5'>計(jì)算</b>中心提供<b class='flag-5'>加速</b>

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于
    的頭像 發(fā)表于 04-20 09:39 ?727次閱讀

    NVIDIA cuPQC幫助開發(fā)適用于量子計(jì)算時(shí)代的加密技術(shù)

    NVIDIA cuPQC 可為相關(guān)開發(fā)者提供加速計(jì)算支持,幫助開發(fā)適用于量子計(jì)算時(shí)代的加密技術(shù)。cuPQC 庫(kù)可利用 GPU 并行性,為要求
    的頭像 發(fā)表于 03-22 09:53 ?423次閱讀

    如何選擇NVIDIA GPU和虛擬化軟件的組合方案呢?

    NVIDIA vGPU 解決方案能夠?qū)?NVIDIA GPU 的強(qiáng)大功能帶入虛擬桌面、應(yīng)用程序和工作站,加速圖形和計(jì)算,使在家辦公或在任何地
    的頭像 發(fā)表于 01-12 09:26 ?1127次閱讀
    如何選擇<b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>和虛擬化軟件的組合方案呢?