在线观看Av网站永久免费观看,国产色情一区二区三区在线播放

案例簡(jiǎn)介

? 本案例中通過使用NVIDIA T4 GPU和TensorRT，OpenGL，CUDA， CUDA/OpenGL interoperability等GPU軟件技術(shù)棧，助力騰訊AI LAB虛擬人項(xiàng)目在人臉生成階段達(dá)到了超過3倍的加速。

? 本案例主要應(yīng)用到 NVIDIA T4 GPU，TensorRT， OpenGL，CUDA， CUDA/OpenGL interoperability等AI加速平臺(tái)。

客戶簡(jiǎn)介及應(yīng)用背景

騰訊AI LAB致力于打造產(chǎn)學(xué)研用一體的 AI 生態(tài)，主要的研究方向包括計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理和機(jī)器學(xué)習(xí)，結(jié)合騰訊場(chǎng)景與業(yè)務(wù)優(yōu)勢(shì)，在社交AI，游戲AI，內(nèi)容AI及平臺(tái)AI等領(lǐng)域取得了顯著的成果，技術(shù)被應(yīng)用于微信、QQ、天天快報(bào)和QQ音樂等上百個(gè)騰訊產(chǎn)品。其中圍棋AI “絕藝” 多次獲得世界人工智能圍棋大賽的冠軍。

騰訊AI LAB打造的虛擬人，具有自然，生動(dòng)且飽含情緒的表情，其背后由一套騰訊 AI Lab 自研的復(fù)雜系統(tǒng)支撐，系統(tǒng)首先要從文本中提取不同信息，包括表情、情感、重音位置、和激動(dòng)程度等；之后，這些信息被輸入到模型中生成，再同步生成語音、口型和表情參數(shù)，最終才有了虛擬人自然生動(dòng)的表現(xiàn)。

客戶挑戰(zhàn)

根據(jù)虛擬人物需要表達(dá)的語言和情感，生成自然生動(dòng)的人臉，是打造虛擬人重要的一個(gè)階段。需要先渲染人臉的紋理圖和渲染圖，并將它們輸入到深度學(xué)習(xí)模型中，最終生成自然生動(dòng)的人臉。在這個(gè)過程中，需要用到OpenGL、OpenCV、CUDA、TensorFlow等軟件技術(shù)，騰訊原有的方案有很多CPU與GPU的數(shù)據(jù)交互，且有很多計(jì)算型的操作通過CPU來實(shí)現(xiàn)，效率非常低下，無論是吞吐還是延時(shí)都不滿足要求，具體體現(xiàn)在：

OpenGL在GPU上渲染好圖像繪制到framebuffer后，需要先用glRead Pixels拷貝數(shù)據(jù)到CPU，再用cudaMemcpy將數(shù)據(jù)從CPU拷回到GPU以進(jìn)行深度學(xué)習(xí)模型的推理，這里有兩次不必要的CPU與GPU之間的數(shù)據(jù)傳輸。

顏色空間轉(zhuǎn)換，深度學(xué)習(xí)推理的前后處理等操作在CPU上完成，效率非常低下。

應(yīng)用方案

NVIDIA 技術(shù)在虛擬人項(xiàng)目的渲染和推理階段均提供了強(qiáng)大的支持。在渲染階段，NVIDIA 助力提升了顏色空間轉(zhuǎn)換效率，降低整體延時(shí)，主要體現(xiàn)在：

用NVIDIA CUDA/OpenGL interoperability 代替騰訊之前使用glReadPixels在CUDA和OpenGL之間拷貝數(shù)據(jù)的方案，大幅減少了CPU和GPU之間的數(shù)據(jù)拷貝，從而降低了整體的延時(shí)。

把原來在CPU上做的顏色空間轉(zhuǎn)換的操作，遷移到NVIDIA T4 GPU上用CUDA kernel實(shí)現(xiàn)，利用GPU的并行優(yōu)勢(shì)，大大提高了顏色空間轉(zhuǎn)換的效率，進(jìn)一步降低了整體的延時(shí)。

將多幀的mesh組成一個(gè)batch分別繪制到framebuffer的不同區(qū)域，在提高OpenGL并行度的同時(shí)，給下一階段的深度學(xué)習(xí)模型的推理提供了更大的輸入數(shù)據(jù)的batch size，充分發(fā)揮NVIDIA T4 GPU高并發(fā)計(jì)算的優(yōu)勢(shì)，進(jìn)一步提高GPU的利用率，從而提高整體的吞吐。

在推理階段，NVIDIA助力提高推理整體吞吐，降低推理延時(shí)，主要體現(xiàn)在以下幾點(diǎn)：用NVIDIA TensorRT替換TensorFlow對(duì)模型推理進(jìn)行加速，并利用NVIDIA T4 GPU上的FP16 Tensor Core可以極大提高矩陣乘等操作速度的特性，在最終視覺效果幾乎不變的情況下，進(jìn)一步提升推理的吞吐，降低推理延時(shí)。

用NVIDIA TensorRT替換TensorFlow對(duì)模型推理進(jìn)行加速，并利用NVIDIA T4 GPU上的FP16 Tensor Core可以極大提高矩陣乘等操作速度的特性，在最終視覺效果幾乎不變的情況下，進(jìn)一步提升推理的吞吐，降低推理延時(shí)。

在NVIDIA T4 GPU上利用CUDA kernel 替代原始流程中在CPU上使用OpenCV實(shí)現(xiàn) Mat-to-Tensor 和 Tensor-to-Mat 等格式轉(zhuǎn)換操作，并使用OpenCV-CUDA版替換OpenCV-CPU版的部分操作（如Resize等），充分發(fā)揮GPU相對(duì)于CPU更高的并發(fā)優(yōu)勢(shì)，在加速這些操作的同時(shí)減少GPU到CPU的數(shù)據(jù)傳輸通信量，提高格式轉(zhuǎn)換效率，降低端到端的推理延時(shí)。

通過Pipeline的方式，使GPU和CPU上的操作進(jìn)行overlap，并結(jié)合NVIDIA的MPS技術(shù)提高單卡上多個(gè)進(jìn)程同時(shí)處理多個(gè)數(shù)據(jù)流的同時(shí)提高整體的吞吐。

使用效果及影響

在虛擬人項(xiàng)目中，NVIDIA CUDA技術(shù)大幅提升了渲染速度，NVIDIA TensorRT 方便快速地加速深度學(xué)習(xí)模型的推理，結(jié)合MPS技術(shù)，實(shí)現(xiàn)了單卡多路推流，使整體推理效率達(dá)到了原來的三倍！性能的大幅提升，既提升了GPU的利用率，又降低了AI技術(shù)的使用成本。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4996

瀏覽量
103213
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4744

瀏覽量
129017
AI

AI

+關(guān)注

關(guān)注
87

文章
31028

瀏覽量
269365

評(píng)論

相關(guān)推薦

NVIDIA和GeForce RTX GPU專為AI時(shí)代打造

NVIDIA 和 GeForce RTX GPU 專為 AI 時(shí)代打造。

發(fā)表于 01-06 10:45 ?63次閱讀

麗臺(tái)科技推出WS3008 AI一體機(jī)

隨著 AI 技術(shù)的不斷進(jìn)步和商業(yè)應(yīng)用的深入探索，AI 一體機(jī)作為企業(yè)智能化轉(zhuǎn)型的重要載體，正逐步展現(xiàn)出其獨(dú)特的價(jià)值和潛力。為適用于更多企業(yè)轉(zhuǎn)型需求以及更靈活的場(chǎng)景化要求，麗臺(tái)科技現(xiàn)推出 AI

發(fā)表于 11-27 11:11 ?269次閱讀

NVIDIA AI助力初創(chuàng)企業(yè)為心理治療師提供AI工具

NVIDIA AI 助力初創(chuàng)企業(yè)為心理治療師提供 AI 工具，以此來優(yōu)化和提升心理健康服務(wù)水平，為人們的心理健康保駕護(hù)航。

發(fā)表于 11-19 16:03 ?223次閱讀

賴耶科技通過NVIDIA AI Enterprise平臺(tái)打造超級(jí)AI工廠

與 NVIDIA 技術(shù)團(tuán)隊(duì)保持合作。賴耶科技通過NVIDIA AI Enterprise平臺(tái)打造的超級(jí) AI 工廠，致力于加速大模型場(chǎng)景應(yīng)用

發(fā)表于 11-19 14:55 ?402次閱讀

NVIDIA助力Amdocs打造生成式AI智能體

正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型（LLM）和領(lǐng)域適配模型的解決方案。該公司還在使用NVIDIA

發(fā)表于 11-19 14:48 ?361次閱讀

使用全新NVIDIA AI Blueprint開發(fā)視覺AI智能體

為提高生產(chǎn)力、優(yōu)化流程和創(chuàng)造更加安全的空間，埃森哲、戴爾科技和聯(lián)想等公司正在使用全新 NVIDIA AI Blueprint 開發(fā)視覺 AI 智能體。

發(fā)表于 11-06 13:58 ?427次閱讀

NVIDIA助力印度打造AI基礎(chǔ)設(shè)施

在孟買舉辦的 NVIDIA AI Summit 上，黃仁勛和穆克什·安巴尼（Mukesh Ambani）探討了關(guān)于 AI 基礎(chǔ)設(shè)施的投資，這些投資有望為各行各業(yè)帶來變革。

發(fā)表于 10-27 09:44 ?283次閱讀

存算一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)大算力AI芯片騰飛

在灣芯展SEMiBAY2024《AI芯片與高性能計(jì)算（HPC）應(yīng)用論壇》上，億鑄科技高級(jí)副總裁徐芳發(fā)表了題為《存算一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)大算力AI芯片騰飛》的演講。

發(fā)表于 10-23 14:48 ?335次閱讀

如何選擇合適的邊緣ai分析一體機(jī)解決方案

的解決方案，成為企業(yè)決策者亟需解決的問題。本文將從需求分析、技術(shù)考量、生態(tài)兼容及未來可擴(kuò)展性四個(gè)方面，探討如何科學(xué)合理地選擇合適的邊緣AI分析一體機(jī)。一、明確需求分析

發(fā)表于 08-08 15:25 ?247次閱讀

微鏈道愛加入元腦生態(tài)，將打造AI視覺標(biāo)注訓(xùn)練一體機(jī)

北京2024年7月8日?/美通社/ --?近日，北京微鏈道愛科技有限公司（簡(jiǎn)稱"微鏈道愛"）與浪潮信息簽署元腦生態(tài)戰(zhàn)略合作協(xié)議。雙方將共同打造AI視覺標(biāo)注訓(xùn)練一體機(jī)，支持高效的數(shù)據(jù)標(biāo)注

發(fā)表于 07-08 15:31 ?400次閱讀

賽輪思與NVIDIA合作，利用生成式AI打造下一代車內(nèi)體驗(yàn)

AI 驅(qū)動(dòng)的移動(dòng)出行創(chuàng)新企業(yè)與 NVIDIA 合作，打造下一代車內(nèi)體驗(yàn)。

發(fā)表于 05-23 10:12 ?1257次閱讀

高德將打造時(shí)空智能體應(yīng)用生態(tài)，助力智慧城市向時(shí)空智能城市進(jìn)化

5月20日，在AI Day技術(shù)開放日活動(dòng)上，高德地圖旗下高德云圖宣布將逐步開放云睿時(shí)空融合大模型和云境AI三維重建平臺(tái)，打造時(shí)空智能體應(yīng)用生態(tài)

發(fā)表于 05-21 14:27 ?630次閱讀

潤(rùn)和軟件基于華為昇騰AI所打造的IntelliCore AI解決方案一體機(jī)

江蘇潤(rùn)和軟件股份有限公司（以下簡(jiǎn)稱“潤(rùn)和軟件”）基于華為昇騰AI所打造的IntelliCore AI解決方案一體機(jī)，提供全方位的AI與數(shù)據(jù)服

發(fā)表于 05-09 09:18 ?1032次閱讀

Stability AI與Morph AI共同推出一體化AI視頻創(chuàng)作工具

近日，業(yè)界領(lǐng)先的AI技術(shù)公司Stability AI與中國(guó)AI創(chuàng)業(yè)公司Morph AI達(dá)成重要合作。雙方宣布共同推出一款革新性的all-in

發(fā)表于 03-05 10:44 ?893次閱讀

NVIDIA AI Enterprise助力九州未來構(gòu)建MaaS平臺(tái)

本案例中，九州未來的團(tuán)隊(duì)基于NVIDIA AI Enterprise的全棧軟件套件，構(gòu)建其 MaaS 大模型一體化開發(fā)及部署平臺(tái)，該平臺(tái)同時(shí)支持云端部署和私有化部署，通過九州未來開發(fā)的算力調(diào)度平臺(tái)軟件，實(shí)現(xiàn)云端資源與大模型

發(fā)表于 01-10 17:24 ?1241次閱讀