0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力騰訊AI LAB打造一體AI生態(tài)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-21 10:50 ? 次閱讀

案例簡(jiǎn)介

? 本案例中通過使用NVIDIA T4 GPUTensorRT,OpenGL,CUDA, CUDA/OpenGL interoperability等GPU軟件技術(shù)棧,助力騰訊AI LAB虛擬人項(xiàng)目在人臉生成階段達(dá)到了超過3倍的加速。

? 本案例主要應(yīng)用到 NVIDIA T4 GPU,TensorRT, OpenGL,CUDA, CUDA/OpenGL interoperability等AI加速平臺(tái)。

客戶簡(jiǎn)介及應(yīng)用背景

騰訊AI LAB致力于打造產(chǎn)學(xué)研用一體的 AI 生態(tài),主要的研究方向包括計(jì)算機(jī)視覺語音識(shí)別、自然語言處理和機(jī)器學(xué)習(xí),結(jié)合騰訊場(chǎng)景與業(yè)務(wù)優(yōu)勢(shì),在社交AI,游戲AI,內(nèi)容AI及平臺(tái)AI等領(lǐng)域取得了顯著的成果,技術(shù)被應(yīng)用于微信、QQ、天天快報(bào)和QQ音樂等上百個(gè)騰訊產(chǎn)品。其中圍棋AI “絕藝” 多次獲得世界人工智能圍棋大賽的冠軍。

騰訊AI LAB打造的虛擬人,具有自然,生動(dòng)且飽含情緒的表情,其背后由一套騰訊 AI Lab 自研的復(fù)雜系統(tǒng)支撐,系統(tǒng)首先要從文本中提取不同信息,包括表情、情感、重音位置、和激動(dòng)程度等;之后,這些信息被輸入到模型中生成,再同步生成語音、口型和表情參數(shù),最終才有了虛擬人自然生動(dòng)的表現(xiàn)。

客戶挑戰(zhàn)

根據(jù)虛擬人物需要表達(dá)的語言和情感,生成自然生動(dòng)的人臉,是打造虛擬人重要的一個(gè)階段。需要先渲染人臉的紋理圖和渲染圖,并將它們輸入到深度學(xué)習(xí)模型中,最終生成自然生動(dòng)的人臉。在這個(gè)過程中,需要用到OpenGL、OpenCV、CUDA、TensorFlow等軟件技術(shù),騰訊原有的方案有很多CPU與GPU的數(shù)據(jù)交互,且有很多計(jì)算型的操作通過CPU來實(shí)現(xiàn),效率非常低下, 無論是吞吐還是延時(shí)都不滿足要求,具體體現(xiàn)在:

OpenGL在GPU上渲染好圖像繪制到framebuffer后,需要先用glReadPixels拷貝數(shù)據(jù)到CPU,再用cudaMemcpy將數(shù)據(jù)從CPU拷回到GPU以進(jìn)行深度學(xué)習(xí)模型的推理,這里有兩次不必要的CPU與GPU之間的數(shù)據(jù)傳輸。

顏色空間轉(zhuǎn)換,深度學(xué)習(xí)推理的前后處理等操作在CPU上完成,效率非常低下。

應(yīng)用方案

NVIDIA 技術(shù)在虛擬人項(xiàng)目的渲染和推理階段均提供了強(qiáng)大的支持。在渲染階段,NVIDIA 助力提升了顏色空間轉(zhuǎn)換效率,降低整體延時(shí),主要體現(xiàn)在:

用NVIDIA CUDA/OpenGL interoperability 代替騰訊之前使用glReadPixels在CUDA和OpenGL之間拷貝數(shù)據(jù)的方案,大幅減少了CPU和GPU之間的數(shù)據(jù)拷貝,從而降低了整體的延時(shí)。

把原來在CPU上做的顏色空間轉(zhuǎn)換的操作,遷移到NVIDIA T4 GPU上用CUDA kernel實(shí)現(xiàn),利用GPU的并行優(yōu)勢(shì),大大提高了顏色空間轉(zhuǎn)換的效率,進(jìn)一步降低了整體的延時(shí)。

將多幀的mesh組成一個(gè)batch分別繪制到framebuffer的不同區(qū)域,在提高OpenGL并行度的同時(shí),給下一階段的深度學(xué)習(xí)模型的推理提供了更大的輸入數(shù)據(jù)的batch size,充分發(fā)揮NVIDIA T4 GPU高并發(fā)計(jì)算的優(yōu)勢(shì),進(jìn)一步提高GPU的利用率,從而提高整體的吞吐。

在推理階段,NVIDIA助力提高推理整體吞吐,降低推理延時(shí),主要體現(xiàn)在以下幾點(diǎn):用NVIDIA TensorRT替換TensorFlow對(duì)模型推理進(jìn)行加速,并利用NVIDIA T4 GPU上的FP16 Tensor Core可以極大提高矩陣乘等操作速度的特性,在最終視覺效果幾乎不變的情況下,進(jìn)一步提升推理的吞吐,降低推理延時(shí)。

用NVIDIA TensorRT替換TensorFlow對(duì)模型推理進(jìn)行加速,并利用NVIDIA T4 GPU上的FP16 Tensor Core可以極大提高矩陣乘等操作速度的特性,在最終視覺效果幾乎不變的情況下,進(jìn)一步提升推理的吞吐,降低推理延時(shí)。

在NVIDIA T4 GPU上利用CUDA kernel 替代原始流程中在CPU上使用OpenCV實(shí)現(xiàn) Mat-to-Tensor 和 Tensor-to-Mat 等格式轉(zhuǎn)換操作,并使用OpenCV-CUDA版替換OpenCV-CPU版的部分操作(如Resize等),充分發(fā)揮GPU相對(duì)于CPU更高的并發(fā)優(yōu)勢(shì),在加速這些操作的同時(shí)減少GPU到CPU的數(shù)據(jù)傳輸通信量,提高格式轉(zhuǎn)換效率,降低端到端的推理延時(shí)。

通過Pipeline的方式,使GPU和CPU上的操作進(jìn)行overlap,并結(jié)合NVIDIA的MPS技術(shù)提高單卡上多個(gè)進(jìn)程同時(shí)處理多個(gè)數(shù)據(jù)流的同時(shí)提高整體的吞吐。

使用效果及影響

在虛擬人項(xiàng)目中,NVIDIA CUDA技術(shù)大幅提升了渲染速度,NVIDIA TensorRT 方便快速地加速深度學(xué)習(xí)模型的推理,結(jié)合MPS技術(shù),實(shí)現(xiàn)了單卡多路推流,使整體推理效率達(dá)到了原來的三倍!性能的大幅提升,既提升了GPU的利用率,又降低了AI技術(shù)的使用成本。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4996

    瀏覽量

    103213
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4744

    瀏覽量

    129017
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31028

    瀏覽量

    269365
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA和GeForce RTX GPU專為AI時(shí)代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時(shí)代打造。
    的頭像 發(fā)表于 01-06 10:45 ?63次閱讀

    麗臺(tái)科技推出WS3008 AI一體機(jī)

    隨著 AI 技術(shù)的不斷進(jìn)步和商業(yè)應(yīng)用的深入探索,AI 一體機(jī)作為企業(yè)智能化轉(zhuǎn)型的重要載體,正逐步展現(xiàn)出其獨(dú)特的價(jià)值和潛力。為適用于更多企業(yè)轉(zhuǎn)型需求以及更靈活的場(chǎng)景化要求,麗臺(tái)科技現(xiàn)推出 AI
    的頭像 發(fā)表于 11-27 11:11 ?269次閱讀

    NVIDIA AI助力初創(chuàng)企業(yè)為心理治療師提供AI工具

    NVIDIA AI 助力初創(chuàng)企業(yè)為心理治療師提供 AI 工具,以此來優(yōu)化和提升心理健康服務(wù)水平,為人們的心理健康保駕護(hù)航。
    的頭像 發(fā)表于 11-19 16:03 ?223次閱讀

    賴耶科技通過NVIDIA AI Enterprise平臺(tái)打造超級(jí)AI工廠

    NVIDIA 技術(shù)團(tuán)隊(duì)保持合作。賴耶科技通過NVIDIA AI Enterprise平臺(tái)打造的超級(jí) AI 工廠,致力于加速大模型場(chǎng)景應(yīng)用
    的頭像 發(fā)表于 11-19 14:55 ?402次閱讀

    NVIDIA助力Amdocs打造生成式AI智能

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型(LLM)和領(lǐng)域適配模型的解決方案。該公司還在使用NVIDIA
    的頭像 發(fā)表于 11-19 14:48 ?361次閱讀

    使用全新NVIDIA AI Blueprint開發(fā)視覺AI智能

    為提高生產(chǎn)力、優(yōu)化流程和創(chuàng)造更加安全的空間,埃森哲、戴爾科技和聯(lián)想等公司正在使用全新 NVIDIA AI Blueprint 開發(fā)視覺 AI 智能。
    的頭像 發(fā)表于 11-06 13:58 ?427次閱讀

    NVIDIA助力印度打造AI基礎(chǔ)設(shè)施

    在孟買舉辦的 NVIDIA AI Summit 上,黃仁勛和穆克什·安巴尼(Mukesh Ambani)探討了關(guān)于 AI 基礎(chǔ)設(shè)施的投資,這些投資有望為各行各業(yè)帶來變革。
    的頭像 發(fā)表于 10-27 09:44 ?283次閱讀

    存算一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)大算力AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計(jì)算(HPC)應(yīng)用論壇》上,億鑄科技高級(jí)副總裁徐芳發(fā)表了題為《存算一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)大算力AI芯片騰飛》的演講。
    的頭像 發(fā)表于 10-23 14:48 ?335次閱讀

    如何選擇合適的邊緣ai分析一體機(jī)解決方案

    的解決方案,成為企業(yè)決策者亟需解決的問題。本文將從需求分析、技術(shù)考量、生態(tài)兼容及未來可擴(kuò)展性四個(gè)方面,探討如何科學(xué)合理地選擇合適的邊緣AI分析一體機(jī)。、明確需求分析
    的頭像 發(fā)表于 08-08 15:25 ?247次閱讀
    如何選擇合適的邊緣<b class='flag-5'>ai</b>分析<b class='flag-5'>一體</b>機(jī)解決方案

    微鏈道愛加入元腦生態(tài),將打造AI視覺標(biāo)注訓(xùn)練一體機(jī)

    北京2024年7月8日?/美通社/ --?近日,北京微鏈道愛科技有限公司(簡(jiǎn)稱"微鏈道愛")與浪潮信息簽署元腦生態(tài)戰(zhàn)略合作協(xié)議。雙方將共同打造AI視覺標(biāo)注訓(xùn)練一體機(jī),支持高效的數(shù)據(jù)標(biāo)注
    的頭像 發(fā)表于 07-08 15:31 ?400次閱讀

    賽輪思與NVIDIA合作,利用生成式AI打造代車內(nèi)體驗(yàn)

    AI 驅(qū)動(dòng)的移動(dòng)出行創(chuàng)新企業(yè)與 NVIDIA 合作,打造代車內(nèi)體驗(yàn)。
    的頭像 發(fā)表于 05-23 10:12 ?1257次閱讀

    高德將打造時(shí)空智能應(yīng)用生態(tài),助力智慧城市向時(shí)空智能城市進(jìn)化

    5月20日,在AI Day技術(shù)開放日活動(dòng)上,高德地圖旗下高德云圖宣布將逐步開放云睿時(shí)空融合大模型和云境AI三維重建平臺(tái),打造時(shí)空智能應(yīng)用生態(tài)
    的頭像 發(fā)表于 05-21 14:27 ?630次閱讀
    高德將<b class='flag-5'>打造</b>時(shí)空智能<b class='flag-5'>體</b>應(yīng)用<b class='flag-5'>生態(tài)</b>,<b class='flag-5'>助力</b>智慧城市向時(shí)空智能城市進(jìn)化

    潤(rùn)和軟件基于華為昇騰AI打造的IntelliCore AI解決方案一體機(jī)

    江蘇潤(rùn)和軟件股份有限公司(以下簡(jiǎn)稱“潤(rùn)和軟件”)基于華為昇騰AI打造的IntelliCore AI解決方案一體機(jī),提供全方位的AI與數(shù)據(jù)服
    的頭像 發(fā)表于 05-09 09:18 ?1032次閱讀
    潤(rùn)和軟件基于華為昇騰<b class='flag-5'>AI</b>所<b class='flag-5'>打造</b>的IntelliCore <b class='flag-5'>AI</b>解決方案<b class='flag-5'>一體</b>機(jī)

    Stability AI與Morph AI共同推出一體AI視頻創(chuàng)作工具

    近日,業(yè)界領(lǐng)先的AI技術(shù)公司Stability AI與中國(guó)AI創(chuàng)業(yè)公司Morph AI達(dá)成重要合作。雙方宣布共同推出款革新性的all-in
    的頭像 發(fā)表于 03-05 10:44 ?893次閱讀

    NVIDIA AI Enterprise助力九州未來構(gòu)建MaaS平臺(tái)

    本案例中,九州未來的團(tuán)隊(duì)基于NVIDIA AI Enterprise的全棧軟件套件,構(gòu)建其 MaaS 大模型一體化開發(fā)及部署平臺(tái),該平臺(tái)同時(shí)支持云端部署和私有化部署,通過九州未來開發(fā)的算力調(diào)度平臺(tái)軟件,實(shí)現(xiàn)云端資源與大模型
    的頭像 發(fā)表于 01-10 17:24 ?1241次閱讀