0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

蔚來基于NVIDIA Triton搭建的推理服務(wù)平臺(tái)

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-10-09 10:18 ? 次閱讀

在近日舉行的 GTC 大會(huì)上,蔚來 AI 平臺(tái)負(fù)責(zé)人白宇利帶來非常有價(jià)值的分享,他首次對(duì)外透露了蔚來自研的全棧式自動(dòng)駕駛系統(tǒng)(NAD)的部署和開發(fā)情況,同時(shí)也將蔚來自動(dòng)駕駛研發(fā)平臺(tái)(NADP)這個(gè)神秘的“Peta Factory”帶到了公眾視野中。

據(jù)了解,NADP是服務(wù)于蔚來自動(dòng)駕駛核心業(yè)務(wù)方向的研發(fā)平臺(tái),用于開發(fā) NAD 功能。以“Peta”為名是因?yàn)槊枯v車每天能生成 55 petabit數(shù)據(jù)(1 petabit = 10^6 gigabit = 10^9 megabit = 10^15 bits),而 NADP 是所有流程、工作流、數(shù)據(jù)以及底層軟硬件的組合。NADP 能夠以一站式平臺(tái)管理大量復(fù)雜的 AI 應(yīng)用,并將模型開發(fā)效率提高 20 倍,從而縮短自動(dòng)駕駛汽車的上市周期,開發(fā)出更新、更快的架構(gòu)。

在模型訓(xùn)練、測(cè)試和部署的過程中,為了確保新改進(jìn)能夠切實(shí)地解決相應(yīng)問題,且不會(huì)引發(fā)任何新問題, NADP 需要執(zhí)行 10 萬項(xiàng)推理任務(wù),包括數(shù)據(jù)挖掘、仿真和回歸測(cè)試。經(jīng)過眾多方案的對(duì)比和篩選,蔚來選用了NVIDIA Triton 推理服務(wù)器作為核心組件,構(gòu)建了 NADP 的高性能推理服務(wù)。

正如白宇利在分享中提到:“我們基于 NVIDIA Triton 推理服務(wù)器構(gòu)建了高性能推理服務(wù)。此服務(wù)非常適用于 NADP,并可輕松集成模型倉庫、工作流、Jupyter、Prometheus 和許多其他組件,從而簡(jiǎn)化 AI 推理。Triton 讓編排和擴(kuò)展變得更輕松,還能將推理速度提高至 6 倍,并可節(jié)省 24% 的資源?!?/p>

蔚來基于 NVIDIA Triton 搭建的推理服務(wù)平臺(tái),在數(shù)據(jù)挖掘業(yè)務(wù)場(chǎng)景下,通過服務(wù)器端模型前處理和多模型 DAG 式編排,GPU 資源平均節(jié)省 24%;在部分核心 pipeline 上,吞吐能力提升為原來的 5 倍,整體時(shí)延降低為原來的 1/ 6。

Triton 在設(shè)計(jì)之初,就融入了云原生的設(shè)計(jì)思路,為后面逐步圍繞 Triton 搭建完整的云原生平臺(tái)性推理解決方案提供了相當(dāng)大的便利。

作為 NADP 推理平臺(tái)的核心組件,Triton 與 NADP 的各個(gè)組件形成了一套完整的推理一站式解決方案。從集成效率、高性能、易用性、高可用四方面,在 NADP 推理平臺(tái)中提供助力。

目前,NADP 數(shù)據(jù)挖掘業(yè)務(wù)下的相關(guān)模型預(yù)測(cè)服務(wù)已經(jīng)全部遷移至 Triton 推理服務(wù)器,為上百個(gè)模型提供了高吞吐預(yù)測(cè)能力。同時(shí)在某些任務(wù)基礎(chǔ)上,通過自實(shí)現(xiàn)前處理算子、前后處理服務(wù)化、BLS 串聯(lián)模型等手段,將一些模型任務(wù)合并起來,極大的提升了處理效率。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5071

    瀏覽量

    103500
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    784

    文章

    13918

    瀏覽量

    166786
  • 蔚來
    +關(guān)注

    關(guān)注

    1

    文章

    492

    瀏覽量

    14581

原文標(biāo)題:成功案例:蔚來 NADP + NVIDIA Triton,搭建穩(wěn)定高效的推理平臺(tái)

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    能源充電網(wǎng)絡(luò)向極狐汽車開放

    1月17日,武漢能源有限公司(“能源”)與北京藍(lán)谷極狐汽車科技有限公司(“極狐汽車”)正式達(dá)成充電服務(wù)合作。
    的頭像 發(fā)表于 01-17 17:20 ?98次閱讀

    Triton編譯器在機(jī)器學(xué)習(xí)中的應(yīng)用

    1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務(wù)
    的頭像 發(fā)表于 12-24 18:13 ?482次閱讀

    企業(yè)云服務(wù)平臺(tái)設(shè)計(jì)與搭建

    企業(yè)云服務(wù)平臺(tái)的設(shè)計(jì)與搭建是一個(gè)復(fù)雜但系統(tǒng)的過程,涉及多個(gè)環(huán)節(jié)和因素。主機(jī)推薦小編為您整理發(fā)布企業(yè)云服務(wù)平臺(tái)設(shè)計(jì)與
    的頭像 發(fā)表于 12-04 09:51 ?131次閱讀

    能源與阿維塔達(dá)成充電服務(wù)合作協(xié)議

    近日,武漢能源有限公司(“能源”)與阿維塔科技(重慶)有限公司(“阿維塔”)正式達(dá)成充電服務(wù)合作協(xié)議。
    的頭像 發(fā)表于 11-19 10:20 ?238次閱讀

    廣東電網(wǎng)與合作,肇慶首座換電站正式上線

    近日,廣東電網(wǎng)電動(dòng)汽車服務(wù)有限公司與汽車的合作取得重要進(jìn)展,由前者投資建設(shè)的首座換電站已在廣東省肇慶市正式上線運(yùn)營。這一里程碑式的合
    的頭像 發(fā)表于 11-11 13:41 ?754次閱讀

    NVIDIA與思科合作打造企業(yè)級(jí)生成式AI基礎(chǔ)設(shè)施

    NVIDIA 加速計(jì)算平臺(tái)NVIDIA AI Enterprise 軟件和 NVIDIA NIM 推理
    的頭像 發(fā)表于 10-10 09:35 ?401次閱讀

    NVIDIA助力提供多樣、靈活的模型選擇

    在本案例中,Dify 以模型中立以及開源生態(tài)的優(yōu)勢(shì),為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務(wù)
    的頭像 發(fā)表于 09-09 09:19 ?510次閱讀

    全新 NVIDIA NeMo Retriever微服務(wù)大幅提升LLM的準(zhǔn)確性和吞吐量

    企業(yè)能夠通過提供檢索增強(qiáng)生成功能的生產(chǎn)就緒型 NVIDIA NIM 推理服務(wù),充分挖掘業(yè)務(wù)數(shù)據(jù)的價(jià)值。這些微服務(wù)現(xiàn)已集成到 Cohesity、DataStax、NetApp 和 Sn
    的頭像 發(fā)表于 07-26 11:13 ?891次閱讀
    全新 <b class='flag-5'>NVIDIA</b> NeMo Retriever微<b class='flag-5'>服務(wù)</b>大幅提升LLM的準(zhǔn)確性和吞吐量

    NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成式AI服務(wù)

    NVIDIA近日宣布了一項(xiàng)重大舉措,正式推出NVIDIA AI Foundry服務(wù)NVIDIA NIM(NVIDIA Inference
    的頭像 發(fā)表于 07-25 16:57 ?579次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)NVIDIA NIM推理服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)NVIDIA NIM 推理服務(wù)
    的頭像 發(fā)表于 07-25 09:48 ?756次閱讀

    英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

    英偉達(dá)近日宣布推出一項(xiàng)革命性的AI模型推理服務(wù)——NVIDIA NIM。這項(xiàng)服務(wù)將極大地簡(jiǎn)化AI模型部署過程,為全球的2800萬英偉達(dá)開發(fā)者提供前所未有的便利。
    的頭像 發(fā)表于 06-04 09:15 ?712次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會(huì) AI 平臺(tái)NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將
    的頭像 發(fā)表于 04-20 09:39 ?789次閱讀

    與寧德時(shí)代就長壽命電池業(yè)務(wù)正式簽約

    3月14日,與寧德時(shí)代就長壽命電池業(yè)務(wù)正式簽約?;诖?,汽車的BaaS電池租用服務(wù)也進(jìn)行了調(diào)整。
    的頭像 發(fā)表于 03-15 10:41 ?426次閱讀

    汽車2023年財(cái)報(bào)出爐 虧損211億

    汽車2023年財(cái)報(bào)出爐 虧損211億 根據(jù)發(fā)布的2023年四季度及全年財(cái)報(bào)數(shù)據(jù)顯示
    的頭像 發(fā)表于 03-06 12:11 ?2364次閱讀

    使用NVIDIA Triton推理服務(wù)加速AI預(yù)測(cè)

    這家云計(jì)算巨頭的計(jì)算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)加速 AI
    的頭像 發(fā)表于 02-29 14:04 ?612次閱讀