0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何最大化推理性能?Triton 社區(qū)技術(shù)交流活動(dòng)與您暢聊

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:未知 ? 2023-02-15 16:10 ? 次閱讀

由螞蟻集團(tuán)和 NVIDIA 攜手舉辦的“Triton Meetup 2023”將于 2 月 25 日在北京舉行。該活動(dòng)是 Triton 社區(qū)首次正式舉辦的線下技術(shù)交流活動(dòng)。來自美團(tuán)、京東、螞蟻、NVIDIA 的技術(shù)專家將帶來 AI Infra推理引擎相關(guān)的專題分享,包括目前各企業(yè)面臨的模型推理挑戰(zhàn)、Triton 的應(yīng)用及落地的具體方案等,現(xiàn)身說法,干貨十足。此外,還有來自蔚來的特邀嘉賓,帶來“AI 推理服務(wù)的當(dāng)下與未來”圓桌主題討論,歡迎到現(xiàn)場的小伙伴積極參與!

活動(dòng)地點(diǎn)

北京 BCos 共享辦公--多功能廳

(北京 WFC 環(huán)球金融中心辦公店)

活動(dòng)時(shí)間

2023 年 2 月 25 日

14:00 - 18:00

活動(dòng)報(bào)名

長按掃描下方二維碼

或點(diǎn)擊文末“閱讀原文

即可預(yù)約報(bào)名!

890b3a2e-ad07-11ed-bfe3-dac502259ad0.png

Triton Meetup 2023 活動(dòng)流程

14:00 - 14:05

開場

14:05 - 14:45

NVIDIA Triton Inference Server的現(xiàn)在和未來

14:45 - 15:25

Triton 在螞蟻全場景落地的優(yōu)化

15:25 - 15:40

NVIDIA & 螞蟻開源社區(qū)共建啟動(dòng)儀式

15:40 -16:20

Triton 在美團(tuán)數(shù)據(jù)中心的應(yīng)用

16:20 - 17:00

Triton 在京東零售的應(yīng)用與實(shí)踐

17:00 - 17:20

圓桌討論:AI 推理服務(wù)的當(dāng)下與未來

下面一起來看看嘉賓陣容吧!

議題一:NVIDIA Triton
Inference Server 的現(xiàn)在和未來

申意

NVIDIA 解決方案架構(gòu)師

891f8a88-ad07-11ed-bfe3-dac502259ad0.png

負(fù)責(zé)為消費(fèi)互聯(lián)網(wǎng)行業(yè)提供 GPU 計(jì)算解決方案。包括編解碼,數(shù)據(jù)前后處理,模型推理及服務(wù)化等。

議題簡介:

  • Triton 簡介

  • Triton 重要 Feature 簡介和 Roadmap 更新

  • Triton 的成功案例

議題二:Triton 在螞蟻全場景落地的優(yōu)化

饒星

螞蟻集團(tuán)高級(jí)技術(shù)專家

89495a84-ad07-11ed-bfe3-dac502259ad0.jpg

螞蟻集團(tuán)推理團(tuán)隊(duì)技術(shù)負(fù)責(zé)人,負(fù)責(zé)螞蟻集團(tuán)全部業(yè)務(wù)場景的推理服務(wù),長期專注在推理相關(guān)的架構(gòu)和性能優(yōu)化。

議題簡介:

  • Triton 在搜索、推薦、廣告業(yè)務(wù)場景的解決方案

  • Triton 在認(rèn)知業(yè)務(wù)的解決方案

  • 結(jié)合業(yè)務(wù)場景,螞蟻進(jìn)一步的優(yōu)化方案

議題三:Triton 在美團(tuán)數(shù)據(jù)中心的應(yīng)用

王新

美團(tuán)機(jī)器學(xué)習(xí)平臺(tái)預(yù)測引擎團(tuán)隊(duì)

技術(shù)負(fù)責(zé)人

8968707c-ad07-11ed-bfe3-dac502259ad0.png

美團(tuán)機(jī)器學(xué)習(xí)平臺(tái)預(yù)測引擎團(tuán)隊(duì)技術(shù)負(fù)責(zé)人,長期專注于機(jī)器學(xué)習(xí)預(yù)測引擎相關(guān)的開發(fā)工作。

議題簡介:

  • 機(jī)器學(xué)習(xí)模型在美團(tuán)落地的痛點(diǎn)

  • Triton 落地的具體方案

  • 使用 Triton 的業(yè)務(wù)收益與效果

議題四:Triton 在京東零售的應(yīng)用與實(shí)踐

楊培軍

京東零售算法中臺(tái)技術(shù)架構(gòu)師

89a674c6-ad07-11ed-bfe3-dac502259ad0.jpg

長期從事機(jī)器學(xué)習(xí)平臺(tái)/深度學(xué)習(xí)推理加速和框架的研發(fā),曾負(fù)責(zé)阿里媽媽搜索廣告預(yù)估平臺(tái)、Bigo 機(jī)器學(xué)習(xí)平臺(tái)的建設(shè)。

議題簡介:

  • 京東零售的多元化算法需求給模型推理帶來的挑戰(zhàn)

  • 介紹京東算法中臺(tái)在面向 CV/NLP 場景基于 Triton 二次開發(fā)的高性能推理框架

  • 闡述推理框架的架構(gòu)演進(jìn)和性能優(yōu)化工作

圓桌討論:AI 推理服務(wù)的當(dāng)下與未來

特邀嘉賓:郭城

蔚來自動(dòng)駕駛研發(fā)平臺(tái) (NADP)資深工程師

89baadc4-ad07-11ed-bfe3-dac502259ad0.jpg

負(fù)責(zé)搭建 NADP 云上推理系統(tǒng),模型 CICD。

交通指引 & 防疫政策

1. 自駕到場:

開車行進(jìn)至“環(huán)球金融中心”,在大樓南側(cè)地下停車場進(jìn)入。

2. 地鐵前往:

地鐵 10 號(hào)線至“金臺(tái)夕照”站,從 A 口出,步行 3-5 分鐘,從環(huán)球金融中心南門進(jìn)入。


原文標(biāo)題:如何最大化推理性能?Triton 社區(qū)技術(shù)交流活動(dòng)與您暢聊

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3842

    瀏覽量

    91807

原文標(biāo)題:如何最大化推理性能?Triton 社區(qū)技術(shù)交流活動(dòng)與您暢聊

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    解鎖NVIDIA TensorRT-LLM的卓越性能

    Batching、Paged KV Caching、量化技術(shù) (FP8、INT4 AWQ、INT8 SmoothQuant 等) 以及更多功能,確保的 NVIDIA GPU 能發(fā)揮出卓越的推理性能。
    的頭像 發(fā)表于 12-17 17:47 ?261次閱讀

    光伏發(fā)電如何實(shí)現(xiàn)能效最大化

    光伏發(fā)電實(shí)現(xiàn)能效最大化是一個(gè)綜合性的問題,需要從多個(gè)方面入手。以下是一些關(guān)鍵措施: 一、選用優(yōu)質(zhì)設(shè)備 太陽能板 :選用具有高光電轉(zhuǎn)化效率和穩(wěn)定性的太陽能板是基礎(chǔ)。例如,單晶硅太陽能板通常比多
    的頭像 發(fā)表于 12-05 11:06 ?358次閱讀

    賽力斯與奧托立夫技術(shù)交流日順利舉行

    近日,奧托立夫首次走進(jìn)賽力斯,在其重慶總部舉辦了一場規(guī)模盛大的全方位技術(shù)交流活動(dòng),并把前沿的安全黑科技和安全系統(tǒng)集成解決方案帶到了賽力斯。借此活動(dòng),雙方加深了對彼此在研發(fā)與市場方向的認(rèn)知,深化了合作關(guān)系,共同攜手打造了一場高水準(zhǔn)、高品質(zhì)、高規(guī)格的汽車安全產(chǎn)業(yè)
    的頭像 發(fā)表于 12-02 14:25 ?294次閱讀

    潤和軟件參與openEuler社區(qū)操作系統(tǒng)安全主題技術(shù)交流

    Meetup,分享和交流openEuler社區(qū)在操作系統(tǒng)安全領(lǐng)域的最新進(jìn)展、安全特性和實(shí)踐案例。江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)作為openEuler項(xiàng)目群黃金捐贈(zèng)人受邀參與技術(shù)交流。
    的頭像 發(fā)表于 11-13 16:14 ?476次閱讀

    潤和軟件2024南京開源生態(tài)發(fā)展交流活動(dòng)回顧

    基金會(huì)OpenHarmony項(xiàng)目群初始成員單位、A類捐贈(zèng)人、核心共建單位,以及南京本地引領(lǐng)開源生態(tài)發(fā)展與技術(shù)創(chuàng)新的重點(diǎn)企業(yè),與母公司江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)共同參與承辦“2024南京開源生態(tài)發(fā)展交流活動(dòng)”,并受邀出席“2024‘才匯金陵’高層次軟件
    的頭像 發(fā)表于 09-23 16:03 ?849次閱讀

    開箱即用,AISBench測試展示英特爾至強(qiáng)處理器的卓越推理性能

    近期,第五代英特爾?至強(qiáng)?可擴(kuò)展處理器通過了中國電子技術(shù)標(biāo)準(zhǔn)化研究院組織的人工智能服務(wù)器系統(tǒng)性能測試(AISBench)。英特爾成為首批通過AISBench大語言模型(LLM)推理性能測試的企業(yè)
    的頭像 發(fā)表于 09-06 15:33 ?412次閱讀
    開箱即用,AISBench測試展示英特爾至強(qiáng)處理器的卓越<b class='flag-5'>推理性能</b>

    魔搭社區(qū)借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區(qū)是中國最具影響力的模型開源社區(qū),致力給開發(fā)者提供模型即服務(wù)的體驗(yàn)。魔搭社區(qū)利用NVIDIA TensorRT-LLM,大大提高了大語言模型的推理性能,方便了模型應(yīng)用部署,提高
    的頭像 發(fā)表于 08-23 15:48 ?496次閱讀

    賽力斯與意法半導(dǎo)體技術(shù)交流活動(dòng)成功舉辦

    ???????近日,中國新能源汽車行業(yè)的領(lǐng)軍企業(yè)賽力斯(Seres)與意法半導(dǎo)體,在重慶聯(lián)合舉辦技術(shù)交流活動(dòng)。
    的頭像 發(fā)表于 08-01 10:18 ?1587次閱讀

    奧托立夫與深藍(lán)汽車技術(shù)交流活動(dòng)圓滿落幕

    2024年7月23日,奧托立夫深入合作伙伴深藍(lán)汽車重慶總部,成功舉辦了一場以“智馭安全·共筑未來”為核心議題的技術(shù)交流活動(dòng)。此次活動(dòng)不僅深化了雙方在汽車安全領(lǐng)域的合作紐帶,更彰顯了雙方攜手并進(jìn)、共筑汽車安全新高地的堅(jiān)定信念。
    的頭像 發(fā)表于 07-24 09:58 ?617次閱讀

    0706線下活動(dòng) I DDR4/DDR5內(nèi)存技術(shù)高速信號(hào)專題設(shè)計(jì)技術(shù)交流活動(dòng)

    01活動(dòng)主題DDR4/DDR5內(nèi)存技術(shù)高速信號(hào)專題設(shè)計(jì)技術(shù)交流活動(dòng)時(shí)間:2024年7月6日(本周六)10:00地點(diǎn):深圳市南山區(qū)科技南十二路曙光大廈1002(深圳地鐵1號(hào)線,高新園地鐵站D出口200
    的頭像 發(fā)表于 07-06 08:12 ?392次閱讀
    0706線下<b class='flag-5'>活動(dòng)</b> I DDR4/DDR5內(nèi)存<b class='flag-5'>技術(shù)</b>高速信號(hào)專題設(shè)計(jì)<b class='flag-5'>技術(shù)交流活動(dòng)</b>

    紫光同芯出席“走進(jìn)理想”技術(shù)展覽及交流活動(dòng)

    6月27日,“走進(jìn)理想”技術(shù)展覽及交流活動(dòng)在北京圓滿落幕。紫光同芯受邀出席,與行業(yè)專家、業(yè)界精英共聚一堂,圍繞電動(dòng)化、智能化、輕量化等關(guān)鍵領(lǐng)域核心技術(shù),深入探討智能汽車發(fā)展進(jìn)程中的創(chuàng)新路徑。
    的頭像 發(fā)表于 07-02 14:45 ?557次閱讀

    法雷奧集團(tuán)技術(shù)交流活動(dòng)圓滿結(jié)束!

    交流,共同探討目前行業(yè)熱點(diǎn)及最新技術(shù)?!?b class='flag-5'>活動(dòng)現(xiàn)場本次技術(shù)交流會(huì)得到法雷奧集團(tuán)的大力支持,各個(gè)部門工程師都積極參與。同星智能針對當(dāng)前客戶的相關(guān)需求,在本次
    的頭像 發(fā)表于 06-08 08:22 ?386次閱讀
    法雷奧集團(tuán)<b class='flag-5'>技術(shù)交流</b>日<b class='flag-5'>活動(dòng)</b>圓滿結(jié)束!

    2024瑞薩技術(shù)交流日進(jìn)行中,米爾誠邀參觀

    2024年5月28日,全球半導(dǎo)體解決方案供應(yīng)商瑞薩電子舉辦的“2024年瑞薩技術(shù)交流日”在深圳拉開序幕。米爾作為領(lǐng)先的嵌入式處理器模組廠商將出席此次活動(dòng)米爾電子在現(xiàn)場展出瑞米派RemiPi,以及米爾
    的頭像 發(fā)表于 05-30 08:01 ?508次閱讀
    2024瑞薩<b class='flag-5'>技術(shù)交流</b>日進(jìn)行中,米爾誠邀<b class='flag-5'>您</b>參觀

    自然語言處理應(yīng)用LLM推理優(yōu)化綜述

    當(dāng)前,業(yè)界在將傳統(tǒng)優(yōu)化技術(shù)引入 LLM 推理的同時(shí),同時(shí)也在探索從大模型自回歸解碼特點(diǎn)出發(fā),通過調(diào)整推理過程和引入新的模型結(jié)構(gòu)來進(jìn)一步提升推理性能。
    發(fā)表于 04-10 11:48 ?669次閱讀
    自然語言處理應(yīng)用LLM<b class='flag-5'>推理</b>優(yōu)化綜述

    使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測

    這家云計(jì)算巨頭的計(jì)算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測。
    的頭像 發(fā)表于 02-29 14:04 ?627次閱讀