0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

周四研討會預(yù)告 | 注冊報名 NVIDIA AI Inference Day - 大模型推理線上研討會

NVIDIA英偉達 ? 來源:未知 ? 2023-10-26 09:05 ? 次閱讀

由 CSDN 舉辦的 NVIDIA AI Inference Day - 大模型推理線上研討會,將幫助您了解 NVIDIA 開源大型語言模型(LLM)推理加速庫 TensorRT-LLM及其功能,使用 NVIDIA TritonTM推理服務(wù)器進行端到端部署 LLM Serving,以及金融行業(yè)的 AI、NLP/LLM 應(yīng)用場景、客戶案例。


通過本次活動,您將了解基于上述產(chǎn)品的 LLM 推理加速和部署的服務(wù)化實現(xiàn)管道、性能收益,以及金融行業(yè)加速計算解決方案,為您 LLM 和生成式 AI 開發(fā)的增效降本提供領(lǐng)先的技術(shù)路線參考和知識儲備。建議 AI 領(lǐng)域的數(shù)據(jù)科學(xué)家、AI 開發(fā)者程序員、MLOps,DevOps,IT 運維及 leader,參與本次線上研討會。


NVIDIA TensorRT-LLM 和 Triton 是 NVIDIA AI Enterprise 的一部分(https://www.nvidia.cn/data-center/products/ai-enterprise/), 這是一款端到端的 AI 軟件平臺,為企業(yè)級的安全、穩(wěn)定、管理和支持任務(wù)提供至關(guān)重要的 AI 推理解決方案。


注冊報名 NVIDIA AI Inference

Day - 大模型推理線上研討會


活動日程



2023/10/26 19:30 – 21:00


研討會將涵蓋以下主題:


1. 利用 NVIDIA TensorRT-LLM 加速大模型推理


  • NVIDIA TensorRT-LLM 簡介:產(chǎn)品定位,與原有產(chǎn)品的關(guān)系

  • 現(xiàn)支持的模型

  • 現(xiàn)支持的主要功能,如 KV-cache,各種量化方法等

  • 性能

  • 未來路線圖


2. 基于 NVIDIA Triton 推理服務(wù)器端到端部署 LLM serving


  • NVIDIA TensorRT-LLM 的任務(wù)調(diào)度方案,in-flight batching 的基礎(chǔ)原理

  • NVIDIA Triton 推理服務(wù)器的 TensorRT-LLM backend 介紹

  • 基于 Triton 端到端部署 LLM 的完整解決方案(以 Llama 2 70B 為例)

  • 相關(guān) benchmark 參考結(jié)果


3. 金融行業(yè) AI 應(yīng)用場景分享與 NVIDIA 加速計算解決方案介紹


  • 金融行業(yè) AI 應(yīng)用場景及客戶案例

  • NLP/LLM 在金融行業(yè)的潛在應(yīng)用場景

  • NVIDIA 針對金融場景的加速計算解決方案


演講嘉賓


季光

NVIDIA GPU 加速計算專家團隊經(jīng)理


盧翔龍

NVIDIA 資深解決方案架構(gòu)師


史永明

NVIDIA 工程與解決方案架構(gòu)經(jīng)理


參與方式


微信識別上方二維碼,注冊參加本次活動


相關(guān)資料


快速上手 TensorRT-LLM 的資源如下:


  • 訪問 GitHub 倉庫,獲取開源代碼:https://github.com/NVIDIA/TensorRT-LLM

  • 探索 TensorRT-LLM 的示例代碼:https://github.com/NVIDIA/TensorRT-LLM/tree/release/0.5.0/examples

    benchmark:https://nvidia.github.io/TensorRT-LLM/performance.html

    以及用戶手冊:https://nvidia.github.io/TensorRT-LLM/index.html




GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。點擊“閱讀原文”掃描下方海報二維碼,關(guān)注更多會議及活動信息。



原文標(biāo)題:周四研討會預(yù)告 | 注冊報名 NVIDIA AI Inference Day - 大模型推理線上研討會

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3893

    瀏覽量

    92602

原文標(biāo)題:周四研討會預(yù)告 | 注冊報名 NVIDIA AI Inference Day - 大模型推理線上研討會

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦

    2025年星閃技術(shù)應(yīng)用巡回研討會-深圳站火熱報名

    2025年星閃技術(shù)應(yīng)用巡回研討會-深圳站火熱報名中,感興趣的可以關(guān)注【國際星閃聯(lián)盟】微信公眾號了解活動信息。
    發(fā)表于 03-25 10:17

    邁來芯機器人解決方案專題研討會預(yù)告

    2月19日 “詳解邁來芯機器人解決方案”專題研討會邀請您參加。
    的頭像 發(fā)表于 02-14 13:36 ?257次閱讀

    Allegro電流傳感器線上研討會預(yù)告

    隨著電力電子技術(shù)在汽車、工業(yè)和消費電子等領(lǐng)域的快速發(fā)展,市場對電流檢測精度、效率和可靠性的要求日益增高。當(dāng)下的電流采樣電阻(“分流器”)方案在高電流、高頻率和高隔離度應(yīng)用中逐漸顯現(xiàn)出局限性,例如功耗高、溫漂大、體積大等問題。為應(yīng)對這些挑戰(zhàn),Allegro 特別策劃了本場線上研討會
    的頭像 發(fā)表于 02-07 14:15 ?265次閱讀

    PI在線研討會活動預(yù)告

    PI公司誠邀您參加由21ic舉辦的在線研討會。我們的技術(shù)專家將介紹多款高集成電源開關(guān)IC產(chǎn)品,在不犧牲空載或峰值負(fù)載性能的情況下,在整個負(fù)載范圍內(nèi)(包括待機和睡眠模式)實現(xiàn)最大功率變換效率。
    的頭像 發(fā)表于 01-08 16:41 ?566次閱讀

    2025電子設(shè)計與制造技術(shù)研討會

    本帖最后由 jf_32813774 于 2024-12-26 16:14 編輯 電子工程師不可錯過的技術(shù)研討會,終于火熱啟動了! 為了讓廣大電子行業(yè)從業(yè)者共聚一堂,探索前沿科技,共話創(chuàng)新未來
    發(fā)表于 12-18 10:23

    Imagination 系列研討會 |中國生成式 AI 的發(fā)展

    近期,Imagination將陸續(xù)推出全新系列研討會,涵蓋邊緣AI如何推動工業(yè)物聯(lián)網(wǎng)的發(fā)展,生成式AI,智能汽車未來發(fā)展趨勢等等多個熱門話題。本期研討會中,Imagination中國區(qū)
    的頭像 發(fā)表于 12-09 16:57 ?500次閱讀
    Imagination 系列<b class='flag-5'>研討會</b> |中國生成式 <b class='flag-5'>AI</b> 的發(fā)展

    飛騰成功舉辦散熱技術(shù)應(yīng)用發(fā)展研討會

    近日,飛騰公司在深圳成功舉辦了 “散熱技術(shù)應(yīng)用發(fā)展研討會”,并與合作伙伴共同成立業(yè)內(nèi)首個“散熱技術(shù)應(yīng)用發(fā)展聯(lián)合中心”。此次研討會匯聚了眾多業(yè)界專家,共同探討散熱技術(shù)的最新應(yīng)用、發(fā)展趨勢及產(chǎn)業(yè)合作等關(guān)鍵議題,旨在推動散熱技術(shù)的快速發(fā)展與廣泛應(yīng)用,加強行業(yè)內(nèi)的合作與交流。
    的頭像 發(fā)表于 11-21 16:04 ?446次閱讀

    精彩回顧 : 向新而行 云啟未來——2024高云FPGA線上技術(shù)研討會

    向新而行 云啟未來 2024高云FPGA線上技術(shù)研討會 近日,由高云半導(dǎo)體主辦的“ 向新而行 云啟未來——2024高云FPGA線上技術(shù)研討會”成功舉辦。 本次
    發(fā)表于 11-18 18:24 ?391次閱讀
    精彩回顧 : 向新而行 云啟未來——2024高云FPGA<b class='flag-5'>線上</b>技術(shù)<b class='flag-5'>研討會</b>

    芯華章硬件專場研討會順利舉辦

    近日,2024芯華章驗證技術(shù)研討會——Hardware Verification Workshop圓滿舉辦。
    的頭像 發(fā)表于 11-14 13:57 ?448次閱讀

    Atlassian研討會預(yù)告 | 探討AI在服務(wù)管理中的應(yīng)用現(xiàn)狀、實戰(zhàn)案例、面臨的挑戰(zhàn)與趨勢等

    AI在服務(wù)管理中的應(yīng)用揭秘!11月14日早7點,Atlassian研討會誠邀您探討AI如何賦能服務(wù)團隊提升效率、增強客戶體驗,更有美國O2O行業(yè)領(lǐng)導(dǎo)者Thumbtack的實戰(zhàn)分享!歡迎報名
    的頭像 發(fā)表于 11-06 14:59 ?286次閱讀
    Atlassian<b class='flag-5'>研討會</b><b class='flag-5'>預(yù)告</b> | 探討<b class='flag-5'>AI</b>在服務(wù)管理中的應(yīng)用現(xiàn)狀、實戰(zhàn)案例、面臨的挑戰(zhàn)與趨勢等

    MathWorks公司將舉辦線上專題研討會

    MathWorks 公司將于 11 月 14 日 (周四)下午 14:00 通過騰訊會議舉行主題為 《基于模型的設(shè)計開發(fā)符合 ISO 26262 和 DO-178C 的應(yīng)用軟件》 的專題研討會,誠邀您參會。
    的頭像 發(fā)表于 10-31 16:29 ?487次閱讀

    開始報名!PCB/封裝設(shè)計及系統(tǒng) SI/PI/Thermal 仿真專場研討會——2024 Cadence 中國技術(shù)巡回研討會

    2024Cadence中國技術(shù)巡回研討會—PCB,封裝設(shè)計及系統(tǒng)SI/PI/Thermal仿真專場研討會將于10月下旬在北京與深圳召開。本次線下研討會將聚焦于電子設(shè)計自動化領(lǐng)域的最新技術(shù)發(fā)展和成果
    的頭像 發(fā)表于 09-28 08:02 ?454次閱讀
    開始<b class='flag-5'>報名</b>!PCB/封裝設(shè)計及系統(tǒng) SI/PI/Thermal 仿真專場<b class='flag-5'>研討會</b>——2024 Cadence 中國技術(shù)巡回<b class='flag-5'>研討會</b>

    中科億海微國產(chǎn)FPGA線上研討會

    國產(chǎn)FPGA線上研討會
    的頭像 發(fā)表于 06-24 10:17 ?491次閱讀
    中科億海微國產(chǎn)FPGA<b class='flag-5'>線上</b><b class='flag-5'>研討會</b>

    線上研討會:FPGA+金融丨硬件行情加速系統(tǒng) 打造極速交易場景

    線上研討會:FPGA+金融丨硬件行情加速系統(tǒng) 打造極速交易場景
    的頭像 發(fā)表于 06-12 18:16 ?468次閱讀
    <b class='flag-5'>線上</b><b class='flag-5'>研討會</b>:FPGA+金融丨硬件行情加速系統(tǒng) 打造極速交易場景

    啟揚智能受邀參加2024恩智浦技術(shù)巡回研討會

    2024年5月9日,恩智浦技術(shù)日技術(shù)巡回研討會—工業(yè)和物聯(lián)網(wǎng)專場在杭州舉行。此次研討會匯聚了眾多行業(yè)專家,聚焦前沿性的賦能技術(shù),覆蓋UWB超寬帶、智能工業(yè)、智能家居、醫(yī)療保健等熱門應(yīng)用。作為恩智浦
    的頭像 發(fā)表于 05-10 08:00 ?571次閱讀
    啟揚智能受邀參加2024恩智浦技術(shù)巡回<b class='flag-5'>研討會</b>

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品