0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在 NGC 上玩轉(zhuǎn)新一代推理部署工具 FastDeploy,幾行代碼搞定 AI 部署

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:未知 ? 2022-12-13 19:50 ? 次閱讀

號(hào)外:

全場(chǎng)景高性能 AI 部署工具

FastDeploy 發(fā)版 v1.0

幾行代碼搞定 AI 部署,快速使用 150+ 預(yù)置部署示例,支持 CV、NLP、Speech、Cross-model 模型,并提供開箱即用的云邊端部署體驗(yàn),實(shí)現(xiàn) AI 模型端到端的推理性能優(yōu)化。

歡迎廣大開發(fā)者使用 NVIDIA 與飛槳聯(lián)合深度適配的 NGC 飛槳容器,在 NVIDIA GPU 上進(jìn)行體驗(yàn) FastDeploy!

全場(chǎng)景高性能 AI 部署工具 FastDeploy

人工智能技術(shù)在各行各業(yè)正加速應(yīng)用落地。為了向開發(fā)者提供產(chǎn)業(yè)實(shí)踐推理部署最優(yōu)解,百度飛槳發(fā)起了 FastDeploy 開源項(xiàng)目。FastDeploy 具備全場(chǎng)景、簡(jiǎn)單易用、極致高效三大特點(diǎn)。

(1)簡(jiǎn)單易用:幾行代碼完成 AI 模型的 GPU 部署,一行命令切換推理后端,快速體驗(yàn) 150+ 熱門模型部署

FastDeploy 精心設(shè)計(jì)模型 API,不同語(yǔ)言統(tǒng)一 API 體驗(yàn),只需要幾行核心代碼,就可以實(shí)現(xiàn)預(yù)知模型的高性能推理,極大降低了 AI 模型部署難度和工作量。一行命令切換 TensorRT、Paddle Inference、ONNX Runtime、Poros 等不同推理后端,充分利用推理引擎在 GPU 硬件上的優(yōu)勢(shì)。

import fastdeploy as fd
import cv2
option = fd.RuntimeOption()
option.use_gpu()
option.use_trt_backend() # 一行命令切換使用 TensorRT部署
model = fd.vision.detection.PPYOLOE("model.pdmodel", 
                                    "model.pdiparams", 
                                    "infer_cfg.yml",
                                    runtime_option=option)
im = cv2.imread("test.jpg")
result=model.predict(im)

FastDeploy 幾行命令完成 AI 模型部署

FastDeploy 支持 CV、NLP、Speech、Cross-modal(跨模態(tài))四大 AI 領(lǐng)域,覆蓋 20 多主流場(chǎng)景、150 多個(gè) SOTA 產(chǎn)業(yè)模型的端到端示例,包括圖像分類、圖像分割、語(yǔ)義分割、物體檢測(cè)、字符識(shí)別(OCR)、人臉檢測(cè)、人臉關(guān)鍵點(diǎn)檢測(cè)、人臉識(shí)別、人像扣圖、視頻扣圖、姿態(tài)估計(jì)、文本分類、信息抽取、文圖生成、行人跟蹤、語(yǔ)音合成等。支持飛槳 PaddleClas、PaddleDetection、PaddleSeg、PaddleOCR、PaddleNLP、PaddleSpeech 6 大熱門 AI 套件的主流模型及生態(tài)(如 PyTorch、ONNX 等)熱門模型的部署。

ce727aea-7adb-11ed-8abf-dac502259ad0.png

FastDeploy 在 NVIDIA GPU、Jetson上的 AI 模型部署庫(kù)

(2)全場(chǎng)景:支持多框架,輕松搞定 PaddlePaddle、PyTorch、ONNX 等模型部署

FastDeploy 支持 TensorRT、Paddle Inference、ONNX Runtime、Poros 推理引擎,統(tǒng)一部署 API,只需要一行代碼,便可靈活切換多個(gè) GPU 推理引擎后端。內(nèi)置了 X2Paddle 和 Paddle2ONNX 模型轉(zhuǎn)換工具,只需要一行命令便可完成其他深度學(xué)習(xí)框架到飛槳以及 ONNX 的相互轉(zhuǎn)換,讓其他框架的開發(fā)者也能通過 FastDeploy 體驗(yàn)到飛槳模型壓縮與推理引擎的端到端優(yōu)化效果。覆蓋 GPU、Jetson Nano、Jetson TX2、Jetson AGX、Jetson Orin 等云邊端場(chǎng)景全系列 NVIDIA 硬件部署。同時(shí)支持服務(wù)化部署、離線部署、端側(cè)部署方式。

cefeae48-7adb-11ed-8abf-dac502259ad0.png

(3)極致高效:一鍵壓縮提速,預(yù)處理加速,端到端性能優(yōu)化,提升 AI 算法產(chǎn)業(yè)落地

FastDeploy 集成了自動(dòng)壓縮工具,在參數(shù)量大大減小的同時(shí)(精度幾乎無(wú)損),推理速度大幅提升。使用 CUDA 加速優(yōu)化預(yù)處理和后處理模塊,將 YOLO 系列的模型推理加速整體從 41ms 優(yōu)化到 25ms。端到端的優(yōu)化策略,徹底解決 AI 部署落地中的性能難題。更多性能優(yōu)化,歡迎關(guān)注 GitHub 了解詳情。

https://github.com/PaddlePaddle/FastDeploy

cf2995a4-7adb-11ed-8abf-dac502259ad0.png

FastDeploy 一行命令實(shí)現(xiàn)自動(dòng)壓縮,充分利用硬件資源提升推理速度

cf465f7c-7adb-11ed-8abf-dac502259ad0.png

FastDeploy 提升 AI 任務(wù)端到端推理速

直播預(yù)告:服務(wù)化部署高并發(fā)調(diào)優(yōu)實(shí)戰(zhàn)

12 月 12 日 - 12 月 30 日,《產(chǎn)業(yè)級(jí) AI 模型部署全攻略》系列直播課程,F(xiàn)astDeploy 聯(lián)合 10 家硬件公司與大家直播見面。

12 月 14 日 20:30 開始,NVIDIA 與百度資深專家將為大家?guī)?lái)以“一鍵搞定服務(wù)化部署,實(shí)現(xiàn)穩(wěn)定高并發(fā)服務(wù)”為主題的精彩分享,詳細(xì)解說 FastDeploy 服務(wù)化部署實(shí)戰(zhàn)教學(xué),以及如何提升 GPU 利用率和吞吐量!歡迎大家掃碼報(bào)名獲取直播鏈接,加入交流群與行業(yè)精英深度共同探討 AI 部署落地話題。

一鍵搞定服務(wù)化部署

實(shí)現(xiàn)穩(wěn)定高并發(fā)服務(wù)

cf8eaeb2-7adb-11ed-8abf-dac502259ad0.png

12 月 14 日,星期三,20:30

精彩亮點(diǎn)

  • 企業(yè)級(jí) NGC 容器,快速獲取強(qiáng)大的軟硬件能力

  • 三行代碼搞定 AI 部署,一鍵體驗(yàn) 150+ 部署 demo

  • 服務(wù)化部署實(shí)戰(zhàn)教學(xué),提升 GPU 利用率和吞吐量

會(huì)議嘉賓

cfa5c0fc-7adb-11ed-8abf-dac502259ad0.jpg

Adam | NVIDIA 亞太區(qū)資深產(chǎn)品經(jīng)理

cfd0522c-7adb-11ed-8abf-dac502259ad0.png

Jason|百度資深研發(fā)工程師

參與方式

d0400824-7adb-11ed-8abf-dac502259ad0.png

掃碼報(bào)名獲取直播鏈接


原文標(biāo)題:在 NGC 上玩轉(zhuǎn)新一代推理部署工具 FastDeploy,幾行代碼搞定 AI 部署

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3780

    瀏覽量

    91205

原文標(biāo)題:在 NGC 上玩轉(zhuǎn)新一代推理部署工具 FastDeploy,幾行代碼搞定 AI 部署

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    企業(yè)AI模型部署攻略

    當(dāng)下,越來(lái)越多的企業(yè)開始探索和實(shí)施AI模型,以提升業(yè)務(wù)效率和競(jìng)爭(zhēng)力。然而,AI模型的部署并非易事,需要企業(yè)多個(gè)層面進(jìn)行細(xì)致的規(guī)劃和準(zhǔn)備。下面,AI
    的頭像 發(fā)表于 12-23 10:31 ?130次閱讀

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    應(yīng)用而設(shè)計(jì),模塊的參數(shù)如下圖所示。 這個(gè)模塊有著個(gè)很吸引人的特點(diǎn)與飛槳低代碼開發(fā)工具 PaddleX 完美適配,配合飛槳星河社區(qū) Al Studio, 可以實(shí)現(xiàn)鍵訓(xùn)練;配合凌智視覺
    發(fā)表于 12-19 14:33

    如何開啟Stable Diffusion WebUI模型推理部署

    如何開啟Stable Diffusion WebUI模型推理部署
    的頭像 發(fā)表于 12-11 20:13 ?113次閱讀
    如何開啟Stable Diffusion WebUI模型<b class='flag-5'>推理</b><b class='flag-5'>部署</b>

    AI模型部署邊緣設(shè)備的奇妙之旅:如何實(shí)現(xiàn)手寫數(shù)字識(shí)別

    種更適合生產(chǎn)環(huán)境的框架來(lái)部署。此外,許多推理引擎和硬件加速器也支持ONNX格式,從而進(jìn)步加快了模型部署的速度。 凌智視覺模塊中模型轉(zhuǎn)換就
    發(fā)表于 12-06 17:20

    用Ollama輕松搞定Llama 3.2 Vision模型本地部署

    Ollama 是個(gè)開源的大語(yǔ)言模型服務(wù)工具,它的核心目的是簡(jiǎn)化大語(yǔ)言模型(LLMs)的本地部署和運(yùn)行過程,請(qǐng)參考《Gemma 2+Ollama算力魔方
    的頭像 發(fā)表于 11-23 17:22 ?1162次閱讀
    用Ollama輕松<b class='flag-5'>搞定</b>Llama 3.2 Vision模型本地<b class='flag-5'>部署</b>

    如何在STM32f4系列開發(fā)板上部署STM32Cube.AI,

    已下載STM32Cube.AI擴(kuò)展包,但是無(wú)法使用,感覺像是沒有部署AI模型,我是想要通過攝像頭拍照,上傳圖像后,經(jīng)過開發(fā)板處理器進(jìn)行AI模型處理識(shí)別過后,告訴我識(shí)別結(jié)果,顯示
    發(fā)表于 11-18 09:39

    設(shè)備利用AI Edge Torch生成式API部署自定義大語(yǔ)言模型

    ,從而無(wú)縫地將新的設(shè)備端生成式 AI 模型部署到邊緣設(shè)備。本文是 Google AI Edge 博客連載的第二篇。
    的頭像 發(fā)表于 11-14 10:23 ?453次閱讀
    <b class='flag-5'>在</b>設(shè)備<b class='flag-5'>上</b>利用<b class='flag-5'>AI</b> Edge Torch生成式API<b class='flag-5'>部署</b>自定義大語(yǔ)言模型

    YOLOv6LabVIEW中的推理部署(含源碼)

    相關(guān)介紹文章,所以筆者實(shí)現(xiàn)YOLOv6 ONNX LabVIEW中的部署推理后,決定和各位讀者分享下如何使用LabVIEW實(shí)現(xiàn)YOLO
    的頭像 發(fā)表于 11-06 16:07 ?312次閱讀
    YOLOv6<b class='flag-5'>在</b>LabVIEW中的<b class='flag-5'>推理</b><b class='flag-5'>部署</b>(含源碼)

    使用OpenVINO Model Server在哪吒開發(fā)板上部署模型

    OpenVINO Model Server(OVMS)是個(gè)高性能的模型部署系統(tǒng),使用C++實(shí)現(xiàn),并在Intel架構(gòu)部署進(jìn)行了優(yōu)化,使用OpenVINO 進(jìn)行
    的頭像 發(fā)表于 11-01 14:19 ?298次閱讀
    使用OpenVINO Model Server在哪吒開發(fā)板上<b class='flag-5'>部署</b>模型

    混合部署 | RK3568同時(shí)部署RT-Thread和Linux系統(tǒng)-迅為電子

    混合部署 | RK3568同時(shí)部署RT-Thread和Linux系統(tǒng)-迅為電子
    的頭像 發(fā)表于 09-06 15:32 ?433次閱讀
    混合<b class='flag-5'>部署</b> | <b class='flag-5'>在</b>RK3568<b class='flag-5'>上</b>同時(shí)<b class='flag-5'>部署</b>RT-Thread和Linux系統(tǒng)-迅為電子

    三行代碼完成生成式AI部署

    LLM加載與推理部署能力,實(shí)現(xiàn)了OpenVINO對(duì)CNN網(wǎng)絡(luò)、生成式模型、LLM網(wǎng)絡(luò)主流模型的全面推理支持。
    的頭像 發(fā)表于 08-30 16:49 ?428次閱讀
    三行<b class='flag-5'>代碼</b>完成生成式<b class='flag-5'>AI</b><b class='flag-5'>部署</b>

    簡(jiǎn)單兩步使用OpenVINO?搞定Qwen2的量化與部署任務(wù)

    英特爾 OpenVINO? 工具套件是款開源 AI 推理優(yōu)化部署工具套件,可幫助開發(fā)人員和企
    的頭像 發(fā)表于 04-26 09:39 ?1706次閱讀
    簡(jiǎn)單兩步使用OpenVINO?<b class='flag-5'>搞定</b>Qwen2的量化與<b class='flag-5'>部署</b>任務(wù)

    簡(jiǎn)單三步使用OpenVINO?搞定ChatGLM3的本地部署

    英特爾 OpenVINO? 工具套件是款開源 AI 推理優(yōu)化部署工具套件,可幫助開發(fā)人員和企
    的頭像 發(fā)表于 04-03 18:18 ?2119次閱讀
    簡(jiǎn)單三步使用OpenVINO?<b class='flag-5'>搞定</b>ChatGLM3的本地<b class='flag-5'>部署</b>

    使用CUBEAI部署tflite模型到STM32F0中,模型創(chuàng)建失敗怎么解決?

    看到CUBE_AI已經(jīng)支持到STM32F0系列芯片,就想拿來(lái)入門嵌入式AI。 生成的模型很小,是可以部署到F0的,但是直無(wú)法創(chuàng)建成功。
    發(fā)表于 03-15 08:10

    基于OpenCV DNN實(shí)現(xiàn)YOLOv8的模型部署推理演示

    基于OpenCV DNN實(shí)現(xiàn)YOLOv8推理的好處就是代碼就可以部署Windows10系統(tǒng)、烏班圖系統(tǒng)、Jetson的Jetpack系
    的頭像 發(fā)表于 03-01 15:52 ?1681次閱讀
    基于OpenCV DNN實(shí)現(xiàn)YOLOv8的模型<b class='flag-5'>部署</b>與<b class='flag-5'>推理</b>演示