0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Sensory Cloud利用NVIDIA Triton運(yùn)行語音和視覺模型

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-07-10 09:37 ? 次閱讀

企業(yè)可以使用混合模型改進(jìn)喚醒詞、語音轉(zhuǎn)文本、設(shè)備安全等。

你可能不了解 Todd Mozer,但卻很有可能已經(jīng)體驗(yàn)過該公司的技術(shù)——該公司已經(jīng)為全球數(shù)十億消費(fèi)電子設(shè)備實(shí)現(xiàn)了語音和視覺 AI

Sensory于 1994 年創(chuàng)立于硅谷,致力于為行業(yè)巨頭的移動(dòng)設(shè)備提供先進(jìn)的緊湊模型。如今,Sensory 為各種語音電子產(chǎn)品提供了互動(dòng)性。LG 和三星不僅在手機(jī),還在冰箱、遙控器和可穿戴設(shè)備中使用 Sensory。

CEO 兼創(chuàng)始人 Mozer 表示:“當(dāng)我想讓我的語音微波爐連接網(wǎng)絡(luò)搜索食譜,并為我讀出這個(gè)食譜時(shí),混合計(jì)算方法就可以發(fā)揮作用?!?/p>

混合計(jì)算是一種結(jié)合云和本地計(jì)算資源的方法。

該公司的最新成果依靠于用于建立先進(jìn)對(duì)話式 AI 模型的工具包NVIDIANeMo以及用于其SensoryCloud混合計(jì)算單元的NVIDIATriton 推理服務(wù)器。

電子設(shè)備更智能

設(shè)備正在變得越來越強(qiáng)大。雖然市場(chǎng)上正在出現(xiàn)各種專用的推理加速器,但越好的模型往往越大,而且需要的內(nèi)存也越多,所以基于邊緣的處理有時(shí)并不一定是最好的解決方案。

而將設(shè)備連接到云可以為這些緊湊模型提供更好的性能。Mozer 表示,可穿戴設(shè)備、手機(jī)、汽車等設(shè)備都可以進(jìn)行無線更新。

他表示:“云連接可以為更小、更準(zhǔn)確的設(shè)備端模型提供更新?!?/p>

這實(shí)現(xiàn)了設(shè)備端的許多功能改進(jìn)。Sensory 為客戶提供語音轉(zhuǎn)文字、文字轉(zhuǎn)語音、喚醒詞驗(yàn)證、自然語言理解、面部身份識(shí)別以及揚(yáng)聲器和聲音識(shí)別等功能。

Sensory 還使用NVIDIAJetson邊緣 AI 模塊將 Sensory Cloud 的力量帶給更大的設(shè)備。

利用Triton進(jìn)行推理

該公司的 Sensory Cloud 利用NVIDIA Triton運(yùn)行語音和視覺模型。Sensory 圍繞 Triton 構(gòu)建的自定義云模型管理基礎(chǔ)架構(gòu),使不同的客戶能夠運(yùn)行不同的模型版本、部署自定義模型、啟用自動(dòng)更新并監(jiān)控使用情況和錯(cuò)誤。

Sensory 的客戶可以將它作為一個(gè)容器部署到本地或云端,也可以完全用于私人用途,不向 Sensory 發(fā)送任何數(shù)據(jù)。

Triton 為 Sensory 提供了一個(gè)用于所有 Triton 通信和以最少的編碼快速部署新模型的專用機(jī)器學(xué)習(xí)任務(wù)庫。它還實(shí)現(xiàn)了一個(gè)方便新管道組裝和擴(kuò)展的異步動(dòng)作管道。Triton 的動(dòng)態(tài)批處理功能幫助提高 GPU 吞吐量并進(jìn)行性能分析,以此實(shí)現(xiàn)推理優(yōu)化。

Sensory 是NVIDIA初創(chuàng)加速計(jì)劃的成員。這項(xiàng)全球計(jì)劃為領(lǐng)先的初創(chuàng)企業(yè)提供支持。

將NeMo運(yùn)用于混合云模型

Sensory 在NVIDIA NeMo的基礎(chǔ)上進(jìn)行了擴(kuò)展,提升其所有云技術(shù)的準(zhǔn)確性和功能。

NeMo 所改進(jìn)的功能包括專有的特征提取器、音頻流優(yōu)化、可定制的詞匯表、多語言模型等。

NeMo 模型現(xiàn)在支持 17 種語言。該公司稱,憑借 Sensory 專有的功能改進(jìn),語音轉(zhuǎn)文字的單詞錯(cuò)誤率很低,并始終處于最佳水平。

Mozer 表示:“Sensory 通過 NVIDIA Triton 硬件和 NVIDIA NeMo 軟件實(shí)現(xiàn)了各項(xiàng)特征和功能的改進(jìn)。這類混合云設(shè)置為客戶提供了全新的 AI 功能。”

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4990

    瀏覽量

    103120
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30947

    瀏覽量

    269217
  • Sensory
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    6132

原文標(biāo)題:Sensory通過NeMo將NVIDIA AI運(yùn)用于語音和視覺應(yīng)用

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Triton編譯器的優(yōu)化技巧

    在現(xiàn)代計(jì)算環(huán)境中,編譯器的性能對(duì)于軟件的運(yùn)行效率至關(guān)重要。Triton 編譯器作為一個(gè)先進(jìn)的編譯器框架,提供了一系列的優(yōu)化技術(shù),以確保生成的代碼既高效又適應(yīng)不同的硬件架構(gòu)。 1. 指令選擇
    的頭像 發(fā)表于 12-25 09:09 ?210次閱讀

    Triton編譯器的優(yōu)勢(shì)與劣勢(shì)分析

    據(jù)流分析技術(shù),能夠自動(dòng)識(shí)別并優(yōu)化深度學(xué)習(xí)模型中的計(jì)算瓶頸,從而提高模型的整體性能。 它支持多種硬件平臺(tái)的優(yōu)化,包括CPU、GPU、FPGA等,為深度學(xué)習(xí)模型的部署提供了更廣泛的選擇。 靈活可擴(kuò)展 :
    的頭像 發(fā)表于 12-25 09:07 ?222次閱讀

    Triton編譯器在機(jī)器學(xué)習(xí)中的應(yīng)用

    1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務(wù)平臺(tái)的一部分,它負(fù)責(zé)將深度學(xué)習(xí)模型轉(zhuǎn)換為優(yōu)化的格式,以便
    的頭像 發(fā)表于 12-24 18:13 ?367次閱讀

    Triton編譯器功能介紹 Triton編譯器使用教程

    Triton 是一個(gè)開源的編譯器前端,它支持多種編程語言,包括 C、C++、Fortran 和 Ada。Triton 旨在提供一個(gè)可擴(kuò)展和可定制的編譯器框架,允許開發(fā)者添加新的編程語言特性和優(yōu)化技術(shù)
    的頭像 發(fā)表于 12-24 17:23 ?400次閱讀

    NVIDIA推出全新生成式AI模型Fugatto

    NVIDIA 開發(fā)了一個(gè)全新的生成式 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發(fā)表于 11-27 11:29 ?361次閱讀

    NVIDIA助力提供多樣、靈活的模型選擇

    在本案例中,Dify 以模型中立以及開源生態(tài)的優(yōu)勢(shì),為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務(wù)器
    的頭像 發(fā)表于 09-09 09:19 ?480次閱讀

    NVIDIA NIM微服務(wù)帶來巨大優(yōu)勢(shì)

    新服務(wù)通過熱門 AI 模型為數(shù)百萬開發(fā)者帶來高達(dá) 5 倍的 token 效率提升,使他們能夠立即訪問在 NVIDIA DGX Cloud運(yùn)行的 NIM 微服務(wù)。
    的頭像 發(fā)表于 08-23 15:20 ?500次閱讀

    聆思CSK6視覺語音模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/多模態(tài)交互/英語評(píng)測(cè)SDK合集)

    本帖最后由 jf_40317719 于 2024-6-18 17:39 編輯 視覺語音模型 AI 開發(fā)套件( CSK6-MIX )是圍繞 CSK6011A 芯片設(shè)計(jì)的具備豐富語音
    發(fā)表于 06-18 17:33

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個(gè)開源庫,用于優(yōu)化從 PC 到云端的 NVID
    的頭像 發(fā)表于 04-28 10:36 ?577次閱讀

    NVIDIA宣布推出基于Omniverse Cloud API構(gòu)建的全新軟件框架

    NVIDIA 在 GTC 大會(huì)上宣布推出基于 Omniverse Cloud API(應(yīng)用編程接口)構(gòu)建的全新軟件框架。
    的頭像 發(fā)表于 03-25 09:09 ?543次閱讀

    全新NVIDIA Omniverse Cloud API有何亮點(diǎn)?

    NVIDIA Omniverse Cloud API 使開發(fā)者能夠?qū)?Omniverse 技術(shù)集成到其設(shè)計(jì)與仿真工具和工作流中。
    的頭像 發(fā)表于 03-20 13:42 ?476次閱讀

    NVIDIA宣布將以API形式提供Omniverse? Cloud

    NVIDIA Omniverse Cloud API 使開發(fā)者能夠?qū)?Omniverse 技術(shù)集成到其設(shè)計(jì)與仿真工具和工作流中。
    的頭像 發(fā)表于 03-20 09:45 ?469次閱讀

    NVIDIA發(fā)布Omniverse Cloud API,為眾多工業(yè)數(shù)字孿生軟件工具提供助力

    Ansys、Cadence、Hexagon、微軟、羅克韋爾自動(dòng)化、西門子、Trimble采用Omniverse技術(shù)幫助客戶設(shè)計(jì)、模擬、構(gòu)建和運(yùn)行符合物理學(xué)的數(shù)字孿生 ? ? NVIDIA
    發(fā)表于 03-19 09:40 ?497次閱讀
    <b class='flag-5'>NVIDIA</b>發(fā)布Omniverse <b class='flag-5'>Cloud</b> API,為眾多工業(yè)數(shù)字孿生軟件工具提供助力

    使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測(cè)

    這家云計(jì)算巨頭的計(jì)算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測(cè)。
    的頭像 發(fā)表于 02-29 14:04 ?587次閱讀

    利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗(yàn)

    本案例通過利用NVIDIA TensorRT-LLM加速指令識(shí)別深度學(xué)習(xí)模型,并借助NVIDIA Triton推理服務(wù)器在
    的頭像 發(fā)表于 01-17 09:30 ?701次閱讀