0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Triton開源推理服務(wù)軟件三大功能推動(dòng)效率提升

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-01-04 14:20 ? 次閱讀

Microsoft Teams借助AI生成的實(shí)時(shí)字幕和轉(zhuǎn)錄功能,幫助全球?qū)W生和職場(chǎng)人士順利進(jìn)行在線會(huì)議。用于訓(xùn)練的NVIDIA AI計(jì)算技術(shù)和用于推理語音識(shí)別模型的NVIDIA Triton推理服務(wù)器進(jìn)一步提升了這兩個(gè)功能。

Microsoft Teams 是全球溝通和協(xié)作的重要工具,每月有近2.5億活躍用戶。Microsoft Azure 認(rèn)知服務(wù)為Teams提供28種語言的字幕和轉(zhuǎn)錄,并將很快能夠在NVIDIA GPU上運(yùn)行關(guān)鍵的計(jì)算密集型神經(jīng)網(wǎng)絡(luò)推理。

實(shí)時(shí)字幕功能幫助與會(huì)者實(shí)時(shí)跟蹤對(duì)話,轉(zhuǎn)錄功能方便與會(huì)者在日后回顧當(dāng)時(shí)的創(chuàng)意或回看未能參與的會(huì)議。

實(shí)時(shí)字幕對(duì)聾啞人、聽力障礙者,或者異國與會(huì)者特別有用。

NVIDIA Triton開源推理服務(wù)軟件能夠幫助Teams使用認(rèn)知服務(wù)優(yōu)化語音識(shí)別模型。

使用Triton,認(rèn)知服務(wù)能夠支持高度先進(jìn)的語言模型,以極低的延遲實(shí)時(shí)提供高度準(zhǔn)確、個(gè)性化的語音轉(zhuǎn)文本結(jié)果。同時(shí),可以保證運(yùn)行這些語音轉(zhuǎn)文本模型的NVIDIA GPU充分發(fā)揮其潛力,在消耗更少計(jì)算資源的同時(shí),為客戶提供更高的吞吐量,進(jìn)而降低成本。

底層語音識(shí)別技術(shù)作為認(rèn)知服務(wù)中的一個(gè)API,開發(fā)人員可以使用它定制和運(yùn)行自己的應(yīng)用程序——客服電話轉(zhuǎn)錄、智能家居控制或?yàn)榧本热藛T提供AI助手。

字字達(dá)意的AI

認(rèn)知服務(wù)會(huì)生成Teams的轉(zhuǎn)錄和字幕,將語音轉(zhuǎn)換為文本,并識(shí)別說話人。同時(shí)也能夠識(shí)別專業(yè)術(shù)語 、姓名和其他會(huì)議背景,提高字幕的準(zhǔn)確性。

Microsoft Teams的通話、會(huì)議及設(shè)備首席項(xiàng)目經(jīng)理Shalendra Chhabra表示:“這樣的AI模型非常復(fù)雜,需要數(shù)千萬個(gè)神經(jīng)網(wǎng)絡(luò)參數(shù)才能識(shí)別幾十種不同的語言。但模型越大,就越難以經(jīng)濟(jì)高效地實(shí)時(shí)運(yùn)行?!?/p>

NVIDIA GPU和Triton軟件能夠幫助微軟在不犧牲低延遲的情況下,通過強(qiáng)大的神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)高準(zhǔn)確性,確保語音-文本的實(shí)時(shí)轉(zhuǎn)換。

當(dāng)啟用轉(zhuǎn)錄功能時(shí),與會(huì)者可以在會(huì)議結(jié)束后輕松補(bǔ)上錯(cuò)過的內(nèi)容。

Triton三大功能推動(dòng)效率提升

NVIDIA Triton有助于簡(jiǎn)化AI模型部署,并解鎖高性能推理。用戶甚至可以為自己的應(yīng)用開發(fā)自定義后端。軟件的一些關(guān)鍵功能可將Microsoft Teams的字幕和轉(zhuǎn)錄功能擴(kuò)展到更多會(huì)議和用戶,包括:

流推理:新型流推理功能——通過跟蹤語音上下語境,提高延遲、敏感性字幕的準(zhǔn)確度,它助力NVIDIA和Azure認(rèn)知服務(wù)合作定制語音轉(zhuǎn)文本的應(yīng)用程序。

動(dòng)態(tài)合批:批大小指神經(jīng)網(wǎng)絡(luò)同時(shí)處理的輸入樣本數(shù)量。通過Triton的動(dòng)態(tài)合批,單項(xiàng)推理請(qǐng)求被自動(dòng)組合成一個(gè)批次,因此能夠在不影響模型延遲的情況下更好地利用GPU資源。

并發(fā)模型執(zhí)行:實(shí)時(shí)字幕和轉(zhuǎn)錄需要同時(shí)運(yùn)行多個(gè)深度學(xué)習(xí)模型。Triton使開發(fā)人員能夠在單個(gè)GPU上同時(shí)完成這些工作,包括使用不同深度學(xué)習(xí)框架的模型。

即刻啟程,借助Azure 認(rèn)知服務(wù),在您的應(yīng)用中使用語音轉(zhuǎn)文本的功能,并進(jìn)一步了解NVIDIA Triton 推理服務(wù)軟件如何幫助團(tuán)隊(duì)大規(guī)模部署AI模型。

NVIDIA 將參加 CES 2022, 并將在 1 月 5 日凌晨 0 點(diǎn)(北京時(shí)間)發(fā)表 NVIDIA 特別演講。

NVIDIA GeForce 高級(jí)副總裁 Jeff Fisher 和 NVIDIA 汽車部門副總裁兼總經(jīng)理 Ali Kani 將展示加速計(jì)算在設(shè)計(jì)、仿真、游戲和自動(dòng)駕駛汽車方面的新突破。掃描下方海報(bào),即刻將該日程添加到日歷!

原文標(biāo)題:Microsoft Azure 認(rèn)知服務(wù)和NVIDIA AI提升Microsoft Teams實(shí)時(shí)字幕和轉(zhuǎn)錄功能

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4990

    瀏覽量

    103120
  • 功能
    +關(guān)注

    關(guān)注

    3

    文章

    589

    瀏覽量

    29278
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3358

    瀏覽量

    42523

原文標(biāo)題:Microsoft Azure 認(rèn)知服務(wù)和NVIDIA AI提升Microsoft Teams實(shí)時(shí)字幕和轉(zhuǎn)錄功能

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計(jì)算效率

    本案例中魯班系統(tǒng)高性能 CAE 軟件利用 NVIDIA 高性能 GPU,實(shí)現(xiàn)復(fù)雜產(chǎn)品的快速仿真,加速產(chǎn)品開發(fā)和設(shè)計(jì)迭代,縮短開發(fā)周期,提升產(chǎn)品競(jìng)爭(zhēng)力。
    的頭像 發(fā)表于 12-27 16:24 ?118次閱讀

    Triton編譯器如何提升編程效率

    在現(xiàn)代軟件開發(fā)中,編譯器扮演著至關(guān)重要的角色。它們不僅將高級(jí)語言代碼轉(zhuǎn)換為機(jī)器可執(zhí)行的代碼,還通過各種優(yōu)化技術(shù)提升程序的性能。Triton 編譯器作為一種先進(jìn)的編譯器,通過多種方式提升
    的頭像 發(fā)表于 12-25 09:12 ?216次閱讀

    Triton編譯器在機(jī)器學(xué)習(xí)中的應(yīng)用

    1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務(wù)平臺(tái)的一部分
    的頭像 發(fā)表于 12-24 18:13 ?367次閱讀

    Triton編譯器功能介紹 Triton編譯器使用教程

    Triton 是一個(gè)開源的編譯器前端,它支持多種編程語言,包括 C、C++、Fortran 和 Ada。Triton 旨在提供一個(gè)可擴(kuò)展和可定制的編譯器框架,允許開發(fā)者添加新的編程語言特性和優(yōu)化技術(shù)
    的頭像 發(fā)表于 12-24 17:23 ?400次閱讀

    NVIDIA助力提供多樣、靈活的模型選擇

    在本案例中,Dify 以模型中立以及開源生態(tài)的優(yōu)勢(shì),為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理
    的頭像 發(fā)表于 09-09 09:19 ?480次閱讀

    魔搭社區(qū)借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區(qū)是中國最具影響力的模型開源社區(qū),致力給開發(fā)者提供模型即服務(wù)的體驗(yàn)。魔搭社區(qū)利用NVIDIA TensorRT-LLM,大大提高了大語言模型的推理性能,方便了模型應(yīng)用部署,提高
    的頭像 發(fā)表于 08-23 15:48 ?456次閱讀

    全新 NVIDIA NeMo Retriever微服務(wù)大幅提升LLM的準(zhǔn)確性和吞吐量

    企業(yè)能夠通過提供檢索增強(qiáng)生成功能的生產(chǎn)就緒型 NVIDIA NIM 推理服務(wù),充分挖掘業(yè)務(wù)數(shù)據(jù)的價(jià)值。這些微服務(wù)現(xiàn)已集成到 Cohesit
    的頭像 發(fā)表于 07-26 11:13 ?851次閱讀
    全新 <b class='flag-5'>NVIDIA</b> NeMo Retriever微<b class='flag-5'>服務(wù)</b>大幅<b class='flag-5'>提升</b>LLM的準(zhǔn)確性和吞吐量

    NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成式AI服務(wù)

    NVIDIA近日宣布了一項(xiàng)重大舉措,正式推出NVIDIA AI Foundry服務(wù)NVIDIA NIM(NVIDIA Inference
    的頭像 發(fā)表于 07-25 16:57 ?549次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)NVIDIA NIM推理服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)NVIDIA NIM 推理服務(wù)
    的頭像 發(fā)表于 07-25 09:48 ?712次閱讀

    英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

    英偉達(dá)近日宣布推出一項(xiàng)革命性的AI模型推理服務(wù)——NVIDIA NIM。這項(xiàng)服務(wù)將極大地簡(jiǎn)化AI模型部署過程,為全球的2800萬英偉達(dá)開發(fā)者提供前所未有的便利。
    的頭像 發(fā)表于 06-04 09:15 ?684次閱讀

    NVIDIA與Google DeepMind合作推動(dòng)大語言模型創(chuàng)新

    支持 NVIDIA NIM 推理服務(wù)的谷歌最新開源模型 PaliGemma 首次亮相。
    的頭像 發(fā)表于 05-16 09:44 ?454次閱讀

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個(gè)開源庫,用于優(yōu)化從 PC 到云端的
    的頭像 發(fā)表于 04-28 10:36 ?577次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱
    的頭像 發(fā)表于 04-20 09:39 ?734次閱讀

    使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測(cè)

    這家云計(jì)算巨頭的計(jì)算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測(cè)。
    的頭像 發(fā)表于 02-29 14:04 ?587次閱讀

    利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗(yàn)

    UTalk-Doc 將用戶指令識(shí)別服務(wù)吞吐量提升了 5 倍,單個(gè)請(qǐng)求響應(yīng)時(shí)間縮減了分之一,大幅提升服務(wù)運(yùn)行
    的頭像 發(fā)表于 01-17 09:30 ?701次閱讀