亚洲熟女综合色一区二区三区,欧美日本91精品久久久网

實時語法檢查模型預(yù)計每年運行超過5000億次查詢。有人說好文章都是編輯出來的。幸運的是，為了滿足全球讀者的挑剔要求，微軟正在為數(shù)百萬人提供AI語法編輯器。該工具如同一名優(yōu)秀的編輯一樣快速而專業(yè)。這是由于微軟編輯器在Microsoft Word在線版中對語法進行了改進，可以運用NVIDIA Triton 推理服務(wù)器、ONNX 運行時和Azure AI中的微軟Azure 機器學(xué)習(xí)，來提供這種豐富的智能體驗。

10月5日，NVIDIA首席執(zhí)行官黃仁勛在GTC大會上的主題演講中宣布了這一新訊。

日常工作中的AI應(yīng)用

微軟為Microsoft Office生產(chǎn)力應(yīng)用用戶提供強大的AI性能。這些節(jié)省時間的新功能包括實時語法建議、文檔內(nèi)問題解答（如 “完全匹配”之外的Bing文檔搜索），以及幫助將句子填寫完整的文本預(yù)測。唯有通過深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)，才能實現(xiàn)這些提高生產(chǎn)力的功能。例如，與基于傳統(tǒng)規(guī)則型邏輯構(gòu)建的服務(wù)不同，在糾正語法方面，Word在線編輯器可以理解句子的上下文，并提供適當?shù)膯卧~選擇建議。

這些深度學(xué)習(xí)模型可能涉及數(shù)億個參數(shù)，它們必須具有可擴展性，并提供實現(xiàn)最佳用戶體驗所需的實時推理。預(yù)計僅用于語法檢查的微軟編輯器AI模型每年就要對Word在線處理超過5000億次查詢。但這種規(guī)模的部署可能會大幅增加深度學(xué)習(xí)的預(yù)算。幸運的是，可通過Azure機器學(xué)習(xí)訪問的NVIDIA Triton的動態(tài)批處理和并發(fā)模型執(zhí)行功能將成本降低了約70％，并且在單個NVIDIA V100 Tensor Core GPU上實現(xiàn)了每秒450次查詢的吞吐量，響應(yīng)時間在200毫秒以內(nèi)。

Azure機器學(xué)習(xí)具備管理模型生命周期所需的規(guī)模和能力，比如版本管理和監(jiān)控。

在Azure 機器學(xué)習(xí)上通過Triton實現(xiàn)高性能推理

隨著機器學(xué)習(xí)模型規(guī)模的不斷擴大，模型訓(xùn)練和部署過程對GPU的需求比以往任何時候都更加迫切。為了將AI部署到生產(chǎn)中，企業(yè)機構(gòu)正在尋找可擴展的推理服務(wù)解決方案、對多個框架后端的支持、最佳的GPU和CPU利用率以及機器學(xué)習(xí)生命周期管理。Azure 機器學(xué)習(xí)中的NVIDIA Triton和ONNX 運行時堆棧提供可擴展的高性能推理。Azure機器學(xué)習(xí)用戶可以利用Triton對多種框架的支持、實時、批和流推理、動態(tài)批處理以及并發(fā)執(zhí)行等性能。

借助AI進行Word創(chuàng)作

作家和詩人Robert Graves曾說過：“沒有寫得好的文章，只有改得好的文章。”換言之，就是要對寫好的文章進行編輯和潤色。您可以使用Word在線編輯器同時進行這兩項工作。盡管編輯器是Word中第一個通過Triton和ONNX 運行時增加速度與廣度的功能，但它僅僅是更多功能的開始。

fqj

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴