開(kāi)發(fā)者可以直接在瀏覽器中試用全新的 NVIDIA AI Foundation Models,使用 NVIDIA AI Foundation Endpoints 在應(yīng)用程序中進(jìn)行測(cè)試,然后使用專(zhuān)有的業(yè)務(wù)數(shù)據(jù)進(jìn)行自定義。
如今,免費(fèi)、開(kāi)源的大語(yǔ)言模型對(duì)企業(yè)來(lái)說(shuō)就像是一頓“自助餐”。但對(duì)于構(gòu)建自定義生成式 AI 應(yīng)用的開(kāi)發(fā)者來(lái)說(shuō),這頓“大餐”可能會(huì)讓他們應(yīng)接不暇,因?yàn)樗麄冃枰獫M足各種不同的項(xiàng)目和業(yè)務(wù)需求,比如兼容性、安全性和用來(lái)訓(xùn)練模型的數(shù)據(jù)。 NVIDIA AI Foundation Models集企業(yè)級(jí)預(yù)訓(xùn)練模型之大成,為開(kāi)發(fā)人員提供了針對(duì)企業(yè)應(yīng)用定制生成式 AI 的良好開(kāi)端。
NVIDIA 優(yōu)化的基礎(chǔ)模型加速創(chuàng)新
NVIDIA AI Foundation Models 可通過(guò)簡(jiǎn)單的用戶界面或 API 直接在瀏覽器體驗(yàn)。此外,這些模型還可通過(guò)NVIDIA AI Foundation Endpoints進(jìn)行訪問(wèn),以便在企業(yè)應(yīng)用中測(cè)試模型性能。
Llama 2、Stable Diffusion XL 和 Mistral 等現(xiàn)有的領(lǐng)先社區(qū)模型在格式化后,可幫助開(kāi)發(fā)者利用其專(zhuān)有數(shù)據(jù)精簡(jiǎn)自定義過(guò)程。此外,這些模型還通過(guò)NVIDIA TensorRT-LLM進(jìn)行了優(yōu)化,以提供最高的吞吐量和最低的時(shí)延,同時(shí)支持在任一NVIDIA GPU加速堆棧上的大規(guī)模運(yùn)行。例如,經(jīng)過(guò) TensorRT-LLM 優(yōu)化的 Llama 2 模型在 NVIDIA H100 上的運(yùn)行速度提高了近 2 倍。 新的NVIDIA Nemotron-3 8B基礎(chǔ)模型系列可支持創(chuàng)建當(dāng)今領(lǐng)先的企業(yè)聊天與問(wèn)答應(yīng)用,并適用于醫(yī)療、電信和金融服務(wù)等眾多行業(yè)。 這一系列模型是客戶構(gòu)建安全且生產(chǎn)就緒的生成式 AI 應(yīng)用的起點(diǎn)。這些模型在可靠的數(shù)據(jù)集上訓(xùn)練而成,其性能可媲美規(guī)模更大的模型,因此成為企業(yè)部署的理想之選。 多語(yǔ)言功能是 Nemotron-3 8B 系列模型的關(guān)鍵優(yōu)勢(shì)之一。這些開(kāi)箱即用的模型精通 50 多種語(yǔ)言,包括英語(yǔ)、德語(yǔ)、俄語(yǔ)、西班牙語(yǔ)、法語(yǔ)、日語(yǔ)、中文、韓語(yǔ)、意大利語(yǔ)和荷蘭語(yǔ)。
加快從自定義到部署的全過(guò)程
在跨業(yè)務(wù)功能中使用生成式 AI 的企業(yè)需要一個(gè) AI foundry,以便為其獨(dú)特的應(yīng)用自定義模型。NVIDIA 的 AI foundry 具備三個(gè)要素:NVIDIA AI Foundation Models、NVIDIA NeMo框架和工具,以及NVIDIA DGX云AI 超級(jí)計(jì)算服務(wù)。它們共同提供了端到端的企業(yè)級(jí)服務(wù),以創(chuàng)建自定義生成式 AI 模型。
重要的是,企業(yè)擁有其定制化模型,也就可以通過(guò)NVIDIA AI Enterprise軟件將其部署到幾乎任何地點(diǎn),并獲得企業(yè)級(jí)的安全性、穩(wěn)定性和支持。 NVIDIA AI Foundation Models 現(xiàn)已在NVIDIA NGC 目錄(https://catalog.ngc.nvidia.com/ai-foundation-models.ngc.nvidia.com/ai-foundation-models)和 Hugging Face 上免費(fèi)提供,并且也托管于 Microsoft Azure AI 模型目錄中。
GTC 2024 將于 2024 年 3 月 18 至 21 日在美國(guó)加州圣何塞會(huì)議中心舉行,線上大會(huì)也將同期開(kāi)放。掃描下方海報(bào)二維碼,立即注冊(cè) GTC 大會(huì)。
原文標(biāo)題:NVIDIA 加快企業(yè)自定義生成式 AI 模型開(kāi)發(fā)
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3776瀏覽量
91103
原文標(biāo)題:NVIDIA 加快企業(yè)自定義生成式 AI 模型開(kāi)發(fā)
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論