0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

選擇GPU服務(wù)器的基本原則有哪些

Wildesbeast ? 來(lái)源:今日頭條 ? 作者:中科云達(dá) ? 2020-02-24 13:29 ? 次閱讀

在介紹選擇GPU服務(wù)器的基本原則之前,先來(lái)跟大家介紹下常見(jiàn)的GPU和GPU服務(wù)器。

常見(jiàn)的GPU,按總線接口類型可以分為NV-Link接口、傳統(tǒng)總線接口以及傳統(tǒng)PCI-e總線三種。

NV-Link接口類型的GPU典型代表是NVIDIA V100,采用SXM2接口,在DGX-2上有SXM3的接口。

NV-Link總線標(biāo)準(zhǔn)的GPU服務(wù)器可以分為兩類,一類是NVIDIA公司設(shè)計(jì)的DGX超級(jí)計(jì)算機(jī),另一類是合作伙伴設(shè)計(jì)的NV-Link接口的服務(wù)器。DGX超級(jí)計(jì)算機(jī)不僅僅提供硬件,還有相關(guān)的軟件和服務(wù)。

傳統(tǒng)總線接口的GPU,目前主流的有這幾款產(chǎn)品,比如采用了PCI-e接口的V100、 P40(P開(kāi)頭指的是上一代PASCAL架構(gòu))和P4,以及最新的圖靈架構(gòu)T4等。其中比較薄和只占一個(gè)槽位的P4和T4,通常用于Inference,目前也已經(jīng)有成熟的模型進(jìn)行推理和識(shí)別。

傳統(tǒng)PCI-e總線的GPU服務(wù)器也分為兩類,一類是OEM服務(wù)器,比如曙光、浪潮、華為等其他國(guó)際品牌;另一類是非OEM的服務(wù)器,也包括很多種類。

選擇服務(wù)器時(shí)除了分類,還要考慮性能指標(biāo),比如精度、顯存類型、顯存容量以及功耗等,同時(shí)也會(huì)有一些服務(wù)器是需要水冷、降噪或者對(duì)溫度、移動(dòng)性等等方面有特殊的要求,就需要特殊的服務(wù)器。

選擇GPU服務(wù)器時(shí)首先要考慮業(yè)務(wù)需求來(lái)選擇適合的GPU型號(hào)。在HPC高性能計(jì)算中還需要根據(jù)精度來(lái)選擇,比如有的高性能計(jì)算需要雙精度,這時(shí)如果使用P40或者P4就不合適,只能使用V100或者P100;同時(shí)也會(huì)對(duì)顯存容量有要求,比如石油或石化勘探類的計(jì)算應(yīng)用對(duì)顯存要求比較高;還有些對(duì)總線標(biāo)準(zhǔn)有要求,因此選擇GPU型號(hào)要先看業(yè)務(wù)需求。

GPU服務(wù)器人工智能領(lǐng)域的應(yīng)用也比較多!

在教學(xué)場(chǎng)景中,對(duì)GPU虛擬化的要求比較高。根據(jù)課堂人數(shù),一個(gè)老師可能需要將GPU服務(wù)器虛擬出30甚至60個(gè)虛擬GPU,因此批量Training對(duì)GPU要求比較高,通常用V100做GPU的訓(xùn)練。模型訓(xùn)練完之后需要進(jìn)行推理,因此推理一般會(huì)使用P4或者T4,少部分情況也會(huì)用V100。

當(dāng)GPU型號(hào)選定后,再考慮用什么樣GPU的服務(wù)器。這時(shí)我們需要考慮以下幾種情況:

第一、在邊緣服務(wù)器上需要根據(jù)量來(lái)選擇T4或者P4等相應(yīng)的服務(wù)器,同時(shí)也要考慮服務(wù)器的使用場(chǎng)景,比如火車(chē)站卡口、機(jī)場(chǎng)卡口或者公安卡口等;在中心端做Inference時(shí)可能需要V100的服務(wù)器,需要考慮吞吐量以及使用場(chǎng)景、數(shù)量等。

第二、需要考慮客戶本身使用人群和IT運(yùn)維能力,對(duì)于BAT這類大公司來(lái)說(shuō),他們自己的運(yùn)營(yíng)能力比較強(qiáng),這時(shí)會(huì)選擇通用的PCI-e服務(wù)器;而對(duì)于一些IT運(yùn)維能力不那么強(qiáng)的客戶,他們更關(guān)注數(shù)字以及數(shù)據(jù)標(biāo)注等,我們稱這類人為數(shù)據(jù)科學(xué)家,選擇GPU服務(wù)器的標(biāo)準(zhǔn)也會(huì)有所不同。

第三、需要考慮配套軟件和服務(wù)的價(jià)值。

第四、要考慮整體GPU集群系統(tǒng)的成熟程度以及工程效率,比如像DGX這種GPU一體化的超級(jí)計(jì)算機(jī),它有非常成熟的從底端的操作系統(tǒng)驅(qū)動(dòng)Docker到其他部分都是固定且優(yōu)化過(guò)的,這時(shí)效率就比較高。

中科云達(dá)DGX-1

輕松取得工作成果

如今的深度學(xué)習(xí)環(huán)境在軟件設(shè)計(jì)方面耗費(fèi)的時(shí)間價(jià)值可達(dá)數(shù)十萬(wàn)美元,而開(kāi)源軟件需要數(shù)月的時(shí)間才能變得穩(wěn)定。借助 NVIDIA DGX-1,您可以立即提高效率,簡(jiǎn)化工作流程并與團(tuán)隊(duì)開(kāi)展協(xié)作。利用配有 NVIDIA 隨時(shí)更新的優(yōu)化軟件解決方案可節(jié)省您的時(shí)間和資金。

革命性的 AI 性能

盡管許多解決方案都提供 GPU 加速性能,但只有 NVIDIA DGX-1 發(fā)揮出了最新 NVIDIA? Tesla? V100 的全部潛力,包括下一代 NVIDIA NVLink? 和 Tensor 核心架構(gòu)。相 比其他基于 GPU 的系統(tǒng),DGX-1 憑借 NVIDIA GPU Cloud 深度學(xué)習(xí)軟件堆棧和當(dāng)今流行的技術(shù)框架,將訓(xùn)練速度提升高達(dá)三倍。

投資保護(hù)

利用 NVIDIA 深度學(xué)習(xí)專業(yè)知識(shí)的全部力量支持您的項(xiàng)目,因此您無(wú)需再浪費(fèi)時(shí)間和資金費(fèi)力地獲得想要的結(jié)果。NVIDIA 的企業(yè)級(jí)支持讓您無(wú)需耗費(fèi)時(shí)間對(duì)硬件和開(kāi)源軟件進(jìn)行問(wèn)題排查。節(jié)省調(diào)試和優(yōu)化時(shí)間,增加更多時(shí)間專注探索發(fā)現(xiàn)。

通往深度學(xué)習(xí)的更快路徑

構(gòu)建深度學(xué)習(xí)平臺(tái)不僅僅在于選擇服務(wù)器和 GPU。在企業(yè)環(huán)境中實(shí)施 AI 需要慎重選擇和集成復(fù)雜的軟件和硬件。NVIDIA DGX-1? 通過(guò)開(kāi)箱即用的解決方案來(lái)加快實(shí)施您的計(jì)劃,如此一來(lái),您可以在幾小時(shí)而非數(shù)周或數(shù)月內(nèi)獲得見(jiàn)解。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4740

    瀏覽量

    128948
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9160

    瀏覽量

    85421
  • PCI
    PCI
    +關(guān)注

    關(guān)注

    4

    文章

    666

    瀏覽量

    130269
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    GPU加速云服務(wù)器怎么用的

    GPU加速云服務(wù)器是將GPU硬件與云計(jì)算服務(wù)相結(jié)合,通過(guò)云服務(wù)提供商的平臺(tái),用戶可以根據(jù)需求靈活租用帶有
    的頭像 發(fā)表于 12-26 11:58 ?44次閱讀

    GPU服務(wù)器租用多少錢(qián)

    GPU服務(wù)器的租用價(jià)格受多種因素影響,包括服務(wù)提供商、GPU型號(hào)和性能、實(shí)例規(guī)格、計(jì)費(fèi)模式、促銷活動(dòng)以及地域差異等。下面,AI部落小編為您整理GP
    的頭像 發(fā)表于 12-09 10:50 ?137次閱讀

    GPU服務(wù)器和傳統(tǒng)的服務(wù)器有什么區(qū)別

    GPU服務(wù)器與傳統(tǒng)的服務(wù)器在多個(gè)方面存在顯著差異,主機(jī)推薦小編為您整理發(fā)布GPU服務(wù)器和傳統(tǒng)的服務(wù)器
    的頭像 發(fā)表于 11-07 11:05 ?210次閱讀

    連接選型的幾項(xiàng)基本原則

    在連接的領(lǐng)域連接的選型是每個(gè)連接人都必須要經(jīng)歷的事情,在連接選型的道路上有很多需要注意的東西,稍有不慎就會(huì)導(dǎo)致最終選擇的連接
    的頭像 發(fā)表于 10-17 17:29 ?389次閱讀

    選擇電氣控制方案時(shí)的基本原則

    一系列基本原則。 控制方式與設(shè)備適應(yīng)性 控制方式的選擇應(yīng)與設(shè)備的通用化和專用化相適應(yīng)。對(duì)于通用設(shè)備,可以采用標(biāo)準(zhǔn)化的控制方式,以降低設(shè)計(jì)和生產(chǎn)成本;而對(duì)于專用設(shè)備,則需要根據(jù)其特殊需求定制控制方式,以滿足特定的
    的頭像 發(fā)表于 08-28 10:47 ?329次閱讀

    組成放大電路的基本原則是什么?

    組成放大電路的基本原則主要包括以下幾個(gè)方面: 1. 穩(wěn)定性原則 定義 :穩(wěn)定性是指放大電路在工作過(guò)程中應(yīng)能夠保持其性能不受外界干擾或內(nèi)部變化的影響。 實(shí)現(xiàn)方式 :通過(guò)采取一些措施來(lái)保持電路的工作點(diǎn)
    的頭像 發(fā)表于 08-07 10:02 ?756次閱讀

    gpu服務(wù)器與cpu服務(wù)器的區(qū)別對(duì)比,終于知道怎么選了!

    gpu服務(wù)器與cpu服務(wù)器的區(qū)別主要體現(xiàn)在架構(gòu)設(shè)計(jì)、性能特點(diǎn)、能耗效率、應(yīng)用場(chǎng)景、市場(chǎng)定位等方面,在以上幾個(gè)方面均存在顯著差異。CPU服務(wù)器更適合數(shù)據(jù)庫(kù)管理和企業(yè)應(yīng)用,而
    的頭像 發(fā)表于 08-01 11:41 ?494次閱讀

    算力服務(wù)器為什么選擇GPU

    服務(wù)器會(huì)選擇GPU而不是傳統(tǒng)的CPU呢?GPU和CPU的區(qū)別GPU和CPU二者都由寄存、控制
    的頭像 發(fā)表于 07-25 08:28 ?632次閱讀
    算力<b class='flag-5'>服務(wù)器</b>為什么<b class='flag-5'>選擇</b><b class='flag-5'>GPU</b>

    電路仿真所遵循的基本原則是什么

    電路仿真是一種基于電子計(jì)算機(jī)進(jìn)行模擬的技術(shù),用于分析和預(yù)測(cè)電路的行為和性能。它可以幫助設(shè)計(jì)師優(yōu)化電路的功能、減少成本和提高可靠性。為了保證仿真結(jié)果的準(zhǔn)確性和可靠性,電路仿真需要遵循一些基本原則。本文
    的頭像 發(fā)表于 04-21 10:20 ?1277次閱讀

    鴻蒙原生應(yīng)用元服務(wù)-訪問(wèn)控制(權(quán)限)開(kāi)發(fā)概念和使用基本原則

    )。TokenID是每個(gè)應(yīng)用的身份標(biāo)識(shí),ATM通過(guò)應(yīng)用的TokenID來(lái)管理應(yīng)用的權(quán)限。 權(quán)限使用的基本原則 在進(jìn)行權(quán)限的申請(qǐng)和使用時(shí),需要滿足以下基本原則: 應(yīng)用申請(qǐng)的權(quán)限,都必須有明確、合理
    發(fā)表于 04-18 15:39

    選擇IGBT的基本原則是什么

    選擇IGBT的基本原則涉及以下幾個(gè)方面: 電壓等級(jí):選擇合適的IGBT要考慮其能夠承受的電壓等級(jí)。通常情況下,IGBT的額定電壓等級(jí)應(yīng)大于實(shí)際電路中的最高電壓。 電流容量:根據(jù)電路的負(fù)載電流,
    的頭像 發(fā)表于 03-12 15:29 ?1307次閱讀

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別有哪些

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別 GPU
    的頭像 發(fā)表于 01-30 15:31 ?869次閱讀

    群脈沖預(yù)防方案的基本原則?

    群脈沖預(yù)防方案的基本原則?|深圳比創(chuàng)達(dá)電子
    的頭像 發(fā)表于 01-15 14:03 ?619次閱讀
    群脈沖預(yù)防方案的<b class='flag-5'>基本原則</b>?

    超微gpu服務(wù)器評(píng)測(cè)

    隨著科技的不斷發(fā)展和進(jìn)步,GPU服務(wù)器在大數(shù)據(jù)分析、深度學(xué)習(xí)、人工智能等領(lǐng)域正變得越來(lái)越重要。而超微GPU服務(wù)器因其出色的性能和高度定制化的優(yōu)勢(shì),成為了眾多企業(yè)和研究機(jī)構(gòu)的首選。本文將
    的頭像 發(fā)表于 01-10 10:37 ?1393次閱讀

    控制靜電放電的三個(gè)基本原則

    控制靜電放電的三個(gè)基本原則? 控制靜電放電是一項(xiàng)關(guān)鍵的工程問(wèn)題,尤其是在現(xiàn)代工業(yè)中。靜電放電不僅可能損壞電子設(shè)備和電子元件,還可能引發(fā)火災(zāi)和爆炸等安全問(wèn)題。為了有效地控制靜電放電,我們需要遵循三個(gè)
    的頭像 發(fā)表于 01-03 11:00 ?2358次閱讀