0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

算力十問:超算智算,通算及算存比

智能計(jì)算芯世界 ? 來源:C114通信網(wǎng) ? 2024-04-13 11:40 ? 次閱讀

算力是集信息計(jì)算力、網(wǎng)絡(luò)運(yùn)載力、數(shù)據(jù)存儲(chǔ)力于一體的新型生產(chǎn)力,主要通過算力中心等算力基礎(chǔ)設(shè)施向社會(huì)提供服務(wù)。算力基礎(chǔ)設(shè)施是新型信息基礎(chǔ)設(shè)施的重要組成部分,呈現(xiàn)多元泛在、智能敏捷、安全可靠、綠色低碳等特征,對(duì)于助推產(chǎn)業(yè)轉(zhuǎn)型升級(jí)、賦能科技創(chuàng)新進(jìn)步、滿足人民美好生活需要和實(shí)現(xiàn)社會(huì)高效能治理具有重要意義。

在第二屆“華彩杯”算力大賽啟動(dòng)會(huì)上,中國(guó)工程院院士鄔賀銓作了《算力十問》的主題演講。

一問:如何準(zhǔn)確衡量算力?

鄔賀銓指出,現(xiàn)有測(cè)算方法難以精準(zhǔn)衡量算力。國(guó)內(nèi)企業(yè)服務(wù)器的出貨量并不等于國(guó)內(nèi)市場(chǎng)的使用量,而且進(jìn)口國(guó)外的服務(wù)器未統(tǒng)計(jì)在內(nèi);服務(wù)器出貨量也不等于上架量,更不等于已經(jīng)加電使用量。通常服務(wù)器集群的算力不等于集群內(nèi)服務(wù)器算力之和;通過問卷調(diào)研方法收集的數(shù)據(jù)也未必能全面反映目前實(shí)際使用情況。

二問:超算、通算、智算三類算力是否可以互相調(diào)劑?

超算和通算可否承擔(dān)生成式大模型的訓(xùn)練和推理任務(wù)?智算適合承擔(dān)目前超算和通算的任務(wù)嗎?建設(shè)兼具三類節(jié)點(diǎn)能力的融合算力中心會(huì)有利于三類算力的調(diào)度嗎?

三問:三類算力有無合理比例?

鄔賀銓認(rèn)為,不同地區(qū)需求不同,不可能有固定的比例。通常國(guó)家與區(qū)域創(chuàng)新中心城市對(duì)超算有較大需求;機(jī)密性和時(shí)延敏感性決定了城市政務(wù)數(shù)據(jù)和重要企業(yè)關(guān)鍵數(shù)據(jù)盡量在同城通算;東部地區(qū)的AI訓(xùn)練任務(wù)重、智算比例高;西部算力樞紐也需要增加智算能力,但一般西部地區(qū)以配置通算為主。

四問:何謂合適的算存比?

鄔賀銓強(qiáng)調(diào),存力與算力需配合,避免因存力短缺造成算力等待而影響處理效率。而存力按位于服務(wù)器內(nèi)外分為內(nèi)存與外存,對(duì)于CPU密集型計(jì)算任務(wù),影響算力效率與性能的主要是內(nèi)存,據(jù)分析合理的算存比是GFlops/GB為1;對(duì)I/O密集計(jì)算任務(wù),需頻繁訪問外存,如何考慮計(jì)入外存力的算存比合理取值,值得商榷。鄔賀銓同時(shí)指出,存力有HDD機(jī)械硬盤和SDD固態(tài)硬盤之分,后者可節(jié)能70%,但我國(guó)SDD僅占24.7%,不及美國(guó)一半。

五問:如何根據(jù)大模型參數(shù)量及訓(xùn)練數(shù)據(jù)量來設(shè)計(jì)算力需求?

AI模型參數(shù)是指深度神經(jīng)網(wǎng)絡(luò)各層神經(jīng)元間連接矩陣的權(quán)重和偏置,模型輸出值=權(quán)重×輸入值+偏置。

算力規(guī)模(峰值Flops)≈8×訓(xùn)練數(shù)據(jù)(tokens Byte)×模型參數(shù)/訓(xùn)練時(shí)間(秒)×算力利用率(0.3~0.55)。

存力規(guī)模(Byte)≈10×模型參數(shù)×計(jì)算精度(Byte)。

理論上可以通過增加訓(xùn)練時(shí)長(zhǎng)來降低對(duì)大模型訓(xùn)練算力的需求,但訓(xùn)練時(shí)長(zhǎng)的增加意味算力芯片集群出錯(cuò)的次數(shù)增加,為應(yīng)對(duì)出錯(cuò)所需存盤開銷也增加,計(jì)算效率顯著下降。據(jù)OpenAI的經(jīng)驗(yàn),模型大小和數(shù)據(jù)集大小及用于訓(xùn)練的算力規(guī)模三個(gè)因素同時(shí)放大才有最佳效果,據(jù)分析,當(dāng)不受其他兩個(gè)因素的制約時(shí),大模型性能與單個(gè)因素都有冪律關(guān)系。

六問:如何利用邊緣與終端的算力?

當(dāng)邊緣/終端具有70億參數(shù)以上的推理能力時(shí),邊緣/終端可離線進(jìn)行推理任務(wù),目前手機(jī)可支持130億參數(shù),2024年還會(huì)出現(xiàn)支持千億參數(shù)的手機(jī)。當(dāng)邊緣/終端僅具有10億參數(shù)的推理能力時(shí),需要與云端協(xié)同提供智能能力。鄔賀銓提出,單終端算力小,數(shù)以億計(jì)的終端算力集合就非常可觀,但跨終端的協(xié)同計(jì)算是否可行值得商榷。

七問:異地算力節(jié)點(diǎn)的協(xié)同可行嗎?

鄔賀銓認(rèn)為,將算力集群擴(kuò)展到跨域,多個(gè)異地的算力節(jié)點(diǎn)共同承擔(dān)一個(gè)計(jì)算任務(wù),實(shí)時(shí)性的交互要求光傳輸系統(tǒng)無損和確定性時(shí)延,任何丟包和抖動(dòng)都無法保證計(jì)算效率;在異屬異構(gòu)的場(chǎng)景下異地協(xié)同計(jì)算的實(shí)施可操作性更是挑戰(zhàn)。他強(qiáng)調(diào),集約化建設(shè)大型算力節(jié)點(diǎn)比分布異地協(xié)同能夠顯著提升能效和算力效率,東數(shù)西算和數(shù)據(jù)災(zāi)備都需要在異地算力樞紐間建立廣域連接,但這僅是算力任務(wù)的轉(zhuǎn)移而不是異地實(shí)時(shí)協(xié)同計(jì)算。

八問:算力的接入需要集中管理與指配嗎?

不通過國(guó)家算力調(diào)度平臺(tái)能夠構(gòu)建全國(guó)一體化算力網(wǎng)和算力大市場(chǎng)嗎?或者可以由算力節(jié)點(diǎn)擁有方和需求方聯(lián)合建立算力服務(wù)聯(lián)盟,以市場(chǎng)機(jī)制來溝通供需。另外,在強(qiáng)調(diào)企業(yè)為主體發(fā)揮市場(chǎng)有效作用的前提下,還需要強(qiáng)化有為政府的角色,通過建立結(jié)對(duì)子等東西部聯(lián)動(dòng)機(jī)制強(qiáng)化區(qū)域間算力協(xié)同。

九問:算網(wǎng)協(xié)同做什么和如何做?

算力與網(wǎng)絡(luò)往往屬于不同的運(yùn)營(yíng)主體,跨運(yùn)營(yíng)商的協(xié)同調(diào)度也有管理難題。而且網(wǎng)絡(luò)通常并不感知所承載的數(shù)據(jù)屬性。當(dāng)前,首先要厘清算網(wǎng)協(xié)同的標(biāo)準(zhǔn)與方法,發(fā)揮IPv6的分段選路、SRV6作為算網(wǎng)協(xié)同統(tǒng)一承載協(xié)議的作用,通過編程空間實(shí)現(xiàn)云網(wǎng)/算網(wǎng)的融通。

十問:如何解除中小企業(yè)使用算力的顧慮?

鄔賀銓建議,政府站臺(tái)主導(dǎo)建設(shè)面向中小企業(yè)的云智平臺(tái),降低企業(yè)利用算力的門檻和對(duì)安全的擔(dān)心。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 超算
    +關(guān)注

    關(guān)注

    1

    文章

    117

    瀏覽量

    9270
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    1099

    瀏覽量

    15337
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2925

    瀏覽量

    3673

原文標(biāo)題:算力十問:超算智算,通算及算存比

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    芯片的生態(tài)突圍與革命

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)大芯片,即具備強(qiáng)大計(jì)算能力的集成電路芯片,主要應(yīng)用于高性能計(jì)算(HPC)、人工智能(AI)、數(shù)據(jù)中心、自動(dòng)駕駛等需要海量數(shù)據(jù)并行計(jì)算的場(chǎng)景。隨著 AI 與大數(shù)
    的頭像 發(fā)表于 04-13 00:02 ?1187次閱讀

    【一文看懂】什么是端側(cè)

    隨著物聯(lián)網(wǎng)(IoT)、人工智能和5G技術(shù)的快速發(fā)展,端側(cè)正逐漸成為智能設(shè)備性能提升和智能化應(yīng)用實(shí)現(xiàn)的關(guān)鍵技術(shù)。什么是端側(cè),它的應(yīng)用價(jià)值是什么,與云計(jì)算、邊緣計(jì)算有哪些區(qū)別?本文
    的頭像 發(fā)表于 02-24 12:02 ?811次閱讀
    【一文看懂】什么是端側(cè)<b class='flag-5'>算</b><b class='flag-5'>力</b>?

    中心的如何衡量?

    作為當(dāng)下科技發(fā)展的重要基礎(chǔ)設(shè)施,其的衡量關(guān)乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應(yīng)用的運(yùn)行。以下是對(duì)智中心算衡量的詳細(xì)闡述:一、
    的頭像 發(fā)表于 01-16 14:03 ?1450次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    科技云報(bào)到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?

    科技云報(bào)到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?
    的頭像 發(fā)表于 01-16 10:24 ?294次閱讀

    融合 南京信易達(dá)發(fā)布全新“智能融合平臺(tái)”

    1月7日,南京信易達(dá)發(fā)布了旗下最新平臺(tái)“C-MOM智能融合平臺(tái)V3.0”,并更新了全新的UI視覺與交互系統(tǒng)。 該平臺(tái)集成了HPC
    的頭像 發(fā)表于 01-08 10:56 ?425次閱讀
    <b class='flag-5'>超</b><b class='flag-5'>算</b>智<b class='flag-5'>算</b>融合 南京信易達(dá)發(fā)布全新“智能<b class='flag-5'>算</b><b class='flag-5'>力</b>融合平臺(tái)”

    中心會(huì)取代通用中心嗎?

    隨著人工智能(AI)技術(shù)的飛速發(fā)展,計(jì)算需求不斷攀升,數(shù)據(jù)中心行業(yè)正經(jīng)歷著前所未有的變革。傳統(tǒng)的通用中心與新興的智中心之間的競(jìng)爭(zhēng)日益激烈。那么,在這樣的背景下,通用
    的頭像 發(fā)表于 01-06 14:45 ?399次閱讀
    智<b class='flag-5'>算</b>中心會(huì)取代通用<b class='flag-5'>算</b><b class='flag-5'>力</b>中心嗎?

    基礎(chǔ)篇:從零開始了解

    即計(jì)算能力(Computing Power),狹義上指對(duì)數(shù)字問題的運(yùn)算能力,而廣義上指對(duì)輸入信息處理后實(shí)現(xiàn)結(jié)果輸出的一種能力。雖然處理的內(nèi)容不同,但處理過程的能力都可抽象為。比
    的頭像 發(fā)表于 11-15 14:22 ?1610次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)篇:從零開始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計(jì)算資源,以滿足其AI應(yīng)用的需求。以下是對(duì)企業(yè)AI
    的頭像 發(fā)表于 11-14 09:30 ?1965次閱讀

    GPU開發(fā)平臺(tái)是什么

    隨著AI技術(shù)的廣泛應(yīng)用,需求呈現(xiàn)出爆發(fā)式增長(zhǎng)。AI租賃作為一種新興的服務(wù)模式,正逐漸成為企業(yè)獲取
    的頭像 發(fā)表于 10-31 10:31 ?470次閱讀

    大模型時(shí)代的需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭(zhēng)相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問題,帶著這個(gè)極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    中科曙光入選2024服務(wù)產(chǎn)業(yè)圖譜及服務(wù)產(chǎn)品名錄

    近日,中國(guó)信通院公布首個(gè)《服務(wù)產(chǎn)業(yè)圖譜(2024年)》及《服務(wù)產(chǎn)品名錄(2024年)》。曙光智構(gòu)建的全國(guó)一體化
    的頭像 發(fā)表于 08-06 14:23 ?1095次閱讀

    曙光攜手“互聯(lián)公共服務(wù)平臺(tái)”提高全國(guó)匹配效率

    近日,由中國(guó)信息通信研究院開發(fā)的“互聯(lián)公共服務(wù)平臺(tái)”在重慶上線。作為該平臺(tái)合作方之一,曙光智參與了平臺(tái)發(fā)布儀式。 ? ? 曙光將依托在
    的頭像 發(fā)表于 07-16 15:45 ?896次閱讀

    力系列基礎(chǔ)篇——與計(jì)算機(jī)性能:解鎖超能力的神秘力量!

    在《力系列基礎(chǔ)篇——101:從零開始了解》中,相信各位粉絲初步了解到人工智能的“發(fā)動(dòng)機(jī)”和核心驅(qū)動(dòng)力:
    的頭像 發(fā)表于 07-11 08:04 ?104次閱讀
    <b class='flag-5'>算</b>力系列基礎(chǔ)篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>與計(jì)算機(jī)性能:解鎖超能力的神秘力量!

    基礎(chǔ)設(shè)施的風(fēng)險(xiǎn)與挑戰(zhàn)

    編者按網(wǎng)絡(luò)有一個(gè)美好的愿景,就是希望網(wǎng),能像電力和電網(wǎng)一樣:
    的頭像 發(fā)表于 06-13 08:27 ?770次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)設(shè)施的風(fēng)險(xiǎn)與挑戰(zhàn)

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品