0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

算力十問:超算智算,通算及算存比

智能計(jì)算芯世界 ? 來源:C114通信網(wǎng) ? 2024-04-13 11:40 ? 次閱讀

算力是集信息計(jì)算力、網(wǎng)絡(luò)運(yùn)載力、數(shù)據(jù)存儲(chǔ)力于一體的新型生產(chǎn)力,主要通過算力中心等算力基礎(chǔ)設(shè)施向社會(huì)提供服務(wù)。算力基礎(chǔ)設(shè)施是新型信息基礎(chǔ)設(shè)施的重要組成部分,呈現(xiàn)多元泛在、智能敏捷、安全可靠、綠色低碳等特征,對(duì)于助推產(chǎn)業(yè)轉(zhuǎn)型升級(jí)、賦能科技創(chuàng)新進(jìn)步、滿足人民美好生活需要和實(shí)現(xiàn)社會(huì)高效能治理具有重要意義。

在第二屆“華彩杯”算力大賽啟動(dòng)會(huì)上,中國工程院院士鄔賀銓作了《算力十問》的主題演講。

一問:如何準(zhǔn)確衡量算力?

鄔賀銓指出,現(xiàn)有測(cè)算方法難以精準(zhǔn)衡量算力。國內(nèi)企業(yè)服務(wù)器的出貨量并不等于國內(nèi)市場(chǎng)的使用量,而且進(jìn)口國外的服務(wù)器未統(tǒng)計(jì)在內(nèi);服務(wù)器出貨量也不等于上架量,更不等于已經(jīng)加電使用量。通常服務(wù)器集群的算力不等于集群內(nèi)服務(wù)器算力之和;通過問卷調(diào)研方法收集的數(shù)據(jù)也未必能全面反映目前實(shí)際使用情況。

二問:超算、通算、智算三類算力是否可以互相調(diào)劑?

超算和通算可否承擔(dān)生成式大模型的訓(xùn)練和推理任務(wù)?智算適合承擔(dān)目前超算和通算的任務(wù)嗎?建設(shè)兼具三類節(jié)點(diǎn)能力的融合算力中心會(huì)有利于三類算力的調(diào)度嗎?

三問:三類算力有無合理比例?

鄔賀銓認(rèn)為,不同地區(qū)需求不同,不可能有固定的比例。通常國家與區(qū)域創(chuàng)新中心城市對(duì)超算有較大需求;機(jī)密性和時(shí)延敏感性決定了城市政務(wù)數(shù)據(jù)和重要企業(yè)關(guān)鍵數(shù)據(jù)盡量在同城通算;東部地區(qū)的AI訓(xùn)練任務(wù)重、智算比例高;西部算力樞紐也需要增加智算能力,但一般西部地區(qū)以配置通算為主。

四問:何謂合適的算存比?

鄔賀銓強(qiáng)調(diào),存力與算力需配合,避免因存力短缺造成算力等待而影響處理效率。而存力按位于服務(wù)器內(nèi)外分為內(nèi)存與外存,對(duì)于CPU密集型計(jì)算任務(wù),影響算力效率與性能的主要是內(nèi)存,據(jù)分析合理的算存比是GFlops/GB為1;對(duì)I/O密集計(jì)算任務(wù),需頻繁訪問外存,如何考慮計(jì)入外存力的算存比合理取值,值得商榷。鄔賀銓同時(shí)指出,存力有HDD機(jī)械硬盤和SDD固態(tài)硬盤之分,后者可節(jié)能70%,但我國SDD僅占24.7%,不及美國一半。

五問:如何根據(jù)大模型參數(shù)量及訓(xùn)練數(shù)據(jù)量來設(shè)計(jì)算力需求?

AI模型參數(shù)是指深度神經(jīng)網(wǎng)絡(luò)各層神經(jīng)元間連接矩陣的權(quán)重和偏置,模型輸出值=權(quán)重×輸入值+偏置。

算力規(guī)模(峰值Flops)≈8×訓(xùn)練數(shù)據(jù)(tokens Byte)×模型參數(shù)/訓(xùn)練時(shí)間(秒)×算力利用率(0.3~0.55)。

存力規(guī)模(Byte)≈10×模型參數(shù)×計(jì)算精度(Byte)。

理論上可以通過增加訓(xùn)練時(shí)長來降低對(duì)大模型訓(xùn)練算力的需求,但訓(xùn)練時(shí)長的增加意味算力芯片集群出錯(cuò)的次數(shù)增加,為應(yīng)對(duì)出錯(cuò)所需存盤開銷也增加,計(jì)算效率顯著下降。據(jù)OpenAI的經(jīng)驗(yàn),模型大小和數(shù)據(jù)集大小及用于訓(xùn)練的算力規(guī)模三個(gè)因素同時(shí)放大才有最佳效果,據(jù)分析,當(dāng)不受其他兩個(gè)因素的制約時(shí),大模型性能與單個(gè)因素都有冪律關(guān)系。

六問:如何利用邊緣與終端的算力?

當(dāng)邊緣/終端具有70億參數(shù)以上的推理能力時(shí),邊緣/終端可離線進(jìn)行推理任務(wù),目前手機(jī)可支持130億參數(shù),2024年還會(huì)出現(xiàn)支持千億參數(shù)的手機(jī)。當(dāng)邊緣/終端僅具有10億參數(shù)的推理能力時(shí),需要與云端協(xié)同提供智能能力。鄔賀銓提出,單終端算力小,數(shù)以億計(jì)的終端算力集合就非??捎^,但跨終端的協(xié)同計(jì)算是否可行值得商榷。

七問:異地算力節(jié)點(diǎn)的協(xié)同可行嗎?

鄔賀銓認(rèn)為,將算力集群擴(kuò)展到跨域,多個(gè)異地的算力節(jié)點(diǎn)共同承擔(dān)一個(gè)計(jì)算任務(wù),實(shí)時(shí)性的交互要求光傳輸系統(tǒng)無損和確定性時(shí)延,任何丟包和抖動(dòng)都無法保證計(jì)算效率;在異屬異構(gòu)的場(chǎng)景下異地協(xié)同計(jì)算的實(shí)施可操作性更是挑戰(zhàn)。他強(qiáng)調(diào),集約化建設(shè)大型算力節(jié)點(diǎn)比分布異地協(xié)同能夠顯著提升能效和算力效率,東數(shù)西算和數(shù)據(jù)災(zāi)備都需要在異地算力樞紐間建立廣域連接,但這僅是算力任務(wù)的轉(zhuǎn)移而不是異地實(shí)時(shí)協(xié)同計(jì)算。

八問:算力的接入需要集中管理與指配嗎?

不通過國家算力調(diào)度平臺(tái)能夠構(gòu)建全國一體化算力網(wǎng)和算力大市場(chǎng)嗎?或者可以由算力節(jié)點(diǎn)擁有方和需求方聯(lián)合建立算力服務(wù)聯(lián)盟,以市場(chǎng)機(jī)制來溝通供需。另外,在強(qiáng)調(diào)企業(yè)為主體發(fā)揮市場(chǎng)有效作用的前提下,還需要強(qiáng)化有為政府的角色,通過建立結(jié)對(duì)子等東西部聯(lián)動(dòng)機(jī)制強(qiáng)化區(qū)域間算力協(xié)同。

九問:算網(wǎng)協(xié)同做什么和如何做?

算力與網(wǎng)絡(luò)往往屬于不同的運(yùn)營主體,跨運(yùn)營商的協(xié)同調(diào)度也有管理難題。而且網(wǎng)絡(luò)通常并不感知所承載的數(shù)據(jù)屬性。當(dāng)前,首先要厘清算網(wǎng)協(xié)同的標(biāo)準(zhǔn)與方法,發(fā)揮IPv6的分段選路、SRV6作為算網(wǎng)協(xié)同統(tǒng)一承載協(xié)議的作用,通過編程空間實(shí)現(xiàn)云網(wǎng)/算網(wǎng)的融通。

十問:如何解除中小企業(yè)使用算力的顧慮?

鄔賀銓建議,政府站臺(tái)主導(dǎo)建設(shè)面向中小企業(yè)的云智平臺(tái),降低企業(yè)利用算力的門檻和對(duì)安全的擔(dān)心。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 超算
    +關(guān)注

    關(guān)注

    1

    文章

    115

    瀏覽量

    9074
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    977

    瀏覽量

    14809
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2448

    瀏覽量

    2700

原文標(biāo)題:算力十問:超算智算,通算及算存比

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    杰和課堂|帶你認(rèn)識(shí)

    杰和課堂|帶你認(rèn)識(shí)力人工智能浪潮洶涌的今天,一詞頻繁出現(xiàn)在各類科技新聞、產(chǎn)業(yè)發(fā)展報(bào)告中。了解過杰和科技產(chǎn)品的讀者們,也會(huì)在杰和各產(chǎn)品參數(shù)中發(fā)現(xiàn)
    的頭像 發(fā)表于 12-06 10:24 ?282次閱讀
    杰和課堂|帶你認(rèn)識(shí)<b class='flag-5'>算</b><b class='flag-5'>力</b>

    調(diào)度的基礎(chǔ)知識(shí)

    編者按 “調(diào)度”的概念,這幾年越來越多的被提及。剛聽到這個(gè)概念的時(shí)候,我腦海里一直拐不過彎。作為底層芯片出身的我,一直認(rèn)為:是硬件的服務(wù)器和集群,他在某個(gè)地方,就是固定的;根本
    的頭像 發(fā)表于 11-27 17:13 ?177次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>調(diào)度的基礎(chǔ)知識(shí)

    基礎(chǔ)篇:從零開始了解

    即計(jì)算能力(Computing Power),狹義上指對(duì)數(shù)字問題的運(yùn)算能力,而廣義上指對(duì)輸入信息處理后實(shí)現(xiàn)結(jié)果輸出的一種能力。雖然處理的內(nèi)容不同,但處理過程的能力都可抽象為。比
    的頭像 發(fā)表于 11-15 14:22 ?648次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)篇:從零開始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計(jì)算資源,以滿足其AI應(yīng)用的需求。以下是對(duì)企業(yè)AI
    的頭像 發(fā)表于 11-14 09:30 ?581次閱讀

    GPU開發(fā)平臺(tái)是什么

    隨著AI技術(shù)的廣泛應(yīng)用,需求呈現(xiàn)出爆發(fā)式增長。AI租賃作為一種新興的服務(wù)模式,正逐漸成為企業(yè)獲取
    的頭像 發(fā)表于 10-31 10:31 ?181次閱讀

    大模型時(shí)代的需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭(zhēng)相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問題,帶著這個(gè)極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    中科曙光入選2024服務(wù)產(chǎn)業(yè)圖譜及服務(wù)產(chǎn)品名錄

    近日,中國信通院公布首個(gè)《服務(wù)產(chǎn)業(yè)圖譜(2024年)》及《服務(wù)產(chǎn)品名錄(2024年)》。曙光智構(gòu)建的全國一體化
    的頭像 發(fā)表于 08-06 14:23 ?694次閱讀

    曙光攜手“互聯(lián)公共服務(wù)平臺(tái)”提高全國匹配效率

    近日,由中國信息通信研究院開發(fā)的“互聯(lián)公共服務(wù)平臺(tái)”在重慶上線。作為該平臺(tái)合作方之一,曙光智參與了平臺(tái)發(fā)布儀式。 ? ? 曙光將依托在
    的頭像 發(fā)表于 07-16 15:45 ?694次閱讀

    力系列基礎(chǔ)篇——與計(jì)算機(jī)性能:解鎖超能力的神秘力量!

    在《力系列基礎(chǔ)篇——101:從零開始了解》中,相信各位粉絲初步了解到人工智能的“發(fā)動(dòng)機(jī)”和核心驅(qū)動(dòng)力:
    的頭像 發(fā)表于 07-11 08:04 ?104次閱讀
    <b class='flag-5'>算</b>力系列基礎(chǔ)篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>與計(jì)算機(jī)性能:解鎖超能力的神秘力量!

    基礎(chǔ)設(shè)施的風(fēng)險(xiǎn)與挑戰(zhàn)

    編者按網(wǎng)絡(luò)有一個(gè)美好的愿景,就是希望網(wǎng),能像電力和電網(wǎng)一樣:
    的頭像 發(fā)表于 06-13 08:27 ?550次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)設(shè)施的風(fēng)險(xiǎn)與挑戰(zhàn)

    力系列基礎(chǔ)篇——101:從零開始了解

    相信大家已經(jīng)感受到,我們正處在一個(gè)人工智能時(shí)代。如果要問在人工智能時(shí)代最重要的是什么?那必須是:!!
    的頭像 發(fā)表于 04-24 08:05 ?1002次閱讀
    <b class='flag-5'>算</b>力系列基礎(chǔ)篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:從零開始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    “捷智”正式入駐國家互聯(lián)網(wǎng)平臺(tái)

    ABSTRACT摘要2024年4月2日,本公司旗下服務(wù)品牌“捷智”正式入駐國家互聯(lián)網(wǎng)平臺(tái),開設(shè)云gpu旗艦店。我們將借助國家
    的頭像 發(fā)表于 04-12 08:26 ?577次閱讀
    “捷智<b class='flag-5'>算</b>”正式入駐國家<b class='flag-5'>超</b><b class='flag-5'>算</b>互聯(lián)網(wǎng)平臺(tái)

    智能規(guī)模通用,大模型對(duì)智能提出高要求

    的縮寫,即每秒所能夠進(jìn)行的浮點(diǎn)運(yùn)算數(shù)目(每秒浮點(diǎn)運(yùn)算量)。 ? 可以分為通用、智能
    的頭像 發(fā)表于 02-06 00:08 ?6344次閱讀

    大茉莉X16-P,5800M大稱王稱霸

    Rykj365
    發(fā)布于 :2024年01月25日 14:54:52

    網(wǎng)絡(luò)面臨三大挑戰(zhàn)

    2024年,以AIGC為代表的人工智能技術(shù)將進(jìn)一步激發(fā)需求,網(wǎng)絡(luò)、智中心、
    的頭像 發(fā)表于 01-12 10:39 ?1101次閱讀