0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

千億美元打造一個系統(tǒng),成本越來越高的AI超算

E4Life ? 來源:電子發(fā)燒友 ? 作者:周凱揚 ? 2024-04-09 00:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚)從近年來新發(fā)布的超算機器和新的HPC AI性能榜單可以看出,AI算力已經(jīng)在超算中成了不可忽視的性能指標之一,但也為廠商帶來了更大的成本挑戰(zhàn)。比如微軟近期就爆出和OpenAI合作,打造一個千億美元級別的超算系統(tǒng)。

千億美元打造AI超算

根據(jù)外媒報道,此次打造的千億美元超算系統(tǒng)名為Stargate,星門。這一超算系統(tǒng)僅僅只是微軟和OpenAI一系列數(shù)據(jù)中心合作項目之一,但造價已經(jīng)高到離譜了。從規(guī)模上看,這個超算的硬件配置已經(jīng)到了遠超現(xiàn)有系統(tǒng)的程度。據(jù)爆料,星門將集成百億個最新的英偉達GPU,造價可能會達到1150億美元。不過在互聯(lián)方案上,微軟可能會跳過英偉達的InfiniBand專用方案,而采用更加通用以太網(wǎng)方案。

當然了,雖然總成本較高,但微軟并沒有一次建成的部署策略,而是分拆成五個階段,整個項目在2028年成功建成。這樣可以盡早讓該系統(tǒng)投入使用,畢竟對于新的模型而言,率先發(fā)布才不會錯失市場機會。這或許也與微軟采用通用的以太網(wǎng)方案有關(guān),畢竟面對跨度如此長的方案而言,專用方案很可能會面臨被兼容性差和被淘汰的局面。微軟預計會在第四階段,也就是2026年左右,正式啟用這一超算系統(tǒng)。

除此之外,超算的部署地點依然待定,這無疑與部署地的電網(wǎng)供電能力息息相關(guān),當?shù)卣绻芴峁┲С肿匀蛔詈?。不過從硬件規(guī)模來看,單系統(tǒng)的耗電已經(jīng)達到千兆瓦級,無論是對美國哪個州而言,都是巨大的供電挑戰(zhàn)。也正因如此,微軟正在考慮核能在內(nèi)的其他替代能源方案。

超算部署成本發(fā)生的變化

時至今日,微軟已經(jīng)在OpenAI上花了130億美元,使用其數(shù)據(jù)中心來為ChatGPT之類的應用提供硬件支持。但此次的星門項目更是規(guī)模浩大,這也說明了新模型的訓練和推理,仍在對數(shù)據(jù)中心的硬件提出新的要求,需要用性能更強的AI超算來解決。

但這并不意味著普遍的超算成本真的有這么夸張的變化,要知道目前TOP500上排名第一的超算Frontier,其成本也只有6億美元。對于科研專用的單個超算系統(tǒng)而言,雖然造價不算低,但在政府的科研經(jīng)費支持下,研究機構(gòu)還是可以負擔起的。

不過值得注意的是,TOP500上的超算都有公開的跑分成績,為了實現(xiàn)這樣的成績,需要一定時間的優(yōu)化,再運行一段時間的測試才會有此成績。而市面上,尤其是在不少大型互聯(lián)網(wǎng)公司內(nèi)部,也存在并沒有公開提交成績的超算,因為這類系統(tǒng)幾乎是從誕生起就被投入商業(yè)使用了。

所以市面上肯定有超過6億美元的超算系統(tǒng),比如Meta就在幾個月前打造了兩套系統(tǒng),分別集成了2萬個H100 GPU,總成本在10億美元以上。其他的互聯(lián)網(wǎng)公司,諸如國內(nèi)的百度、騰訊等,想必也有龐大的硬件購買計劃。

寫在最后

隨著HPC與AI在需求和計算負載上的融合,市場趨勢從前幾年的“帶AI功能的HPC系統(tǒng)”變成了“同樣可以用于HPC的AI系統(tǒng)”。但從其規(guī)模來看,對于HPC市場也未嘗不是一件好事,畢竟目前AI超算的商業(yè)價值更高,能夠吸引到更多的投資和補貼,也有望進一步推動HPC硬件的革新速度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34913

    瀏覽量

    277925
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    333

    瀏覽量

    24287
  • 超算
    +關(guān)注

    關(guān)注

    1

    文章

    117

    瀏覽量

    9340
收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Intel至強6:AI江湖的幕后大佬、NVIDIA B300的唯伙伴

    隨著生成式AI、預測式AI的浪潮波高過波,工作負載的類型越來越豐富、復雜度越來越高,對于
    的頭像 發(fā)表于 06-19 16:37 ?138次閱讀
    Intel至強6:<b class='flag-5'>AI</b>江湖的幕后大佬、NVIDIA B300的唯<b class='flag-5'>一</b>伙伴

    加速卡是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!

    隨著AI技術(shù)火得塌糊涂,大家都在談"大模型"、"AI加速"、"智能計算",可真到了落地環(huán)節(jié),力才是硬通貨。你有沒有發(fā)現(xiàn),現(xiàn)在越來越多的
    的頭像 發(fā)表于 06-05 13:39 ?494次閱讀
    智<b class='flag-5'>算</b>加速卡是什么東西?它真能在<b class='flag-5'>AI</b>戰(zhàn)場上干掉GPU和TPU!

    RK3576 vs RK3588:為何越來越多的開發(fā)者轉(zhuǎn)向RK3576?

    成本結(jié)構(gòu)以及針對特定場景的深度優(yōu)化,正在成為中高端市場的熱門選擇。那么,RK3576 究竟有哪些優(yōu)勢?它是否真的能替代 RK3588?我們來做一個全面對比。 1. 核心性能對比:夠用且高效[td
    發(fā)表于 05-30 08:46

    維諦技術(shù):AI普惠浪潮下,如何打造力中樞?

    DeepSeek的橫空出世,為AI行業(yè)注入了新的變量。它憑借開源可用、低成本調(diào)用的特性,大幅降低了大模型技術(shù)的使用門檻,加速了AI能力向各行各業(yè)的滲透。在這場力“民主化”運動中,成千
    的頭像 發(fā)表于 05-12 14:42 ?357次閱讀
    維諦技術(shù):<b class='flag-5'>AI</b>普惠浪潮下,如何<b class='flag-5'>打造</b>新<b class='flag-5'>一</b>代<b class='flag-5'>算</b>力中樞?

    昆侖芯節(jié)點產(chǎn)品推出,大模型訓推任務性能跨越式提升

    AI開發(fā)者大會上,昆侖芯作為底層力核心被高頻提及,三萬卡集群點亮振奮人心,昆侖芯節(jié)點也在大會上正式發(fā)布。 ? ? 自ChatGPT問世,大模型參數(shù)快速增長,單卡顯存無法容納越來越
    的頭像 發(fā)表于 04-25 19:29 ?972次閱讀

    90元打造小智AI腕表,語音交互有趣!

    最近小智AI非?;?,這周給大家分享來自開源平臺的小智AI腕表項目。 項目作者@dotnfc,復刻成本90元左右,開源協(xié)議:MIT Lic
    發(fā)表于 04-16 14:26

    DeepSeek推動AI力需求:800G光模塊的關(guān)鍵作用

    力集群的部署過程中,帶寬瓶頸成為制約力發(fā)揮的關(guān)鍵因素,而光模塊的速率躍升成為突破這瓶頸的核心驅(qū)動力。 光模塊速率躍升 隨著力集群的規(guī)模不斷擴展,AI應用所需的帶寬要求也在急
    發(fā)表于 03-25 12:00

    國家平臺推出AI生態(tài)加速計劃

    昨日,國家互聯(lián)網(wǎng)平臺正式推出了旨在促進AI生態(tài)發(fā)展的新舉措——“AI生態(tài)伙伴加速計劃”。該計劃旨在通過提供系列激勵措施,加速
    的頭像 發(fā)表于 02-14 09:16 ?491次閱讀

    企業(yè)AI力租賃模式的好處

    構(gòu)建和維護高效、可擴展的AI力基礎設施,不僅需要巨額的初期投資,還涉及復雜的運維管理和持續(xù)的技術(shù)升級。而AI
    的頭像 發(fā)表于 12-24 10:49 ?1193次閱讀

    為什么說雷達功能是UWB的“寶藏”

    就需要更多的傳感器提供數(shù)據(jù)。IoT產(chǎn)品趨勢就是功能越來越多,要實現(xiàn)越來越多的功能,就需要越來越多的傳感器,而傳感器多了之后帶來的問題就是
    的頭像 發(fā)表于 12-20 15:26 ?1217次閱讀
    為什么說雷達功能是UWB的<b class='flag-5'>一</b><b class='flag-5'>個</b>“寶藏”

    廣和通開啟端側(cè)AI新時代

    AI發(fā)展正酣,隨著終端芯片越來越高、端側(cè)模型能力越來越強、實時響應及隱私保護的端側(cè)應用需求增加,端側(cè)AI已然具備落地的條件。端側(cè)
    的頭像 發(fā)表于 12-12 10:35 ?758次閱讀

    人民郵電報:“開源”到底是什么?為啥熱度越來越高?

    ? ? ? 本文轉(zhuǎn)載自人民郵電報 這些年,“開源”這個詞越來越火,開源AI大模型、開源數(shù)據(jù)庫、開源框架、開源硬件等新詞匯層出不窮。那么到底什么是“開源”呢,是“開源節(jié)流”中的“開源”嗎? 非也,今天
    的頭像 發(fā)表于 10-17 14:21 ?3749次閱讀
    人民郵電報:“開源”到底是什么?為啥熱度<b class='flag-5'>越來越高</b>?

    穩(wěn)定、高效、低成本,儲能與力正在相互賦能

    電子發(fā)燒友網(wǎng)報道(文/黃山明)隨著時代的發(fā)展,儲能與力正越來越緊密的結(jié)合?;蛟S對于很多人而言,儲能是能源系統(tǒng),而力則是信息系統(tǒng),兩者似乎
    的頭像 發(fā)表于 10-09 00:08 ?5576次閱讀

    芯片功率1000W,村田創(chuàng)新電容產(chǎn)品如何解決AI新挑戰(zhàn)?

    AI服務器出貨量逾125萬臺,同比增長超過47%。 ? 其中AI加速卡作為力的核心來源,需求量暴增,今年以來我們經(jīng)??梢钥吹礁骷铱萍脊緭屬徲ミ_GPU的消息,這也是推動英偉達在短時間內(nèi)市值飆升至全球前三的重要原因。 不過隨著
    的頭像 發(fā)表于 07-23 00:19 ?3600次閱讀
    芯片功率<b class='flag-5'>超</b>1000W,村田創(chuàng)新電容產(chǎn)品如何解決<b class='flag-5'>AI</b>新挑戰(zhàn)?

    力概念股寒武紀20cm漲停市值重回千億

    7月16日整個力概念板塊上漲;寒武紀(688256)上漲達20%,股價創(chuàng)年內(nèi)新高,成交額42億,寒武紀的總市值重回千億大關(guān)。 此外,紫光股份(000938)、海光信息(688041)等概念股同步
    的頭像 發(fā)表于 07-17 15:30 ?983次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品