0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

異構混訓整合不同架構芯片資源,提高算力利用率

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-07-18 00:11 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著AI技術的飛速發(fā)展,大模型的訓練和推理任務對算力的需求日益增長。然而,單一品牌的芯片往往難以滿足所有需求,且可能存在供應鏈風險。因此,異構芯片混訓成為了一種重要的解決方案。通過混合使用多種異構芯片,可以充分利用不同芯片的優(yōu)勢,提高算力利用率,降低算力成本,并推動AI技術的廣泛應用。

異構混訓能夠整合不同架構芯片資源

在2024年世界人工智能大會AI基礎設施論壇上,無問芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪發(fā)布了全球首個千卡規(guī)模異構芯片混訓平臺,千卡異構混合訓練集群算力利用率最高達到了97.6%。

同時,無問芯穹Infini-AI云平臺已集成大模型異構千卡混訓能力,是全球首個可進行單任務千卡規(guī)模異構芯片混合訓練的平臺,具備萬卡擴展性,支持包括AMD、華為昇騰、天數(shù)智芯、沐曦、摩爾線程、NVIDIA六種異構芯片在內的大模型混合訓練。通過Infini-AI云平臺,用戶可以在異構算力資源上實現(xiàn)高效的模型訓練和推理,從而加速AI應用的開發(fā)和部署。

據(jù)稱,已有智譜AI、月之暗面、生數(shù)科技等大模型公司客戶在Infini-AI上穩(wěn)定使用異構算力,還有20余家AI Native應用創(chuàng)業(yè)公司在Infini-AI上持續(xù)調用各種預置模型。

異構混訓平臺具有多樣化算力資源、高效算力分配、靈活性與可擴展性、降低總體擁有成本(TCO)、推動技術創(chuàng)新和生態(tài)整合等特點。

具體來看,異構混訓平臺能夠整合來自不同廠商、不同架構的芯片資源,這些芯片在各自擅長的領域具有不同的性能優(yōu)勢。通過智能的調度算法和任務分發(fā)機制,異構混訓平臺能夠根據(jù)任務的特性和需求,將最適合的算力資源分配給相應的芯片,從而實現(xiàn)算力資源的最大化利用。

異構混訓平臺支持多種芯片和算法的組合使用,能夠靈活應對不同規(guī)模、不同復雜度的訓練任務。同時,它也具備較高的可擴展性,能夠根據(jù)實際需求進行算力資源的動態(tài)擴展。通過整合不同架構的芯片資源,避免對單一硬件平臺的過度依賴,異構混訓平臺能夠降低供應鏈風險,并通過提高算力利用率和訓練效率來降低總體擁有成本。

異構混訓平臺為AI技術創(chuàng)新提供了更加廣闊的舞臺,通過整合不同芯片和算法的優(yōu)勢資源,可以激發(fā)更多的創(chuàng)新靈感和技術突破。同時,它也有助于打破不同硬件生態(tài)系統(tǒng)之間的壁壘,促進生態(tài)整合與協(xié)同發(fā)展。

異構混訓在AI領域的需求日益凸顯

近年來,隨著人工智能技術的不斷發(fā)展,大模型的參數(shù)量急劇增加,從十億、百億到千億甚至萬億級別。以ChatGPT、LLama等為代表的大模型技術正持續(xù)推動社會變革,引發(fā)新一輪人工智能熱潮。這些大模型具有數(shù)千億甚至上萬億參數(shù)規(guī)模,單個計算節(jié)點無法滿足訓練需求,訓練過程耗時巨大。

面對如此龐大的模型,傳統(tǒng)的同構算力集群已經(jīng)無法滿足訓練需求。即使采用分布式訓練框架,也需要充分整合可調動的算力資源進行分布式并行加速。然而,由于不同廠商的智算芯片之間存在計算架構、緩存資源、互聯(lián)方式等諸多差異,以及AI計算框架與各廠商基礎軟件棧深度綁定,導致多種智算芯片難以協(xié)同工作,限制了算力資源的充分利用。

異構芯片混訓成了解決算力限制的重要方式,目前已經(jīng)有諸多應用案例。如,醫(yī)療機構采用異構芯片混訓平臺,將NVIDIA GPU、Intel CPU以及華為昇騰AI處理器等多種芯片混合使用。通過平臺的高效調度和算力分配,實現(xiàn)了對醫(yī)學影像數(shù)據(jù)的快速處理和分析。

異構芯片混訓平臺能夠顯著提高了醫(yī)療影像分析系統(tǒng)的處理速度和精度,為醫(yī)生提供了更加準確和及時的診斷支持。

自動駕駛汽車研發(fā)公司采用異構芯片混訓平臺,將AMD GPU、NVIDIA GPU以及專用AI加速器等多種芯片混合使用。通過平臺的異構并行訓練能力,實現(xiàn)了對自動駕駛算法模型的高效訓練和優(yōu)化。

異構芯片混訓平臺能顯著提高自動駕駛算法模型的訓練速度和精度,為自動駕駛汽車的研發(fā)提供了有力支持。同時,通過降低算力成本和提高資源利用率,也可以幫助公司加快自動駕駛技術的商業(yè)化進程。

寫在最后

當然,在異構芯片混訓過程中,可能會面臨一些技術挑戰(zhàn),如不同芯片間的通信問題、性能差異等。為了解決這些問題,可以采取相應的措施,如建立通用的集合通信庫,實現(xiàn)不同種芯片的高效通信,兼容多種硬件;提出基于流水線并行的非均勻拆分方案,解決不同硬件效率不一樣的問題,針對自身情況分配最適合的任務等。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    34457

    瀏覽量

    275862
  • 算力
    +關注

    關注

    2

    文章

    1157

    瀏覽量

    15483
  • 大模型
    +關注

    關注

    2

    文章

    3055

    瀏覽量

    3874
收藏 0人收藏

    評論

    相關推薦
    熱點推薦

    壁仞科技擔任智集群異構工作組組長

    參與了本次交流,分享智集群異構的關鍵技術進展、成功落地案例,為突破大模型異構
    的頭像 發(fā)表于 05-27 16:55 ?374次閱讀

    拼版怎么拼好,板廠經(jīng)常說利用率太低,多收費用?

    做板的時候,板廠經(jīng)常說我拼版利用率太低,要多收取費用,哪位大神知道怎么利用率
    發(fā)表于 05-14 13:42

    DeepSeek MoE架構下的網(wǎng)絡負載如何優(yōu)化?解鎖90%網(wǎng)絡利用率的關鍵策略

    、All-to-All等),網(wǎng)絡面臨高并發(fā)、低延遲、無損傳輸?shù)膰揽列枨?。然而,傳統(tǒng)以太網(wǎng)的網(wǎng)絡利用率長期徘徊在35%~40%,成為制約AI釋放的關鍵瓶頸。
    的頭像 發(fā)表于 04-28 12:04 ?297次閱讀
    DeepSeek MoE<b class='flag-5'>架構</b>下的網(wǎng)絡負載如何優(yōu)化?解鎖90%網(wǎng)絡<b class='flag-5'>利用率</b>的關鍵策略

    梯度科技助力客戶破解調度難題

    在數(shù)字經(jīng)濟與人工智能深度融合的新階段,已成為支撐人工智能發(fā)展的核心生產(chǎn)。梯度科技基于云原生技術架構研發(fā)的
    的頭像 發(fā)表于 04-27 16:32 ?373次閱讀

    RAKsmart智能架構異構計算+低時延網(wǎng)絡驅動企業(yè)AI訓練范式升級

    在AI大模型參數(shù)量突破萬億、多模態(tài)應用爆發(fā)的今天,企業(yè)AI訓練正面臨效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能架構,以
    的頭像 發(fā)表于 04-17 09:29 ?266次閱讀

    DeepSeek驅動AI市場升溫,智中心利用率望提升

    。 盡管目前這一需求尚未對供給造成直接影響,但卡價格已經(jīng)呈現(xiàn)出上漲趨勢。這一變化反映出市場對AI的強烈需求,以及DeepSeek等技術推動下的
    的頭像 發(fā)表于 02-19 14:00 ?413次閱讀

    DeepSeek對芯片的影響

    DeepSeek模型,尤其是其基于MOE(混合專家)架構的DeepSeek-V3,對芯片的要求產(chǎn)生了深遠影響。為了更好地理解這一影響,我們可以從幾個方面進行分析。一.MOE
    的頭像 發(fā)表于 02-07 10:02 ?1030次閱讀
    DeepSeek對<b class='flag-5'>芯片</b><b class='flag-5'>算</b><b class='flag-5'>力</b>的影響

    壁仞科技聯(lián)合中國電信等合作伙伴共同發(fā)布智異構四芯解決方案

    工智能實驗室等發(fā)布了“智異構四芯解決方案”,打造、網(wǎng)絡、平臺、通信庫、框架全棧
    的頭像 發(fā)表于 12-07 17:56 ?2279次閱讀

    華納云:什么是負載均衡?優(yōu)化資源利用率的策略

    負載均衡是現(xiàn)代計算機網(wǎng)絡架構中不可或缺的一部分,它通過智能分配請求和任務,確保系統(tǒng)資源的高效利用。本文將探討負載均衡的概念、工作原理、優(yōu)化資源利用率
    的頭像 發(fā)表于 10-28 16:07 ?553次閱讀

    交換機內存利用率過高會是什么問題

    在現(xiàn)代網(wǎng)絡架構中,交換機扮演著至關重要的角色,負責在網(wǎng)絡設備之間高效地轉發(fā)數(shù)據(jù)包。然而,隨著網(wǎng)絡規(guī)模的擴大和數(shù)據(jù)流量的增加,交換機的內存資源可能會變得緊張,導致內存利用率過高。這種情況如果不加
    的頭像 發(fā)表于 10-18 09:53 ?1926次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    、GPU、NPU,給我們剖析了芯片的微架構。書中有對芯片方案商處理器的講解,理論聯(lián)系實際,使讀者能更好理解
    發(fā)表于 10-15 22:08

    中國智能汽車騰飛,為什么異構是第一生產(chǎn)?

    智能時代的“世紀之車”,異構是第一驅動力
    的頭像 發(fā)表于 09-14 10:32 ?4273次閱讀
    中國智能汽車騰飛,為什么<b class='flag-5'>異構</b><b class='flag-5'>算</b><b class='flag-5'>力</b>是第一生產(chǎn)<b class='flag-5'>力</b>?

    名單公布!【書籍評測活動NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構分析

    社會資源和資本力量關注芯片的發(fā)展,希望我們的國家能夠更獨立自主地設計制造高性能
    發(fā)表于 09-02 10:09

    安謀科技異構組合,破局生成式AI挑戰(zhàn)

    近日,此芯科技集團有限公司(以下簡稱“此芯科技”)AI PC戰(zhàn)略暨首款芯片發(fā)布會在上海舉行,正式推出了其首款專為AI PC打造的異構高能效芯片產(chǎn)品——“此芯P1”。作為國產(chǎn)新一代AI PC
    的頭像 發(fā)表于 08-13 09:12 ?855次閱讀

    神州鯤泰亮相北京數(shù)字安全大會,以智能構筑數(shù)據(jù)安全的堅實底座

    正成為賦能各行各業(yè)數(shù)字化轉型的基礎技術要素,神州鯤泰面對智時代多云、異構、綠色計算等現(xiàn)實需求,智集群間以及集群內復雜
    的頭像 發(fā)表于 07-18 16:06 ?634次閱讀
    神州鯤泰亮相北京數(shù)字安全大會,以智能<b class='flag-5'>算</b><b class='flag-5'>力</b>構筑數(shù)據(jù)安全的堅實底座

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品