0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GTC 2023看點(diǎn):深度學(xué)習(xí)系統(tǒng)Colossal-AI試圖解決什么問(wèn)題

西西 ? 來(lái)源:GTC 2023直播 ? 作者:GTC 2023直播 ? 2023-03-23 16:03 ? 次閱讀

在GTC 2023 | NVIDIA開(kāi)發(fā)者大會(huì)上,加州伯克利數(shù)學(xué)與計(jì)算機(jī)科學(xué)的教授向我們介紹了關(guān)于深度學(xué)習(xí)系統(tǒng)Colossal-AI的相關(guān)內(nèi)容。

深度學(xué)習(xí)系統(tǒng)Colossal-AI使用戶能夠以大幅降低成本的方式最大限度地提高AI訓(xùn)練和推理的效率。它集成了高效的多維并行、異構(gòu)內(nèi)存管理、自適應(yīng)任務(wù)調(diào)度等先進(jìn)技術(shù)。

Colossal-AI將更好地了解大型模型訓(xùn)練和推理背后的并行性和內(nèi)存優(yōu)化技術(shù),學(xué)習(xí)深度學(xué)習(xí)系統(tǒng)的實(shí)際應(yīng)用(包括自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、生物信息學(xué)等),并能夠?yàn)槲磥?lái)的大型 AI 模型時(shí)代做出貢獻(xiàn)。

Colossal-AI系統(tǒng)試圖解決什么問(wèn)題呢?

pYYBAGQcCh-AK0ObAAJWHKaquW4641.png

主流AI模型大小增長(zhǎng)的圖表,它顯示了AI模型在短短幾年內(nèi)增長(zhǎng)的速度,每18個(gè)月增長(zhǎng)40倍,這超過(guò)了摩爾定律在其具盛時(shí)期的最佳表現(xiàn)。

小型和中型企業(yè)( SMEs )在盡可能地在采用它們,Colossal-Al系統(tǒng)在2026年時(shí)可以幫你節(jié)省的成本的估計(jì)訓(xùn)練175B參數(shù)GPT-3模型,利用所有這些硬件特性和變化,估計(jì)訓(xùn)練成本從300降至73000美元,約為41倍。

強(qiáng)調(diào)大規(guī)模并行是必不可少的,使用單個(gè)A 100 GPU訓(xùn)練具有540B參數(shù)的Pal M語(yǔ)言模型的時(shí)間和成本,需要300年并且花費(fèi)920萬(wàn)美元。

隨著新數(shù)據(jù)的不斷出現(xiàn),他們需要反復(fù)的新訓(xùn)練以避免像2019年的GPT-2一樣無(wú)法識(shí)別COVID-19等概念。

訓(xùn)練完成之后,僅使用模型進(jìn)行推理也是項(xiàng)挑戰(zhàn),因?yàn)槟P偷拇笮⌒枰⑿屑夹g(shù),單個(gè)服務(wù)器的內(nèi)存可能無(wú)法容納大模型。除了設(shè)備成本之外,還有人力成本支付需要解決所有這些問(wèn)題的專家團(tuán)隊(duì),這就限制了一些公司特別是無(wú)法承受這些團(tuán)隊(duì)的中小企業(yè)使用這些大型模型。

因此Colossal-AI的作用出現(xiàn)了:

對(duì)特定底層硬件架構(gòu)進(jìn)行優(yōu)化,左側(cè)(硬件層)可以是CPU、 GPU、TPU或FPGAl,右側(cè)是你的用于AI模型編寫的框架,如TensorFlow、 Py Torch或其他框架。Colossal-AI可以高效地將大模型部署到目標(biāo)架構(gòu),實(shí)現(xiàn)底部顯示的所有目標(biāo),最小化運(yùn)行時(shí)間,最小化通信(移動(dòng)數(shù)據(jù))在當(dāng)前架構(gòu)是最昂貴的操作,最小化用戶需要改動(dòng)代碼的數(shù)量,即重構(gòu)。使模型能夠動(dòng)態(tài)地適應(yīng)機(jī)器的規(guī)模變化,并減少內(nèi)存占用,一邊能運(yùn)行大模型。

Colossal-AI提供了三個(gè)層次:

高效的內(nèi)存系統(tǒng),可最大程度利用可用內(nèi)存。

多維并行,即如何最好地將復(fù)雜的模型映射到可用的硬件上,以最大程度地使并行處理并最小化通信。

大規(guī)模優(yōu)化,也就是如何自動(dòng)調(diào)整影響準(zhǔn)確度收斂的眾多超參數(shù),因?yàn)檫@些值通常取決子如何進(jìn)行并行處理。

因此Colossal-AI的目標(biāo)是將復(fù)雜且相互作用的決策從用戶角度隱藏起來(lái),并自動(dòng)完成所有操作。

編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3778

    瀏覽量

    91157
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5503

    瀏覽量

    121206
  • gtc
    gtc
    +關(guān)注

    關(guān)注

    0

    文章

    73

    瀏覽量

    4430
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI干貨補(bǔ)給站 | 深度學(xué)習(xí)與機(jī)器視覺(jué)的融合探索

    ,幫助從業(yè)者積累行業(yè)知識(shí),推動(dòng)工業(yè)視覺(jué)應(yīng)用的快速落地。本期亮點(diǎn)預(yù)告本期將以“深度學(xué)習(xí)與機(jī)器視覺(jué)的融合探索”為主題,通過(guò)講解深度學(xué)習(xí)定義、傳統(tǒng)機(jī)器視覺(jué)與
    的頭像 發(fā)表于 10-29 08:04 ?230次閱讀
    <b class='flag-5'>AI</b>干貨補(bǔ)給站 | <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>與機(jī)器視覺(jué)的融合探索

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識(shí)別 圖像識(shí)別是深度學(xué)習(xí)
    的頭像 發(fā)表于 10-27 11:13 ?399次閱讀

    AI大模型與深度學(xué)習(xí)的關(guān)系

    AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對(duì)兩者關(guān)系的介紹: 一、深度學(xué)習(xí)
    的頭像 發(fā)表于 10-23 15:25 ?788次閱讀

    NVIDIA推出全新深度學(xué)習(xí)框架fVDB

    在 SIGGRAPH 上推出的全新深度學(xué)習(xí)框架可用于打造自動(dòng)駕駛汽車、氣候科學(xué)和智慧城市的 AI 就緒型虛擬表示。
    的頭像 發(fā)表于 08-01 14:31 ?618次閱讀

    深度學(xué)習(xí)中的時(shí)間序列分類方法

    時(shí)間序列分類(Time Series Classification, TSC)是機(jī)器學(xué)習(xí)深度學(xué)習(xí)領(lǐng)域的重要任務(wù)之一,廣泛應(yīng)用于人體活動(dòng)識(shí)別、系統(tǒng)監(jiān)測(cè)、金融預(yù)測(cè)、醫(yī)療診斷等多個(gè)領(lǐng)域。隨
    的頭像 發(fā)表于 07-09 15:54 ?954次閱讀

    基于AI深度學(xué)習(xí)的缺陷檢測(cè)系統(tǒng)

    在工業(yè)生產(chǎn)中,缺陷檢測(cè)是確保產(chǎn)品質(zhì)量的關(guān)鍵環(huán)節(jié)。傳統(tǒng)的人工檢測(cè)方法不僅效率低下,且易受人為因素影響,導(dǎo)致誤檢和漏檢問(wèn)題頻發(fā)。隨著人工智能技術(shù)的飛速發(fā)展,特別是深度學(xué)習(xí)技術(shù)的崛起,基于AI深度
    的頭像 發(fā)表于 07-08 10:30 ?1452次閱讀

    人工智能、機(jī)器學(xué)習(xí)深度學(xué)習(xí)是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機(jī)器學(xué)習(xí)(Machine Learning, ML)和深度學(xué)習(xí)(Deep Learning,
    的頭像 發(fā)表于 07-03 18:22 ?1310次閱讀

    泰禾智能攜AI智選深度學(xué)習(xí)系列新品亮相臨沂花生展

    的使用體驗(yàn),也為整個(gè)行業(yè)的發(fā)展注入了新的活力。 ? AI智選 賦能升級(jí)? ? 泰禾AI智選深度學(xué)習(xí)色選機(jī)搭載AI
    的頭像 發(fā)表于 06-29 14:19 ?758次閱讀

    深度解析深度學(xué)習(xí)下的語(yǔ)義SLAM

    隨著深度學(xué)習(xí)技術(shù)的興起,計(jì)算機(jī)視覺(jué)的許多傳統(tǒng)領(lǐng)域都取得了突破性進(jìn)展,例如目標(biāo)的檢測(cè)、識(shí)別和分類等領(lǐng)域。近年來(lái),研究人員開(kāi)始在視覺(jué)SLAM算法中引入深度學(xué)習(xí)技術(shù),使得
    發(fā)表于 04-23 17:18 ?1299次閱讀
    <b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>下的語(yǔ)義SLAM

    與NVIDIA深度參與GTC,向量數(shù)據(jù)庫(kù)大廠Zilliz與全球頂尖開(kāi)發(fā)者共迎AI變革時(shí)刻

    近日,備受關(guān)注的 NVIDIA GTC 已拉開(kāi)序幕。來(lái)自世界各地的頂尖 AI 開(kāi)發(fā)者齊聚美國(guó)加州圣何塞會(huì)議中心,共同探索行業(yè)未來(lái),全球領(lǐng)先的向量數(shù)據(jù)庫(kù)公司 Zilliz 也不例外。作為去年被
    的頭像 發(fā)表于 03-26 11:01 ?415次閱讀

    FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈鶪PU

    基礎(chǔ)設(shè)施,人們?nèi)匀粵](méi)有定論。如果 Mipsology 成功完成了研究實(shí)驗(yàn),許多正受 GPU 折磨的 AI 開(kāi)發(fā)者將從中受益。 GPU 深度學(xué)習(xí)面臨的挑戰(zhàn) 三維圖形是 GPU 擁有如此大的內(nèi)存和計(jì)算能力
    發(fā)表于 03-21 15:19

    英偉達(dá)GTC大會(huì)將開(kāi)幕 黃仁勛將帶你《見(jiàn)證AI的變革時(shí)刻》

    英偉達(dá)GTC大會(huì)將開(kāi)幕 黃仁勛將帶你《見(jiàn)證AI的變革時(shí)刻》 全球都在關(guān)注的英偉達(dá)GTC大會(huì)將開(kāi)幕,作為“AI風(fēng)向標(biāo)”大家都在期待英偉達(dá)在GTC
    的頭像 發(fā)表于 03-18 18:25 ?1348次閱讀

    潞晨科技Colossal-AI與浪潮信息AIStation完成兼容性互認(rèn)證

    近日,潞晨科技的Colossal-AI大模型開(kāi)發(fā)工具和浪潮信息的AIStation智能業(yè)務(wù)創(chuàng)新生產(chǎn)平臺(tái)成功完成了兼容性互認(rèn)證。這一合作意味著用戶可以在AIStation平臺(tái)上便捷地部署與調(diào)度Colossal-AI系統(tǒng),從而極大提
    的頭像 發(fā)表于 03-06 10:18 ?814次閱讀

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型開(kāi)發(fā)效率提升10倍

    的潞晨科技Colossal-AI系統(tǒng),用戶可實(shí)現(xiàn)在本地算力平臺(tái)一鍵訓(xùn)練、微調(diào)、推理、部署大模型,將大模型開(kāi)發(fā)效率提升10倍以上,并將算力效率提升2-3倍,在最大化提升大模型開(kāi)發(fā)效率的同時(shí),降低大模型開(kāi)發(fā)及應(yīng)用的門檻和成本。 Coloss
    的頭像 發(fā)表于 03-01 09:43 ?490次閱讀
    潞晨科技<b class='flag-5'>Colossal-AI</b> + 浪潮信息AIStation,大模型開(kāi)發(fā)效率提升10倍

    KITA2GTC3325VTRBSTOBO1開(kāi)發(fā)板運(yùn)行的是什么系統(tǒng)?

    請(qǐng)告知KITA2GTC3325VTRBSTOBO1 開(kāi)發(fā)板運(yùn)行的是什么系統(tǒng)(RTOS 或·····)?開(kāi)發(fā)板的整個(gè)Demo code從哪里可以得到?
    發(fā)表于 02-01 06:10