0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

AI大模型駛向產(chǎn)業(yè)之海,需要高質數(shù)據(jù)“河道”引航

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2023-12-02 09:45 ? 次閱讀

“我們的AI大模型,在萬卡集群上訓練,三小時就出一次錯。別笑,這已經(jīng)是世界先進水平了。”某次行業(yè)峰會上,一位清華大學的院士科學家,講出了AI大模型訓練的“大實話”。

風靡全球的AI大模型,是今年毋庸置疑的風口,數(shù)量不斷增長,達到了驚人的水平?!鞍亵礌幜鳌敝拢蠹覅s經(jīng)常會忽略一個關鍵問題:AI大模型帶來的數(shù)據(jù)激流,也比想象中更加洶涌。

“三小時出錯一次”,聽起來不可思議的故障率,卻是大模型從業(yè)者要面對的常態(tài),甚至是“優(yōu)等生”。目前業(yè)界的普遍做法,是寫容錯檢查點checkpoint。既然三小時就報錯,那就2.5小時停一次,寫好檢查點,把數(shù)據(jù)存起來,再開始訓練。一旦出現(xiàn)故障,可以從寫好的檢查點恢復,避免“從頭開始”、全部白干。而檢查點需要存儲的數(shù)據(jù)多,會耗費大量的時間。該院士團隊基于llama 2架構研發(fā)的大模型,數(shù)據(jù)存一次硬件,就需要十個小時,存儲效率直接影響了開發(fā)進度。

如果說大規(guī)模的異構數(shù)據(jù),是肆意奔涌的激流,存儲系統(tǒng)就是承載著數(shù)據(jù)流量的河道,其寬闊堅固程度直接決定了數(shù)據(jù)是否會淤塞甚至停滯,從而卡住AI大模型的生命線??梢哉f,整個大模型行業(yè)的生產(chǎn)力和效率,都被存儲規(guī)定了“上限”。

這也是為什么,存儲作為AI數(shù)據(jù)基礎設施,受到越來越多關注。

11月29日,“數(shù)智創(chuàng)新 AI未來”2023中國數(shù)據(jù)與存儲峰會在北京舉辦。曙光存儲發(fā)布了面向AI大模型的存儲解決方案。

借此機會,我們一起了解一下,AI大模型浪潮來襲,給存儲帶來的承載挑戰(zhàn),以及曙光存儲是如何為智能產(chǎn)業(yè)引航,助推AI大模型百舸揚帆。

AI大模型駛入產(chǎn)業(yè)深水區(qū),傳統(tǒng)存儲的數(shù)據(jù)之殤

最近我去了一趟云南,發(fā)現(xiàn)不僅北上廣等科技重地的大模型建設如火如荼,在昆明、大理等二三線城市,甚至邊疆地區(qū),都在積極地探索大模型行業(yè)應用。

各行各業(yè)走向智能化,幾乎都點燃了對大模型的熾熱興趣。這時候,一個關鍵問題也顯露了出來:AI大模型的產(chǎn)業(yè)化風潮,需要升級存儲基礎設施。

模型開發(fā)者的每一次訓練,數(shù)據(jù)都在向存儲系統(tǒng)發(fā)起多種挑戰(zhàn):

  1. 數(shù)據(jù)洪潮的沖擊。隨著大模型的產(chǎn)業(yè)落地,許多行業(yè)都開始訓練專屬模型,大量行業(yè)數(shù)據(jù)、專有數(shù)據(jù)、新的標注數(shù)據(jù)被輸送給大模型,澎湃的數(shù)據(jù)數(shù)量對存儲系統(tǒng)提出了挑戰(zhàn)。云南某數(shù)據(jù)科技公司提到,行業(yè)大模型要用高質量的數(shù)據(jù)集、文檔、客戶私有數(shù)據(jù)進行訓練,每個項目都是單獨成立標注組,數(shù)據(jù)規(guī)模持續(xù)增大,存儲訴求和成本也隨之增加。

2.數(shù)據(jù)淤塞的桎梏。超大規(guī)模數(shù)據(jù)預處理的速度慢、耗時長,采集、歸類、搬遷等過程費時費力,一旦存儲性能跟不上,海量文件吞吐慢、多讀少寫,檢查點Checkpoint等待耗時久,會延緩開發(fā)進度,增加開發(fā)成本。

3.數(shù)據(jù)復雜的暗涌。此外,AI大模型要用到大量異構數(shù)據(jù),文件格式復雜、數(shù)據(jù)集類型多樣,數(shù)據(jù)數(shù)量激增,傳統(tǒng)存儲難以應對數(shù)據(jù)復雜性的挑戰(zhàn),容易產(chǎn)生消化不良的問題,造成數(shù)據(jù)訪問效率低,從而造成模型運行效率下降,訓練算力消耗增多,無法充分“壓榨”昂貴的GPU算力資源。比如云南當?shù)氐奶栍^測站,通過讓AI科學計算模型學習海量圖片,呈現(xiàn)太陽真實的樣子,每天產(chǎn)生2TB的圖片數(shù)據(jù),當前存儲的吞吐效率低,會導致訓練集加載慢、數(shù)據(jù)處理周期長,拖慢研究進程。

4. 數(shù)據(jù)安全的隱憂。目前,AI大模型已經(jīng)深度滲透各行業(yè)之中,在訓練開發(fā)及應用落地過程中需要海量的數(shù)據(jù)支撐,其中包含行業(yè)或個人敏感信息的數(shù)據(jù),如果沒有合理的數(shù)據(jù)脫敏和數(shù)據(jù)托管機制,則可能造成數(shù)據(jù)泄露,給行業(yè)和個人造成損失。同時,模型安全風險也需重視,比如,插件可能被植入有害內(nèi)容,成為不法分子欺詐和“投毒”的工具,危及社會和產(chǎn)業(yè)安全。

AI大模型駛向產(chǎn)業(yè)深水區(qū),欣喜的是,這一技術創(chuàng)新正在高度融入千行萬業(yè),滿足智能化需求,生命力旺盛。擔憂的是,數(shù)據(jù)工程貫穿大模型的全生命周期,從收集、清理、訓練、推理部署、反饋調優(yōu)等各個階段,都需要用到大量數(shù)據(jù)。存儲成為瓶頸,意味著AI大模型的各個階段都需要消耗在大量的數(shù)據(jù)淤塞、故障、低效之中,這會讓大模型的開發(fā)周期與綜合成本極高,是產(chǎn)業(yè)所無法承受的。

疏浚存儲“河道”,避免數(shù)據(jù)淤塞,為大模型的產(chǎn)業(yè)揚帆提供支持和滋養(yǎng),曙光存儲帶來的新解決方案,讓我們發(fā)現(xiàn)了有價值的參考案例。

高質數(shù)據(jù)“航道”,曙光存儲給大模型行業(yè)一個答案

經(jīng)過與AI大模型開發(fā)者的交流,我得出了一個清晰的結論:構建一個適配AI大模型的全新存儲體系,已經(jīng)不再是需要討論的問題,關鍵是誰能率先完成方案升級、給出實用解法。

洞察行業(yè)的存力需求,曙光存儲打造了以ParaStor大模型專用存儲為底座的AI大模型存儲解決方案,寫下了自己的答案。

wKgaomVpzi2ALfoSAAA-uGs64so096.jpg

曙光存儲AI大模型存儲集群,擁有異構融合、極致性能與原生安全三大領先能力。

首先,可提供千億級文件存儲服務,接近無限擴展規(guī)模。針對數(shù)據(jù)訪問協(xié)議多樣性問題,同時支持文件、對象等多種存儲協(xié)議,避免數(shù)據(jù)跨存儲系統(tǒng)復制。

其次,針對AI大模型開發(fā)過程中對數(shù)據(jù)處理效率的高需求,曙光存儲AI大模型存儲集群可提供多級緩存加速、XDS數(shù)據(jù)加速及智能高速選路等多種數(shù)據(jù)IO性能優(yōu)化能力。

最后,為保障全流程數(shù)據(jù)安全,曙光存儲節(jié)點還提供芯片級安全能力,并支持國密指令集,通過多級可靠性,保障存儲集群在訓練開發(fā)全周期內(nèi)穩(wěn)定運行,符合政策和未來安全趨勢。

有人可能會問了,市面上的存儲方案這么多,有的也宣傳為模型開發(fā)提供專業(yè)支持。曙光存儲的方案有哪些差異化價值?

如果對各家的技術名詞和產(chǎn)品細節(jié)云里霧里,大家不妨用幾個詞,記住曙光存儲AI大模型存儲集群的差異化價值:

1.先進。異構融合,極致性能,芯片級原生安全,展現(xiàn)了曙光存儲的技術先進性,也針對性地解決了大模型開發(fā)的數(shù)據(jù)量大、數(shù)據(jù)形態(tài)復雜多樣、吞吐效率低、存算時間長等實實在在的痛點。

2.可靠。高性能AI數(shù)據(jù)基礎設施基于曙光存儲的自研創(chuàng)新,更加可靠安全,符合信創(chuàng)政策和未來安全趨勢,可以幫助國內(nèi)大模型服務商規(guī)避海外供應鏈風險,從供應鏈安全、數(shù)據(jù)安全、模型安全等多個角度,為大模型產(chǎn)業(yè)的發(fā)展護航。

3.全面。曙光存儲打造了涵蓋從網(wǎng)絡、計算到平臺的全維度AI解決方案,支持訓練開發(fā)全周期內(nèi)穩(wěn)定運行,可以降低綜合成本,讓大模型開發(fā)者和行業(yè)客戶無憂前行。

總結一下,在曙光存儲構建的高質“航道”上,大規(guī)模數(shù)據(jù)高效吞吐,AI大模型加速開發(fā),因此,行業(yè)和企業(yè)可以快人一步,將大模型與垂直場景和業(yè)務深度融合,率先獲得通往智能時代的船票。

第五范式的新起點,看百舸爭流、萬業(yè)揚帆

圖靈獎獲得者吉姆·格雷(Jim Gray),曾提出第四范式,核心是數(shù)據(jù)驅動。而隨著大語言模型“智能涌現(xiàn)”,“智能驅動”的第五范式,更側重于數(shù)據(jù)和智能的有機結合,成為支撐科學革命、產(chǎn)業(yè)革命的新底層邏輯。

所有過往,皆是序章。AI如此,存儲亦如此。

wKgaomVpzjCARjbYAACDq_AucC8558.jpg

此次大會上,憑借20年行業(yè)深耕,與在AI存儲技術突破、液冷存儲研發(fā)等領域的領先實踐,曙光存儲公司總裁惠潤海獲評“存儲先鋒”。在其領導下,多年來曙光分布式文件存儲在市場中持續(xù)領跑,市場份額名列前茅。面向AI大模型的數(shù)據(jù)存儲解決方案,讓曙光存儲又一次站到了時代前沿。

曙光存儲的AI大模型存儲集群,正是積極踐行范式轉換,對應數(shù)據(jù)新范式,用數(shù)據(jù)基礎設施的飛躍,助推大模型產(chǎn)業(yè)化的漲潮。

接下來,在存儲行業(yè)的新范式、新起點,在曙光存儲的高質數(shù)據(jù)“河道”上,我們會看到,行業(yè)大模型百舸爭流,AI應用千帆競渡,加速駛向智能中國。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4337

    瀏覽量

    85984
  • AI
    AI
    +關注

    關注

    87

    文章

    31225

    瀏覽量

    269579
  • 曙光
    +關注

    關注

    0

    文章

    183

    瀏覽量

    13546
  • 大模型
    +關注

    關注

    2

    文章

    2499

    瀏覽量

    2909
  • AI大模型
    +關注

    關注

    0

    文章

    318

    瀏覽量

    328
收藏 人收藏

    評論

    相關推薦

    AI基礎數(shù)據(jù)服務是AI產(chǎn)業(yè)的關鍵支撐

    更深、更寬的網(wǎng)絡結構,訓練更強大的模型,并加速模型的推理速度;數(shù)據(jù)模型學習和適應不同任務的基石高質量的
    的頭像 發(fā)表于 12-13 15:45 ?260次閱讀
    <b class='flag-5'>AI</b>基礎<b class='flag-5'>數(shù)據(jù)</b>服務是<b class='flag-5'>AI</b><b class='flag-5'>產(chǎn)業(yè)</b>的關鍵支撐

    標貝科技:AI基礎數(shù)據(jù)服務,人工智能行業(yè)發(fā)展的底層支撐

    隨著不同大模型在語言理解及生成等領域的出色表現(xiàn),大模型別后的規(guī)模規(guī)律不斷強化數(shù)據(jù)在要提升AI性能上的關鍵作用,AI
    的頭像 發(fā)表于 11-14 18:32 ?285次閱讀
    標貝科技:<b class='flag-5'>AI</b>基礎<b class='flag-5'>數(shù)據(jù)</b>服務,人工智能行業(yè)發(fā)展的底層支撐

    AI模型的訓練數(shù)據(jù)來源分析

    AI模型的訓練數(shù)據(jù)來源廣泛且多元化,這些數(shù)據(jù)源對于構建和優(yōu)化AI模型至關重要。以下是對
    的頭像 發(fā)表于 10-23 15:32 ?829次閱讀

    使用AI模型進行數(shù)據(jù)分析的技巧

    以及后續(xù)的分析步驟。 確定需要分析的數(shù)據(jù)類型、規(guī)模和復雜度,以便選擇合適的AI模型。 二、高質量數(shù)據(jù)收集與處理
    的頭像 發(fā)表于 10-23 15:14 ?943次閱讀

    AI模型在面對數(shù)據(jù)壁壘時的困境

    8月1日,根據(jù)各大媒體的廣泛報道,當前全球互聯(lián)網(wǎng)已經(jīng)陷入了優(yōu)質數(shù)據(jù)資源的嚴重匱乏,人工智能(AI)領域也正在面臨嚴峻的“數(shù)據(jù)墻”難題。對專注于研發(fā)大型AI
    的頭像 發(fā)表于 08-01 15:20 ?499次閱讀

    ai模型ai框架的關系是什么

    數(shù)據(jù)和計算資源來進行訓練。AI模型的主要特點包括: 1.1 參數(shù)數(shù)量大:AI模型的參數(shù)數(shù)量通常在數(shù)百萬到數(shù)十億之間,這使得它們能夠捕捉
    的頭像 發(fā)表于 07-16 10:07 ?4.1w次閱讀

    ai模型和傳統(tǒng)ai的區(qū)別在哪?

    AI模型和傳統(tǒng)AI的區(qū)別主要體現(xiàn)在以下幾個方面: 數(shù)據(jù)量和訓練規(guī)模 AI模型通常
    的頭像 發(fā)表于 07-16 10:06 ?1462次閱讀

    河道水面漂浮物識別檢測 YOLO算法

    河道水面漂浮物識別檢測根據(jù)監(jiān)控攝像頭搜集江河或河道的水面視頻,截取圖片中帶有海上漂浮物的照片,河道水面漂浮物識別檢測訓練所需照片,形成數(shù)據(jù)實體模型
    的頭像 發(fā)表于 07-02 11:37 ?535次閱讀
    <b class='flag-5'>河道</b>水面漂浮物識別檢測 YOLO算法

    鴻蒙元服務,軟件開發(fā)者駛向的一葉飛舟

    鴻蒙元服務作舟,AI分發(fā)為帆:軟件開發(fā)者駛向流量藍
    的頭像 發(fā)表于 06-26 09:39 ?1565次閱讀
    鴻蒙元服務,軟件開發(fā)者<b class='flag-5'>駛向</b>藍<b class='flag-5'>海</b>的一葉飛舟

    澳鵬入選億歐大模型基礎層圖譜,以優(yōu)質數(shù)據(jù)賦能AGI智能涌現(xiàn)

    近日發(fā)布《2024中國"百模大戰(zhàn)"競爭格局分析報告》,全方位呈現(xiàn)大模型產(chǎn)業(yè)現(xiàn)狀。作為產(chǎn)業(yè)鏈上的重要一環(huán),澳鵬Appen憑借高質量的大模型
    的頭像 發(fā)表于 05-27 17:01 ?380次閱讀
    澳鵬入選億歐大<b class='flag-5'>模型</b>基礎層圖譜,以優(yōu)<b class='flag-5'>質數(shù)據(jù)</b>賦能AGI智能涌現(xiàn)

    中國少年,從一場軟件競技賽駛向產(chǎn)業(yè)

    中國軟件黃金十年的新航路,少年們用云與AI模型開啟
    的頭像 發(fā)表于 04-30 16:41 ?549次閱讀
    中國少年,從一場軟件競技賽<b class='flag-5'>駛向</b><b class='flag-5'>產(chǎn)業(yè)</b><b class='flag-5'>之</b><b class='flag-5'>海</b>

    2024中國AI模型產(chǎn)業(yè)發(fā)展報告

    日前,人民網(wǎng)財經(jīng)研究院、至頂科技聯(lián)合發(fā)布《開啟智能新時代:2024年中國AI模型產(chǎn)業(yè)發(fā)展報告》(以下簡稱《報告》),對于AI模型
    的頭像 發(fā)表于 03-30 08:26 ?824次閱讀
    2024中國<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b><b class='flag-5'>產(chǎn)業(yè)</b>發(fā)展報告

    AI模型將如何推動中國產(chǎn)業(yè)升級?華為盤古大模型深耕千行萬業(yè)

    AI模型將如何推動中國產(chǎn)業(yè)升級?日前,華為混合云副總裁胡玉在做客央視網(wǎng)《中國神氣局》時,暢談AI
    的頭像 發(fā)表于 03-22 10:40 ?613次閱讀

    防止AI模型被黑客病毒入侵控制(原創(chuàng))聆思大模型AI開發(fā)套件評測4

    模型并為其提供了輸入數(shù)據(jù)。最后,我運行了模型的推理,并輸出了預測結果。此外,還需要考慮其他因素,如模型的優(yōu)化器、損失函數(shù)和評估指標等。 為
    發(fā)表于 03-19 11:18

    北斗芯片產(chǎn)業(yè)高質量發(fā)展之路

    導航定位協(xié)會副會長、深圳華大北斗科技股份有限公司董事長兼總經(jīng)理孫中亮認為:北斗芯片產(chǎn)業(yè)作為科技自立自強的排頭兵更是北斗產(chǎn)業(yè)發(fā)展的底座,同樣需要高質量發(fā)展,同樣需要走以科技創(chuàng)新為驅動力,
    的頭像 發(fā)表于 03-15 14:03 ?416次閱讀
    北斗芯片<b class='flag-5'>產(chǎn)業(yè)</b>的<b class='flag-5'>高質</b>量發(fā)展之路