0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

東芝硬盤如何優(yōu)化存儲(chǔ)

東芝硬盤 ? 來源:東芝硬盤 ? 2025-04-11 11:17 ? 次閱讀

AI加速的關(guān)鍵杠桿

存儲(chǔ)優(yōu)化

鐵子們誰懂?。∽蛱觳坏?小時(shí)跑完的模型,今天突然變成"樹懶速度"!Tell me why?說起“與時(shí)間賽跑”的數(shù)據(jù),AI工程師妥妥破防,這些場(chǎng)面他們已經(jīng)見怪不怪了……

多任務(wù)并行,變成“搶凳子”游戲

當(dāng)自然語言處理、推薦系統(tǒng)和圖像識(shí)別同時(shí)開跑,每個(gè)任務(wù)的訓(xùn)練速度呈指數(shù)級(jí)下降,大量時(shí)間浪費(fèi)在等待數(shù)據(jù)加載上。像極了早高峰擠地鐵——誰都別想快!

模型迭代,精度與速度孰重?

公司的AI團(tuán)隊(duì)每周模型迭代。隨著數(shù)據(jù)累積到一定程度,模型架構(gòu)也越來越深,每次完整訓(xùn)練超出計(jì)劃時(shí)長(zhǎng)。團(tuán)隊(duì)含淚在精度和速度之間做起了選擇題。

AI訓(xùn)練減速,存儲(chǔ)系統(tǒng)也要擔(dān)責(zé)

訓(xùn)練速度變得越來越慢,成了研發(fā)效率和創(chuàng)新節(jié)奏的絆腳石。導(dǎo)致AI訓(xùn)練速度變慢的原因錯(cuò)綜復(fù)雜,別急著甩鍋給算法,也很可能是存儲(chǔ)系統(tǒng)在偷偷"閑置",例如:

1數(shù)據(jù)洪流與存儲(chǔ)帶寬不匹配

現(xiàn)代AI模型訓(xùn)練常需要處理TB甚至PB級(jí)數(shù)據(jù),GPU餓到啃手指,而存儲(chǔ)系統(tǒng)卻還在用吸管喂數(shù)據(jù),大量昂貴的計(jì)算資源一時(shí)無用武之地。

2隨機(jī)與順序讀取的失衡

AI深度訓(xùn)練時(shí),會(huì)通過數(shù)據(jù)增強(qiáng)和隨機(jī)采樣技術(shù)對(duì)原始數(shù)據(jù)進(jìn)行旋轉(zhuǎn)、裁剪、打亂等操作,來獲得更豐富、更多樣化的訓(xùn)練數(shù)據(jù)!但難點(diǎn)是硬盤得滿場(chǎng)“飛檐走壁”讀數(shù)據(jù),隨機(jī)讀寫和順序讀寫一旦失衡,容易形成存儲(chǔ)訪問瓶頸。

3冷熱數(shù)據(jù)一視同仁

訓(xùn)練過程中,本應(yīng)享受優(yōu)先待遇的熱數(shù)據(jù),結(jié)果和冷數(shù)據(jù)一起排隊(duì);而本該躺平的冷數(shù)據(jù),卻抓出來一起卷,結(jié)果緩存擺爛、分布式訓(xùn)練時(shí)全員卡頓。

存儲(chǔ)優(yōu)化,讓數(shù)據(jù)跑起來!

算力和存儲(chǔ)就像印刷廠的神仙CP,計(jì)算會(huì)像“機(jī)器印刷文字”一樣生成大量token(詞元),而存儲(chǔ)就是“紙張”。AI模型訓(xùn)練,大規(guī)模的算力要求存儲(chǔ)系統(tǒng)提供更高性能的數(shù)據(jù)訪問,就如印刷機(jī)提速了,紙張的質(zhì)量和供應(yīng)速度也要同頻給力。那如何優(yōu)化存儲(chǔ)呢?

1 智能分層:數(shù)據(jù)科學(xué)分管

智能分層存儲(chǔ)系統(tǒng)通過實(shí)時(shí)監(jiān)控?cái)?shù)據(jù)訪問模式,自動(dòng)將頻繁訪問的"熱數(shù)據(jù)"配"超跑",常駐高速存儲(chǔ),將不常訪問的冷數(shù)據(jù)妥善保管,"溫?cái)?shù)據(jù)"存在平衡性能與成本的中間層??娠@著提升緩存命中率,減少等待時(shí)間。

2并行存儲(chǔ):突破帶寬瓶頸

分布式存儲(chǔ)系統(tǒng),通過將數(shù)據(jù)分散在多個(gè)節(jié)點(diǎn)上,實(shí)現(xiàn)了聚合帶寬的線性增長(zhǎng)。把數(shù)據(jù)分散部署,系統(tǒng)統(tǒng)一指揮,團(tuán)隊(duì)?wèi)?zhàn)速!告別"單車道堵車",滿足大規(guī)模分布式訓(xùn)練的需求。

作為分布式存儲(chǔ)系統(tǒng)的其中一部分,HDD硬盤在其中大有作為。東芝MG10系列20TB企業(yè)級(jí)硬盤,采用CMR傳統(tǒng)磁記錄技術(shù),20TB海量存儲(chǔ)空間+7200rpm轉(zhuǎn)速、最大數(shù)據(jù)傳輸速度達(dá)268MiB/s,讓數(shù)據(jù)輸送從"鄉(xiāng)村小路"升級(jí)為"高鐵"!且額定工作負(fù)載高達(dá)550TB/年,平均無故障時(shí)間達(dá)250萬小時(shí),高耐用性適用于寫入密集的訓(xùn)練場(chǎng)景。

By the way,云存儲(chǔ)的彈性優(yōu)勢(shì)也不容忽視,突發(fā)性訓(xùn)練任務(wù),資源秒擴(kuò)容,絕不掉鏈子。結(jié)合本地緩存加速,可構(gòu)建混合云訓(xùn)練環(huán)境,速度省錢它都給!

在AI訓(xùn)練的全棧優(yōu)化中,存儲(chǔ)配置往往能以較小杠桿,撬動(dòng)顯著的加速效果,根據(jù)分析訓(xùn)練任務(wù)的數(shù)據(jù)訪問模式、帶寬需求和延遲敏感度,選擇匹配的存儲(chǔ)架構(gòu),可以給企業(yè)狠狠上大分,充分釋放計(jì)算資源潛力,保持競(jìng)爭(zhēng)優(yōu)勢(shì)!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 東芝
    +關(guān)注

    關(guān)注

    6

    文章

    1437

    瀏覽量

    122399
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4508

    瀏覽量

    87143
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34488

    瀏覽量

    275936

原文標(biāo)題:福利 | 解決AI“龜速”煩惱的性能優(yōu)化秘籍

文章出處:【微信號(hào):Toshiba-Electronics,微信公眾號(hào):東芝硬盤】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    東芝硬盤亮相昱格國(guó)產(chǎn)化生態(tài)大會(huì)

    近日,東芝硬盤受邀參加了由昱格主辦的國(guó)產(chǎn)化生態(tài)大會(huì),與行業(yè)專家、合作伙伴共同探討國(guó)產(chǎn)化生態(tài)發(fā)展的新趨勢(shì)、新機(jī)遇與新挑戰(zhàn) ,共筑數(shù)字化生態(tài)新未來。
    的頭像 發(fā)表于 06-09 18:10 ?469次閱讀

    東芝固態(tài)硬盤解決方案

    數(shù)據(jù)洪流時(shí)代人們對(duì)數(shù)據(jù)存儲(chǔ)的要求越來越高,在要求更快讀取速度和更高存儲(chǔ)容量的同時(shí),對(duì)存儲(chǔ)設(shè)備的便攜性和安全穩(wěn)定等方面也提出了很高的要求。固態(tài)硬盤(SSD,Solid State Dri
    的頭像 發(fā)表于 01-22 18:07 ?721次閱讀
    <b class='flag-5'>東芝</b>固態(tài)<b class='flag-5'>硬盤</b>解決方案

    將電腦硬盤變成云存儲(chǔ),怎么做到把多余電腦硬盤變成云存儲(chǔ)

    要將電腦的額外硬盤配置為云存儲(chǔ),你可以利用多種方法來實(shí)現(xiàn)本地?cái)?shù)據(jù)的云端同步、訪問和共享。這種做法可以將本地硬盤變成云存儲(chǔ)的一部分,方便你在不同設(shè)備之間共享和訪問文件。下面將介紹如何使用
    的頭像 發(fā)表于 01-06 13:09 ?1116次閱讀
    將電腦<b class='flag-5'>硬盤</b>變成云<b class='flag-5'>存儲(chǔ)</b>,怎么做到把多余電腦<b class='flag-5'>硬盤</b>變成云<b class='flag-5'>存儲(chǔ)</b>

    SATA硬盤的性能優(yōu)化技巧

    優(yōu)化SATA硬盤性能的技巧,可以幫助您提高存儲(chǔ)設(shè)備的效率和響應(yīng)速度。 1. 保持硬盤健康 定期檢查硬盤健康狀態(tài) :使用
    的頭像 發(fā)表于 12-19 14:41 ?1465次閱讀

    SATA硬盤與NVMe硬盤的比較

    隨著存儲(chǔ)技術(shù)的發(fā)展,硬盤驅(qū)動(dòng)器(HDD)和固態(tài)硬盤(SSD)已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠?。SATA硬盤和NVMe硬盤作為兩種主要的
    的頭像 發(fā)表于 12-19 14:40 ?3885次閱讀

    SATA硬盤與SSD的區(qū)別 SATA硬盤的讀寫速度分析

    SATA硬盤與SSD的區(qū)別 1. 存儲(chǔ)介質(zhì) SATA硬盤 :通常指的是機(jī)械硬盤(HDD),使用磁碟和讀寫頭來存儲(chǔ)數(shù)據(jù)。數(shù)據(jù)
    的頭像 發(fā)表于 12-19 14:35 ?3858次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—多塊硬盤離線導(dǎo)致EVA存儲(chǔ)崩潰的數(shù)據(jù)恢復(fù)案例

    一臺(tái)HP EVA存儲(chǔ)中有23塊硬盤,掛接到一臺(tái)windows server操作系統(tǒng)的服務(wù)器。 EVA存儲(chǔ)上有三個(gè)硬盤指示燈亮黃燈,此刻存儲(chǔ)
    的頭像 發(fā)表于 12-03 13:32 ?449次閱讀
    服務(wù)器數(shù)據(jù)恢復(fù)—多塊<b class='flag-5'>硬盤</b>離線導(dǎo)致EVA<b class='flag-5'>存儲(chǔ)</b>崩潰的數(shù)據(jù)恢復(fù)案例

    如何優(yōu)化ipc監(jiān)控系統(tǒng)的存儲(chǔ)方案

    合適的存儲(chǔ)介質(zhì)是優(yōu)化IPC監(jiān)控系統(tǒng)存儲(chǔ)方案的第一步。當(dāng)前市場(chǎng)上主要有三種類型的存儲(chǔ)介質(zhì):硬盤驅(qū)動(dòng)器(HDD)、固態(tài)驅(qū)動(dòng)器(SSD)和混合
    的頭像 發(fā)表于 11-15 14:24 ?673次閱讀

    什么是大硬盤存儲(chǔ)能力強(qiáng)的服務(wù)器?

    硬盤存儲(chǔ)能力強(qiáng)的服務(wù)器通常指的是那些能夠支持大量硬盤存儲(chǔ)空間的服務(wù)器,它們能夠提供巨大的數(shù)據(jù)存儲(chǔ)容量和較高的數(shù)據(jù)讀寫速度。以下是一些技術(shù)參數(shù)和特點(diǎn): 1、硬盤數(shù)量和類型:大
    的頭像 發(fā)表于 11-11 12:24 ?678次閱讀

    東芝PC級(jí)機(jī)械硬盤助力新聞工作者有效存儲(chǔ)數(shù)據(jù)

    東芝PC級(jí)機(jī)械硬盤提供非常廣泛的行業(yè)標(biāo)準(zhǔn)磁盤存儲(chǔ)容量,能幫助新聞工作者有效存儲(chǔ)數(shù)據(jù),提升工作效率。其中DT02 7200rpm 2TB內(nèi)置盤,2TB
    的頭像 發(fā)表于 11-07 09:18 ?642次閱讀

    如何優(yōu)化emc存儲(chǔ)性能

    在當(dāng)今的數(shù)據(jù)中心環(huán)境中,存儲(chǔ)性能對(duì)于業(yè)務(wù)連續(xù)性和數(shù)據(jù)訪問速度至關(guān)重要。EMC作為領(lǐng)先的存儲(chǔ)解決方案提供商,其產(chǎn)品線涵蓋了從入門級(jí)到企業(yè)級(jí)的存儲(chǔ)系統(tǒng)。然而,即使是最好的存儲(chǔ)系統(tǒng)也需要定期
    的頭像 發(fā)表于 11-01 15:57 ?903次閱讀

    關(guān)于對(duì)象存儲(chǔ)和云硬盤區(qū)別,你了解多少?

    對(duì)象存儲(chǔ)和云硬盤是兩種不同的云存儲(chǔ)解決方案。對(duì)象存儲(chǔ)適合處理大規(guī)模非結(jié)構(gòu)化數(shù)據(jù),通過WebAPI接口訪問,具有高擴(kuò)展性和高可用性,適用于數(shù)據(jù)歸檔、備份和大數(shù)據(jù)分析等場(chǎng)景。云
    的頭像 發(fā)表于 11-01 10:57 ?470次閱讀

    東芝推出新一代Mx11系列機(jī)械硬盤

    東芝近日震撼發(fā)布新一代Mx11系列機(jī)械硬盤,專為超大規(guī)模企業(yè)和數(shù)據(jù)中心量身打造,再次引領(lǐng)存儲(chǔ)技術(shù)潮流。該系列亮點(diǎn)紛呈,包括采用CMR傳統(tǒng)磁記錄技術(shù)的MG11系列,其最大容量高達(dá)24TB,穩(wěn)定可靠
    的頭像 發(fā)表于 09-12 17:10 ?845次閱讀

    東芝推出MG10-D系列企業(yè)級(jí)硬盤

    東芝電子元件及存儲(chǔ)裝置株式會(huì)社(東芝)宣布推出MG10-D系列企業(yè)級(jí)硬盤。該產(chǎn)品是傳統(tǒng)磁記錄 (CMR) 空氣硬盤家族成員,支持SAS和SA
    的頭像 發(fā)表于 08-30 10:11 ?924次閱讀
    <b class='flag-5'>東芝</b>推出MG10-D系列企業(yè)級(jí)<b class='flag-5'>硬盤</b>

    SSD硬盤和SATA硬盤有什么區(qū)別

    SSD(Solid State Disk或Solid State Drive),即固態(tài)硬盤,是一種采用固態(tài)電子存儲(chǔ)芯片陣列而制成的硬盤。與傳統(tǒng)的機(jī)械硬盤(HDD)相比,SSD在讀寫速度
    的頭像 發(fā)表于 08-13 14:38 ?5428次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品