0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

當(dāng)機(jī)器學(xué)習(xí)遇上SSD,會(huì)擦出怎樣的火花呢?

VIBT_dputech ? 來源:大普微 ? 2020-09-07 16:12 ? 次閱讀

近年來人工智能和大數(shù)據(jù)的迅速發(fā)展正在深刻改變著這個(gè)世界和我們的生活方式。人工智能的核心是機(jī)器學(xué)習(xí)(Machine Learning) 算法,自 2006 年以來,在機(jī)器學(xué)習(xí)領(lǐng)域,以深度學(xué)習(xí)(Deep Lerning) 為代表的機(jī)器學(xué)習(xí)算法取得了突破性的進(jìn)展,在2017年AlphaGo大戰(zhàn)圍棋冠軍李世石后這一技術(shù)加速走向市場(chǎng)、落地應(yīng)用。而SSD作為大數(shù)據(jù)的一種存儲(chǔ)介質(zhì),正在取代HDD成為主流的存儲(chǔ)設(shè)備。那么當(dāng)機(jī)器學(xué)習(xí)遇上SSD,會(huì)擦出怎樣的火花呢?

一、什么是機(jī)器學(xué)習(xí)?

·機(jī)器學(xué)習(xí)是讓計(jì)算機(jī)具有學(xué)習(xí)的能力,無需進(jìn)行明確編程。—— 亞瑟·薩繆爾,1959

·計(jì)算機(jī)程序利用經(jīng)驗(yàn) E 學(xué)習(xí)任務(wù) T,性能是 P,如果針對(duì)任務(wù) T 的性能 P 隨著經(jīng)驗(yàn) E 不斷增長(zhǎng),則稱為機(jī)器學(xué)習(xí)。—— 湯姆·米切爾,1997

機(jī)器學(xué)習(xí)是一類算法的總稱,這些算法從大量歷史數(shù)據(jù)中挖掘出其中隱含的規(guī)律,并用于預(yù)測(cè)或者分類,更具體的說,機(jī)器學(xué)習(xí)可以看作是尋找一個(gè)函數(shù),輸入是樣本數(shù)據(jù),輸出是期望的結(jié)果,只是這個(gè)函數(shù)過于復(fù)雜,以至于不太方便形式化表達(dá)。需要注意的是,機(jī)器學(xué)習(xí)的目標(biāo)是使學(xué)到的函數(shù)很好地適用于“新樣本”,而不僅僅是在訓(xùn)練樣本上表現(xiàn)很好。學(xué)到的函數(shù)適用于新樣本的能力,稱為泛化(Generalization)能力。

二、機(jī)器學(xué)習(xí)步驟

通常學(xué)習(xí)一個(gè)好的函數(shù),分為以下三步:

1、選擇一個(gè)合適的模型,這通常需要依據(jù)實(shí)際問題而定,針對(duì)不同的問題和任務(wù)需要選取恰當(dāng)?shù)哪P?,模型就是一組函數(shù)的集合。

2、判斷一個(gè)函數(shù)的好壞,這需要確定一個(gè)衡量標(biāo)準(zhǔn),也就是我們通常說的損失函數(shù)(Loss Function),損失函數(shù)的確定也需要依據(jù)具體問題而定,如回歸問題一般采用歐式距離,分類問題一般采用交叉熵代價(jià)函數(shù)。

3、找出“最好”的函數(shù),如何從眾多函數(shù)中最快的找出“最好”的那一個(gè),這一步是最大的難點(diǎn),做到又快又準(zhǔn)往往不是一件容易的事情。常用的方法有梯度下降算法,最小二乘法等和其他一些技巧(tricks)。

學(xué)習(xí)得到“最好”的函數(shù)后,需要在新樣本上進(jìn)行測(cè)試,只有在新樣本上表現(xiàn)很好,才算是一個(gè)“好”的函數(shù)。

三、機(jī)器學(xué)習(xí)的類型

機(jī)器學(xué)習(xí)主要有三種基本類型:監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。

1監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)是使用已知正確答案的示例來訓(xùn)練模型。已知數(shù)據(jù)和其一一對(duì)應(yīng)的標(biāo)簽,訓(xùn)練一個(gè)智能算法,將輸入數(shù)據(jù)映射到標(biāo)簽的過程,它的常見應(yīng)用場(chǎng)景如分類問題和回歸問題。常見的算法有K近鄰算法、線性回歸、邏輯回歸、支持向量機(jī)(SVM)、決策樹和隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)

分類

在分類中,機(jī)器被訓(xùn)練成將一個(gè)組劃分為特定的類。分類的一個(gè)簡(jiǎn)單例子是電子郵件帳戶上的垃圾郵件過濾器。過濾器分析你以前標(biāo)記為垃圾郵件的電子郵件,并將它們與新郵件進(jìn)行比較。如果它們匹配一定的百分比,這些新郵件將被標(biāo)記為垃圾郵件并發(fā)送到適當(dāng)?shù)奈募A。那些比較不相似的電子郵件被歸類為正常郵件并發(fā)送到你的郵箱。

也許你會(huì)問這個(gè)分類算法對(duì)于SSD有什么用呢?SSD中的一個(gè)典型的分類問題是IO模式識(shí)別,判斷IO是純讀、純寫或者混合讀寫的,這是一個(gè)三分類的問題;判斷IO是順序的還是隨機(jī)的,這是一個(gè)二分類的問題??梢愿鶕?jù)實(shí)際情況選擇相應(yīng)的相應(yīng)的機(jī)器學(xué)習(xí)分類算法識(shí)別出不同的IO模式,然后針對(duì)不同的模式FTL就可采取不同策略,進(jìn)而提升SSD的性能。

回歸

回歸問題通常是用來預(yù)測(cè)一個(gè)值,它的預(yù)測(cè)結(jié)果是連續(xù)的,如預(yù)測(cè)房?jī)r(jià)、未來的天氣情況等,例如一個(gè)產(chǎn)品的實(shí)際價(jià)格為500元,通過回歸分析預(yù)測(cè)值為499元,我們認(rèn)為這是一個(gè)比較好的回歸分析。

回歸算法在SSD中能用在什么地方呢?回歸算法在SSD的一個(gè)應(yīng)用是IO強(qiáng)度預(yù)測(cè),在一定模式下IO強(qiáng)度在時(shí)序上是有一定規(guī)律的,可以根據(jù)前一段時(shí)間的IO強(qiáng)度預(yù)測(cè)下一段時(shí)間的IO強(qiáng)度,Smart-IO技術(shù)采用長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)LSTM對(duì)IO強(qiáng)度進(jìn)行預(yù)測(cè)。提前預(yù)測(cè)出IO強(qiáng)度后就可優(yōu)化FTL策略、合理分配GC占用資源、合理調(diào)度、提高數(shù)據(jù)命中率等,進(jìn)而提升SSD性能。

2非監(jiān)督學(xué)習(xí)

在無監(jiān)督學(xué)習(xí)中,數(shù)據(jù)是無標(biāo)簽的。學(xué)習(xí)模型是為了推斷出數(shù)據(jù)的一些內(nèi)在結(jié)構(gòu)。無監(jiān)督學(xué)習(xí)主要分為聚類和降維。

聚類用于根據(jù)屬性和行為對(duì)象進(jìn)行分組。這與分類不同,因?yàn)檫@些組不是你提供的。聚類的一個(gè)例子是將一個(gè)組劃分成不同的子組(例如,基于年齡和婚姻狀況),然后應(yīng)用到有針對(duì)性的營(yíng)銷方案中。大多數(shù)大數(shù)據(jù)可視化使用降維來識(shí)別趨勢(shì)和規(guī)則。主要算法: K-means、層次聚類分析(HCA)、DBSCAN

高維數(shù)據(jù)中很容易出現(xiàn)樣本稀疏、距離計(jì)算困難等問題,即“維度災(zāi)難”,為了緩解維度災(zāi)難,常用的就是降維。降維的主要方法有主成分分析(PCA)、線性判別分析(LDA)、局部線性嵌入(LLE)。如圖所示,通過PCA的方法可以把一個(gè)三位的數(shù)據(jù)降維成一個(gè)二維數(shù)據(jù)。

無監(jiān)督學(xué)習(xí)由于沒有標(biāo)簽,相比監(jiān)督學(xué)習(xí)來說相當(dāng)于少了一些輸入信息,實(shí)際應(yīng)用中相對(duì)監(jiān)督學(xué)習(xí)學(xué)習(xí)會(huì)困難一些,那么在SSD是否就無用武之地了呢?非也非也。Smart-IO數(shù)據(jù)分組技術(shù)用K-means算法對(duì)IO進(jìn)行冷熱數(shù)據(jù)分組,然后把不同組的數(shù)據(jù)寫到不同的block或者die上,那么就可以減小,可減小WA,延長(zhǎng)SSD使用壽命。

3強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)算法的思路非常簡(jiǎn)單,以游戲?yàn)槔绻谟螒蛑胁扇∧撤N策略可以取得較高的得分,那么就進(jìn)一步「強(qiáng)化」這種策略,以期繼續(xù)取得較好的結(jié)果。這種策略與日常生活中的各種「績(jī)效獎(jiǎng)勵(lì)」非常類似。我們平時(shí)也常常用這樣的策略來提高自己的游戲水平。AlphaGo下圍棋也是這個(gè)原理,只告訴機(jī)器圍棋的基本規(guī)則,但是不告訴它人類摸索了上千年才總結(jié)出來的定式等圍棋戰(zhàn)術(shù),讓機(jī)器完全依靠自學(xué),打敗人類。

強(qiáng)化學(xué)習(xí)感覺和SSD很難沾上邊,不過熟悉SSD(固態(tài)硬盤)的人都知道,垃圾回收(GC,Garbage Collection)是SSD固件設(shè)計(jì)中的重要一環(huán),也是影響SSD主控性能的重要因素。一般的GC機(jī)制都是只根據(jù)當(dāng)前硬盤空閑空間狀態(tài)來做GC的:當(dāng)有空閑空間的時(shí),不啟動(dòng)GC;反之,當(dāng)沒有空閑空間的情況下,執(zhí)行GC任務(wù)。這種策略的缺點(diǎn)是如果在用戶操作的時(shí)候進(jìn)行GC會(huì)造成SSD性能明顯下降,可以在主控空閑時(shí)提前進(jìn)行GC,但是GC過于頻繁會(huì)造成WA寫放大過大,所以需要一個(gè)平衡,需要一種算法來自動(dòng)確定何時(shí)GC,強(qiáng)化學(xué)習(xí)正好可以排上用場(chǎng),給定一定的衡量標(biāo)準(zhǔn),然后讓機(jī)器通過強(qiáng)化學(xué)習(xí)的方法訓(xùn)練來自動(dòng)學(xué)習(xí)GC的時(shí)機(jī),得到更優(yōu)的GC的策略。

四、DapuStor機(jī)器學(xué)習(xí)技術(shù)

DapuStor已基于SSD開發(fā)出Smart-IO Data Grouping和Smart-IO Intensities Prediction等先進(jìn)技術(shù),把機(jī)器學(xué)習(xí)的先進(jìn)算法用到了SSD中,提升了SSD的產(chǎn)品性能。同時(shí)自研的帶有計(jì)算和智能的數(shù)據(jù)存儲(chǔ)處理器芯片(簡(jiǎn)稱DPU),可以在芯片層面實(shí)現(xiàn)更多的智能功能和硬件加速,實(shí)現(xiàn)存算一體,滿足高端存儲(chǔ)和邊緣計(jì)算市場(chǎng)的需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    2863

    瀏覽量

    117495
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47372

    瀏覽量

    238857
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8423

    瀏覽量

    132744

原文標(biāo)題:當(dāng)機(jī)器學(xué)習(xí)遇上SSD

文章出處:【微信號(hào):dputech,微信公眾號(hào):DapuStor】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    MVTRF:多視圖特征預(yù)測(cè)SSD故障

    固態(tài)硬盤( Solid State Drive,SSD )在大型數(shù)據(jù)中心中發(fā)揮著重要作用。SSD故障會(huì)影響存儲(chǔ)系統(tǒng)的穩(wěn)定性,造成額外的維護(hù)開銷。為了提前預(yù)測(cè)和處理SSD故障,本文提出了
    的頭像 發(fā)表于 12-30 11:04 ?150次閱讀
    MVTRF:多視圖特征預(yù)測(cè)<b class='flag-5'>SSD</b>故障

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章中,我們介紹了機(jī)器學(xué)習(xí)的關(guān)鍵概念術(shù)語。在本文中,我們會(huì)介紹傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)和多種算法特征,供各位老師選擇。 01 傳統(tǒng)
    的頭像 發(fā)表于 12-30 09:16 ?226次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    快來“一起鴻蒙吧”!體驗(yàn)更出色,智慧再升級(jí)

    當(dāng)鴻蒙遇上脫口秀,會(huì)擦出什么樣的火花?“一起鴻蒙吧”給出了答案。華為邀請(qǐng)了呼蘭、賈耗、漫才兄弟、龐博、小鹿等藝人,用脫口秀獨(dú)有的風(fēng)趣幽默方式,將原生鴻蒙帶入觀眾的視野。從真實(shí)的應(yīng)用場(chǎng)景
    的頭像 發(fā)表于 12-25 14:45 ?151次閱讀
    快來“一起鴻蒙吧”!體驗(yàn)更出色,智慧再升級(jí)

    如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺(tái)因其彈性擴(kuò)展、高效部署、低成本運(yùn)營(yíng)等優(yōu)勢(shì),逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場(chǎng)上的云原生機(jī)器
    的頭像 發(fā)表于 12-25 11:54 ?117次閱讀

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    來源:Master編程樹“機(jī)器學(xué)習(xí)”最初的研究動(dòng)機(jī)是讓計(jì)算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實(shí)現(xiàn)人工智能。因?yàn)闆]有學(xué)習(xí)能力的系統(tǒng)很難被認(rèn)為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?440次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門為深度學(xué)習(xí)機(jī)器
    的頭像 發(fā)表于 11-15 09:19 ?496次閱讀

    當(dāng)AI遇上質(zhì)檢會(huì)擦出什么樣的火花

    質(zhì)檢是工廠中的主要場(chǎng)景,傳統(tǒng)的人工質(zhì)檢需要工人時(shí)刻盯著機(jī)器屏幕,從圖中發(fā)現(xiàn)產(chǎn)品的缺陷,速度大約保持在2秒一張。但如果一張產(chǎn)品的瑕疵難以判斷,可能還要多花上幾秒思考。而在具體的操作過程中,因?yàn)榭简?yàn)視力和專注度,質(zhì)檢員們往往感到較為疲倦。
    的頭像 發(fā)表于 11-07 11:44 ?282次閱讀

    IP地址與智能家居能夠碰撞出什么樣的火花呢?

    感應(yīng)燈、遠(yuǎn)程遙控空調(diào),自動(dòng)感應(yīng)窗簾——智能家居已經(jīng)在正逐步走入我們的生活,為我們帶來前所未有的便捷與舒適體驗(yàn)。而在這一進(jìn)程中,IP地址又能夠與智能家居碰撞出什么樣的火花呢? 一、IP地址:智能家居
    的頭像 發(fā)表于 09-24 11:21 ?253次閱讀

    電機(jī)碳刷打火花的原因及處理方法

    電機(jī)碳刷打火花的原因及處理方法如下: 一、電機(jī)碳刷打火花的原因 碳刷磨損過度 :當(dāng)碳刷磨損到一定程度時(shí),其與換向器之間的接觸面積會(huì)減小,導(dǎo)致電阻增大,進(jìn)而產(chǎn)生高溫和火花。 碳刷硬度不夠
    的頭像 發(fā)表于 09-03 14:32 ?4679次閱讀

    當(dāng)5G融合體育時(shí),會(huì)碰撞出怎樣火花

    觀賽的樂趣,你更愛哪一種?是和親朋好友圍坐電視機(jī)前共同經(jīng)歷難忘的時(shí)刻,還是獨(dú)自徜徉于直播、彈幕和熱搜的世界?隨著科技與體育的關(guān)系日益緊密,我們的觀賽體驗(yàn)正在被重新定義。正值全球矚目的體育盛事即將在巴黎啟幕,讓我們共同期待當(dāng)5G融合體育時(shí),會(huì)碰撞出怎樣
    的頭像 發(fā)表于 08-16 11:14 ?1.3w次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?1422次閱讀

    SOLIDWORKS教育版:開啟數(shù)字化設(shè)計(jì)新時(shí)代的鑰匙

    在數(shù)字化設(shè)計(jì)的世界里,SolidWorks無疑是一個(gè)重量級(jí)的角色。那么,你是否想過,當(dāng)solidworks遇上教育版,會(huì)碰撞出怎樣火花呢?
    的頭像 發(fā)表于 06-17 16:18 ?260次閱讀

    當(dāng)USB Type-C 遇上汽車應(yīng)用新需求,會(huì)擦出什么火花?

    盡管 USB Type-C 主要作為筆記本電腦、平板電腦和智能手機(jī)的新一代、更快充電標(biāo)準(zhǔn)而為人所熟知,但在電力輸送和連接應(yīng)用領(lǐng)域也變得日益普及。USB Type-C 的速度和效率非常高:隨著 USB 電力輸送 (USB PD) R3.1 規(guī)范的發(fā)展, 一個(gè) USB Type-C 連接器便可支持高達(dá) 240W(48V 和 5A)的功率,相較于 USB Std-A 連接器的 7.5W(5V 和 1.5A) ,這是一個(gè)顯著的提升。 USB Type-C 的廣泛采用并非偶然,歐盟、印度、巴西和韓國(guó)紛紛制定并實(shí)施了相關(guān)規(guī)定,要求便攜式個(gè)人電子產(chǎn)品
    發(fā)表于 05-16 09:49 ?825次閱讀
    當(dāng)USB Type-C <b class='flag-5'>遇上</b>汽車應(yīng)用新需求,<b class='flag-5'>會(huì)</b><b class='flag-5'>擦出</b>什么<b class='flag-5'>火花</b>?

    晶體晶振在SSD上的應(yīng)用

    ,SSD在消費(fèi)技術(shù)解決方案中的使用正在迅速上升。隨著物聯(lián)網(wǎng)、VR/AR、5G、在線技術(shù)和機(jī)器學(xué)習(xí)等技術(shù)的發(fā)展變得越來越普遍,預(yù)計(jì)這種需求將繼續(xù)下去。根據(jù)市場(chǎng)研究數(shù)據(jù),S
    的頭像 發(fā)表于 04-30 16:03 ?527次閱讀
    晶體晶振在<b class='flag-5'>SSD</b>上的應(yīng)用

    TC234LP使用iLLD Flash Demo每次運(yùn)行到擦出Dflash就會(huì)跑飛的原因?

    TC234LP 使用iLLD Flash Demo 每次運(yùn)行到擦出Dflash就會(huì)跑飛
    發(fā)表于 02-02 07:07