背景介紹
當(dāng)前AI技術(shù)蓬勃發(fā)展,深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等技術(shù)不斷突破,使得AI在圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域取得了顯著成果。在圖像處理方面,卷積神經(jīng)網(wǎng)絡(luò)(CNN)被廣泛應(yīng)用于圖像識(shí)別、目標(biāo)檢測(cè)等任務(wù),極大地提升了計(jì)算機(jī)視覺(jué)的準(zhǔn)確性和效率。在自然語(yǔ)言處理領(lǐng)域,深度學(xué)習(xí)模型如循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和Transformer架構(gòu)則助力機(jī)器理解并生成人類(lèi)語(yǔ)言,實(shí)現(xiàn)了智能對(duì)話、文本分類(lèi)等功能。此外,機(jī)器學(xué)習(xí)算法如決策樹(shù)、隨機(jī)森林和支持向量機(jī)(SVM)在數(shù)據(jù)分析和預(yù)測(cè)建模中發(fā)揮著關(guān)鍵作用。同時(shí),強(qiáng)化學(xué)習(xí)技術(shù)也在游戲AI、機(jī)器人控制等領(lǐng)域得到廣泛應(yīng)用,使智能體能夠自主學(xué)習(xí)和優(yōu)化行為策略。
SSD控制器是固態(tài)硬盤(pán)(SSD)中的核心組件,它負(fù)責(zé)協(xié)調(diào)SSD內(nèi)部各個(gè)部件的運(yùn)作,是數(shù)據(jù)讀寫(xiě)的關(guān)鍵管理者。面向主機(jī)方向,SSD控制器需要有效管理主機(jī)請(qǐng)求,通過(guò)精準(zhǔn)的調(diào)度、流控和預(yù)測(cè)確保主機(jī)響應(yīng)的及時(shí)和穩(wěn)定;面向底層NAND方向,它需要負(fù)責(zé)SSD上NAND介質(zhì)的全生命周期管理,確保底層NAND在全場(chǎng)景下的壽命和穩(wěn)定性除了基礎(chǔ)的數(shù)據(jù)管理功能,還需要具備強(qiáng)大的錯(cuò)誤校正能力,能夠及時(shí)發(fā)現(xiàn)并修復(fù)數(shù)據(jù)傳輸中的錯(cuò)誤,保證數(shù)據(jù)的完整性;同時(shí),它還負(fù)責(zé)執(zhí)行垃圾回收任務(wù),通過(guò)智能算法優(yōu)化存儲(chǔ)空間的使用,避免數(shù)據(jù)碎片化的發(fā)生,提高SSD的持久性和性能;此外,隨著數(shù)據(jù)安全性的日益受到重視,SSD控制器還集成了數(shù)據(jù)加密和保護(hù)功能,通過(guò)先進(jìn)的加密算法和安全機(jī)制,它能夠有效防止數(shù)據(jù)被非法訪問(wèn)或篡改,保護(hù)用戶(hù)的隱私和信息安全。
圖1:AI加持的SSD控制器
總的來(lái)說(shuō),AI是一個(gè)強(qiáng)大的建模工具,可以完成復(fù)雜模型的抽象,在SSD的應(yīng)用場(chǎng)景下能夠基于經(jīng)驗(yàn)數(shù)據(jù)給出IO和介質(zhì)的行為級(jí)預(yù)測(cè);而SSD控制器是一個(gè)復(fù)雜的管理系統(tǒng),需要基于主機(jī)IO和底層介質(zhì)的行為完成數(shù)據(jù)管理和性能優(yōu)化的功能。AI的能力和SSD的控制器需求可以很好的互補(bǔ),因此,本文對(duì)AI在SSD上的應(yīng)用進(jìn)行簡(jiǎn)單探索。
經(jīng)典AI技術(shù)介紹
本章我們簡(jiǎn)單介紹RF、MLP和CNN這三種經(jīng)典AI算法,其中,隨機(jī)森林屬于傳統(tǒng)機(jī)器學(xué)習(xí)算法,MLP和CNN屬于深度學(xué)習(xí)算法。
隨機(jī)森林屬于機(jī)器學(xué)習(xí)中的集成學(xué)習(xí)算法,屬于Bagging類(lèi)型。
集成學(xué)習(xí)的基本思想就是將多個(gè)分類(lèi)器組合,從而實(shí)現(xiàn)一個(gè)預(yù)測(cè)效果更好的集成分類(lèi)器。Bagging也叫自舉匯聚法(bootstrap aggregating),是一種在原始數(shù)據(jù)集上通過(guò)有放回抽樣重新選出k個(gè)新數(shù)據(jù)集來(lái)訓(xùn)練分類(lèi)器的集成技術(shù)。它使用訓(xùn)練出來(lái)的分類(lèi)器的集合來(lái)對(duì)新樣本進(jìn)行分類(lèi),然后用多數(shù)投票或者對(duì)輸出求均值的方法統(tǒng)計(jì)所有分類(lèi)器的分類(lèi)結(jié)果,結(jié)果最高的類(lèi)別即為最終標(biāo)簽。在實(shí)現(xiàn)上,可以通過(guò)簡(jiǎn)單的決策樹(shù)作為不同抽樣的分類(lèi)器,通過(guò)多個(gè)決策樹(shù)的預(yù)測(cè)結(jié)果投票,完成最終的預(yù)測(cè)。
圖2:包含n個(gè)決策樹(shù)的隨機(jī)森林
多層感知機(jī)(MLP)是一種基本的前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),由多個(gè)全連接層組成。
每個(gè)層中的神經(jīng)元接收上一層的輸出作為輸入,并將其加權(quán)求和后通過(guò)一個(gè)激活函數(shù)進(jìn)行非線性轉(zhuǎn)換。這種結(jié)構(gòu)允許模型學(xué)習(xí)非線性關(guān)系并對(duì)輸入數(shù)據(jù)進(jìn)行抽象表示。MLP的基本組件包括輸入層、隱藏層和輸出層:輸入層負(fù)責(zé)接收輸入特征向量,每個(gè)特征對(duì)應(yīng)輸入層的一個(gè)神經(jīng)元;隱藏層位于輸入層和輸出層之間,可以包含多個(gè)層。每個(gè)隱藏層的神經(jīng)元從前一層的輸出中獲取數(shù)據(jù),并進(jìn)行加權(quán)求和和激活函數(shù)處理;輸出層提供模型的最終輸出,可以是一個(gè)或多個(gè)神經(jīng)元的組合。在回歸問(wèn)題中,輸出層通常只有一個(gè)神經(jīng)元,它提供了預(yù)測(cè)的連續(xù)值。
圖3:包含一個(gè)隱藏層的MLP
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種具有局部連接、權(quán)值共享等特點(diǎn)的深層前饋神經(jīng)網(wǎng)絡(luò),具有表征學(xué)習(xí)能力,能夠按其階層結(jié)構(gòu)對(duì)輸入信息進(jìn)行平移不變分類(lèi)。
CNN的基本組件包括卷積層、池化層和全連接層:卷積層通過(guò)卷積操作對(duì)輸入數(shù)據(jù)進(jìn)行特征提取。卷積層由一組可學(xué)習(xí)的過(guò)濾器(或稱(chēng)為卷積核)組成,每個(gè)過(guò)濾器通過(guò)滑動(dòng)窗口在輸入數(shù)據(jù)上進(jìn)行卷積操作,以計(jì)算得到特定位置的特征圖;池化層用于對(duì)特征圖進(jìn)行下采樣,減少計(jì)算量并保留最重要的特征。常見(jiàn)的池化操作是最大池化,它選擇窗口中最大值作為池化結(jié)果;全連接層類(lèi)似于MLP中的隱藏層和輸出層,用于將卷積和池化層的輸出轉(zhuǎn)換為最終的預(yù)測(cè)結(jié)果。CNN的訓(xùn)練也使用反向傳播算法和梯度下降優(yōu)化器。不同于MLP,CNN在處理圖像等數(shù)據(jù)時(shí)利用了卷積和池化操作的局部連接性和參數(shù)共享特性,可以有效地捕捉到輸入數(shù)據(jù)的空間結(jié)構(gòu)和局部特征。
圖4:包含卷積核池化層的CNN網(wǎng)絡(luò)
基于AI的SSD控制器技術(shù)
本章我們以AI讀電壓預(yù)測(cè)的一個(gè)簡(jiǎn)單例子介紹SSD控制器上AI技術(shù)的應(yīng)用。SSD的存儲(chǔ)單元為NAND顆粒,每個(gè)NAND存儲(chǔ)單元可以視為一個(gè)可以保存電子的三極管,通過(guò)下發(fā)一定檢測(cè)電壓判斷三極管是否開(kāi)啟,可以檢測(cè)出其保存電子的數(shù)量,進(jìn)而獲取NAND中保存的數(shù)據(jù)。在NAND中,該檢測(cè)電壓即為NAND讀電壓。為了準(zhǔn)確的讀取NAND中的數(shù)據(jù),需要盡可能準(zhǔn)確的讀電壓,否則就會(huì)得到錯(cuò)誤的三極管開(kāi)啟閾值,造成讀取錯(cuò)誤。
在實(shí)際使用中,NAND的閾值電壓受多種因素影響:NAND的擦寫(xiě)次數(shù)影響NAND單元中電子流失的速度;NAND的上電保持時(shí)間等于NAND中電子持續(xù)流失的時(shí)間;對(duì)相鄰NAND單元的讀取可能造成NAND內(nèi)電子增加;不同物理位置的NAND單元因?yàn)楣に嚨牟灰恢滦?,在不同的?chǎng)景中的閾值電壓的變化也會(huì)有差異。NAND受各種因素影響的閾值電壓變化量就構(gòu)成了一個(gè)數(shù)值模型,我們可以嘗試通過(guò)AI對(duì)其進(jìn)行建模。
我們選取了一款主流廠商TLC顆粒進(jìn)行建模,TLC的一個(gè)wordline包含7個(gè)不同的讀狀態(tài),為了簡(jiǎn)化模型,我們僅考慮了不同磨損次數(shù)和不同上電保持時(shí)間的閾值電壓模型,最終得到模型的輸入信息為磨損次數(shù)PE,上電保持時(shí)間T,目標(biāo)page的所在的plane、block和wordline編號(hào),以及采用讀取得到數(shù)據(jù)最準(zhǔn)確的讀電壓RL1~RL7,采用隨機(jī)森林與MLP算法,分別進(jìn)行AI訓(xùn)練。
訓(xùn)練的數(shù)據(jù)集包括3000個(gè)不同位置page在不同PE和T下最優(yōu)讀電壓的數(shù)據(jù)。我們?cè)谟?xùn)練中對(duì)數(shù)據(jù)集進(jìn)行隨機(jī)劃分,按71劃分為訓(xùn)練集、測(cè)試集和驗(yàn)證集,訓(xùn)練集用于模型權(quán)重的訓(xùn)練,驗(yàn)證集用于模型超參數(shù)調(diào)整和過(guò)擬合監(jiān)控,測(cè)試集用于評(píng)估模型的性能,我們?cè)谟?xùn)練中采用模型輸出電壓與數(shù)據(jù)集中最優(yōu)電壓的均方誤差作為模型評(píng)估的標(biāo)準(zhǔn)。
隨機(jī)森林比較簡(jiǎn)單,我們采用一個(gè)50個(gè)隨機(jī)決策樹(shù)的森林進(jìn)行隨機(jī)樣本的訓(xùn)練,將所有數(shù)據(jù)進(jìn)行隨機(jī)劃分,進(jìn)行多次訓(xùn)練,當(dāng)均方誤差收斂后停止訓(xùn)練,最終得到的隨機(jī)森林在測(cè)試集上獲得了2.98的均方誤差。
在MLP中,我們采用了一種簡(jiǎn)潔高效的架構(gòu):輸入層直接接收磨損次數(shù)PE、時(shí)間T、plane、block和wordline位置這五個(gè)關(guān)鍵的物理參數(shù),這些參數(shù)是影響讀電壓的主要因素;隱藏層中包含兩個(gè)大小為128的隱藏層,這種設(shè)計(jì)旨在提供足夠的模型復(fù)雜度,以學(xué)習(xí)輸入特征與讀電壓之間的潛在關(guān)系。ReLU激活函數(shù)在這里發(fā)揮作用,幫助模型捕捉非線性依賴(lài);輸出層是一個(gè)包含7個(gè)神經(jīng)元的線性層,它輸出預(yù)測(cè)的讀電壓值,對(duì)應(yīng)于TLC NAND存儲(chǔ)單元中可能的不同狀態(tài)。訓(xùn)練后,在測(cè)試集上,MLP最終獲得2.99的均方誤差,略高于隨機(jī)森林。
圖5:電壓預(yù)測(cè)MLP訓(xùn)練架構(gòu)
因?yàn)樵诒緦?shí)驗(yàn)中,選取的場(chǎng)景比較單一,樣本量不大,傳統(tǒng)的機(jī)器學(xué)習(xí)算法與深度學(xué)習(xí)算法都以很小的模型量級(jí)取得了非常不錯(cuò)的學(xué)習(xí)效果,模型預(yù)測(cè)得到的閾值電壓與最優(yōu)讀電壓的誤差不超過(guò)3個(gè)電壓檔位,驗(yàn)證了AI技術(shù)在NAND電壓模型上的應(yīng)用潛力。隨著使用場(chǎng)景的復(fù)雜化,深度學(xué)習(xí)可以通過(guò)增加隱藏層,獲得更大精確的模型能力,提供全場(chǎng)景下的準(zhǔn)確NAND讀電壓預(yù)測(cè)。
憶聯(lián)在AI領(lǐng)域的布局及應(yīng)用
在本文我們通過(guò)一個(gè)簡(jiǎn)單的示例展示了AI作為一個(gè)新技術(shù),在SSD控制器底層管理上的應(yīng)用潛力。除了NAND讀電壓,還有NAND健康管理和壽命預(yù)測(cè)、主機(jī)負(fù)載預(yù)測(cè)、IO冷熱預(yù)測(cè)等多方面,都可以通過(guò)AI的建模,針對(duì)使用場(chǎng)景在線獲得SSD的最優(yōu)運(yùn)行參數(shù),幫助用戶(hù)獲得更快、更可靠、更安全的數(shù)據(jù)管理服務(wù)。
在人工智能的趨勢(shì)下,不管是AI PC還是超大規(guī)模數(shù)據(jù)中心,都對(duì)存儲(chǔ)容量和性能提出了更高要求。一直以來(lái),憶聯(lián)持續(xù)打磨產(chǎn)品的存儲(chǔ)性能,在7系DSSD、8系ESSD以及SAS產(chǎn)品上,已將AI算法融入了NAND管理、主機(jī)訪問(wèn)優(yōu)化、性能穩(wěn)定性等功能。未來(lái),憶聯(lián)還將不斷推出具備強(qiáng)勁競(jìng)爭(zhēng)力的全產(chǎn)品線SSD產(chǎn)品,滿(mǎn)足AI時(shí)代算力需求,實(shí)現(xiàn)存力突圍,為客戶(hù)創(chuàng)造最大價(jià)值。
審核編輯:劉清
-
控制器
+關(guān)注
關(guān)注
112文章
16418瀏覽量
178790 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4777瀏覽量
100960 -
SSD
+關(guān)注
關(guān)注
21文章
2871瀏覽量
117595 -
向量機(jī)
+關(guān)注
關(guān)注
0文章
166瀏覽量
20891 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1285瀏覽量
24376
原文標(biāo)題:Tech Talk:淺談AI技術(shù)在SSD控制器中的應(yīng)用
文章出處:【微信號(hào):UnionMemory憶聯(lián),微信公眾號(hào):UnionMemory憶聯(lián)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論