0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

企業(yè)級存儲盤中的操作特性

架構師技術聯(lián)盟 ? 來源:SCS存儲專委 ? 2022-12-30 15:06 ? 次閱讀

本工作發(fā)表于FAST 2022。首次基于一家主要存儲供應商的近200萬個SSD的大量企業(yè)存儲系統(tǒng),對生產(chǎn)使用中SSD的關鍵操作特性進行了大規(guī)模的現(xiàn)場研究。

基于本文,可以得到以下重要發(fā)現(xiàn):

發(fā)現(xiàn)1:大多數(shù)SSD以非常慢的速度消耗PE周期。

發(fā)現(xiàn)2:用作緩存的SSD的主機寫力度明顯高于用作持久存儲的SSD。然而,并沒有看到更高的NAND使用率,因為他們也經(jīng)歷了更低的WAF。因此,并不一定需要對緩存工作負載使用更高的持久性驅(qū)動器

發(fā)現(xiàn)3:不同驅(qū)動器家族和制造商的WAF差異顯著(數(shù)量級)。

發(fā)現(xiàn)4:避免retention問題所作的后臺工作是WAF的一個很大的原因。

發(fā)現(xiàn)5:磨損水平度并不完美。5%的SSD報告的擦除比率超過6,也就是說,驅(qū)動器中有些塊的磨損速度是平均塊的6倍。

發(fā)現(xiàn)6:AFF系統(tǒng)平均已經(jīng)滿了43%。在生產(chǎn)的頭幾年,系統(tǒng)豐滿度增長得更快,之后增長緩慢。容量最大的系統(tǒng)比容量較小的系統(tǒng)更滿。

發(fā)現(xiàn)7:在研究的系統(tǒng)中,與SSD相關的絕大多數(shù)工作負載(94%)是讀取主導的,中位數(shù)R/W比為3.62:1,突出了基于SSD和基于HDD的系統(tǒng)在使用上的差異。

背景及動機

隨著SSD部署的越來越多,了解它們在實際現(xiàn)場的操作特性是非常重要的,特別由于它們的操作方面不同于HDD。了解操作特性有助于我們更好的了解SSD在實際大規(guī)模工作環(huán)境中的表現(xiàn),同時給未來的閃存部署帶來新的思考。

操作特性方面的研究,包含SSD所經(jīng)歷的寫放大水平以及它如何受到各種因素的影響;磨損水平的有效性;或者是現(xiàn)場設備使用它們的(PE)周期限制的速率,以及這對向耐力較低的下一代flash的過渡意味著什么。本文首次基于一家主要存儲供應商(NetApp)的近200萬個SSD的大量企業(yè)存儲系統(tǒng),對生產(chǎn)使用中SSD的關鍵操作特性進行了大規(guī)模的現(xiàn)場研究。

研究問題

1、在生產(chǎn)系統(tǒng)中設備的寫入量是多少以及他們距離達到磨損極限有多近?這對未來新一代耐磨性更差的閃存來說意味著什么?

2、設備在生產(chǎn)系統(tǒng)中寫入放大程度如何?這些數(shù)字與先前的學術工作中的報告相比如何?

3、SSD在生產(chǎn)環(huán)境中的磨損水平如何?

4、寫放大如何受到各種因素的影響,包括FTL相關因素(例如,設備模型、固件版本、OP設置、是否支持多流寫)和工作負載因素(例如,寫入量和讀寫比率,設備是用作緩存還是持久存儲,設備在RAID中的角色是數(shù)據(jù)、奇偶校驗還是分區(qū))?

系統(tǒng)描述

數(shù)據(jù)量:200萬個設備;

數(shù)據(jù)種類:三個不同的制造商,總共20個不同的系列,每個系列的劃分依賴于制造商、容量、顆粒類型等;

數(shù)據(jù)內(nèi)容:使用方面的信息,如主機讀寫,總物理設備寫,以及每個驅(qū)動器的磨損水平和寫放大的信息。此外,我們的數(shù)據(jù)包含每個系統(tǒng)的配置,包括其所有RAID組和RAID組中每個驅(qū)動器的角色(即數(shù)據(jù)或奇偶校驗)等;

系統(tǒng)分類:企業(yè)系統(tǒng):一種使用SSD作為HDD上的緩存層(稱為WBC),另一種由僅閃存系統(tǒng)組成,稱為AFF (AllFlash結構-緩存存儲(FAS));

數(shù)據(jù)來源:NetApp Active IQ ,類似于SMART技術。

da32ba7a-880f-11ed-bfe3-dac502259ad0.png

操作特征

write rate:對于盤的寫入數(shù)據(jù)的程度, write rate越大越說明運行在盤上的工作負載是寫密集型的。

WAF:寫放大??紤]其也是SSD磨損的重要原因。

wear leveling:均衡磨損。由于不同盤的固件不同,導致FTL中的均衡磨損算法差異較大,因此影響到盤的磨損。

fullness:設備豐度。指的是在整個系統(tǒng)在容量中真正被用到的部分。因為fullness的程度會很大程度上影響盤內(nèi) 的后臺操作,尤其是均衡磨損和垃圾回收。

1. Write Rate

write rate的衡量標準是DWPD(每日全盤寫入次數(shù)),指每日寫入的數(shù)據(jù)量能夠覆蓋全盤的次數(shù)。

分三個角度進行考慮:系統(tǒng)類型、盤的容量、盤的種類。

da54a874-880f-11ed-bfe3-dac502259ad0.png

發(fā)現(xiàn)1:DWPD的平均值是0.36,能夠滿足現(xiàn)有幾乎所有盤的要求。但是7%的盤超過3,2%的盤超過10。

發(fā)現(xiàn)2:從主機寫的情況來看,WBC系統(tǒng)相比較AFF系統(tǒng)來說,write rate要高的多。平均值3.6X,99th%10.6 。(猜測和系統(tǒng)中盤的容量大小有關,因為DWPD和全盤的容量有關。而作為cache的SSD容量大小肯定低于純flash的容量)。

發(fā)現(xiàn)3:WBC系統(tǒng)的盤有一個很長的尾端分布。99th%到達40,99.9th%到達76 。說明在WBC系統(tǒng)中,對于SSD的耐久挑戰(zhàn)很大。

發(fā)現(xiàn)4:容量越小的盤write rate程度越高。

發(fā)現(xiàn)5:對于不同種類的SSD,其write rate程度相差較大。并且對于AFF和WBC系統(tǒng)來說,那些DWPD超過平均值的SSD種類基本相似。

2. WAF

da7afa56-880f-11ed-bfe3-dac502259ad0.png

發(fā)現(xiàn)1:從整體上看,WAF的分布和先前的研究有很大的不同,先前專注于金融應用服務分布在1.3、華為3D-TLC則分布在1.5。但是98.8%和96%的SSD觀察到的WAF分別大于1.3和1.5。

發(fā)現(xiàn)2:I-C、I-D和I-E種類的WAF比其他大多數(shù)的盤種類高一個數(shù)量級。這是為什么這三個種類的主機寫入量不大,但是卻有很高的nand使用率。但是這和工作負載關系不大,沒有跡象表明這三種類型的盤用于其他不同類型的應用。原因在于這三類盤在空閑時有大量的后臺工作。主要用于解決retention問題。但是這個問題在之前的研究中非常容易被忽視。

發(fā)現(xiàn)3:只比較同一個種類的SSD,WAF也存在不同的分布。

發(fā)現(xiàn)4:對于相同的盤類型,WBC系統(tǒng)的WAF明顯低于AFF系統(tǒng),這表明WBC工作負載更對閃存友好。就緩存要求而言,在緩存中的應用被認為是要求最高的,而廣泛接受的最佳實踐建議對這些應用程序只使用具有最高

耐久性的驅(qū)動器。觀察表明,這可能并不總是必要的。

3. Wear Leveling

文章定義了兩個標準用來看均衡磨損是否有效:

da98fe66-880f-11ed-bfe3-dac502259ad0.png

db07ec36-880f-11ed-bfe3-dac502259ad0.png

db1c4bae-880f-11ed-bfe3-dac502259ad0.png

發(fā)現(xiàn)1:磨損水平并不完美。中值擦除比為1.55,表明最大塊比平均塊多執(zhí)行55%。5%的盤的擦除比大于6。

發(fā)現(xiàn)2:不同種類之間的磨損等級指標存在顯著差異。例如,I-C和I-D盤報告的磨損水平指標明顯更高(盡管與其他一些種類的年齡、容量和DWPD相似),不同的制造商在均衡磨損方面遵循非常不同的理念:當查看擦除差度量時,看到擦除差最大的四個種類都屬于同一個制造商(即I)。

4. Fullness

發(fā)現(xiàn)1:平均系統(tǒng)的滿容量約為45%,中值也約為45%,即超過一半的存儲容量是空閑的。各系統(tǒng)的豐滿度分布大致一致。CDF變化點僅高于80%,即低于80%的可能性大致相等,而高于80%的值則相對不太常見。

發(fā)現(xiàn)2:系統(tǒng)的豐滿度會隨著年齡的增長而增加。但是增長速度不一致,頭兩年明顯更快。但是有一些非常年輕的系統(tǒng)很滿,一些舊系統(tǒng)很空:略高于5%的年輕系統(tǒng)(不到1歲)超過80%,而19%的舊系統(tǒng)(超過4歲)不到25%。

發(fā)現(xiàn)3:總容量較大的系統(tǒng)往往更滿:最大的系統(tǒng)比其他系統(tǒng)多1.7×(按中位數(shù)計算)。說明,購買更大容量系統(tǒng)的客戶確實有更大的容量需求,并且也能更好地預測他們需要多少存儲容量。

Which factors impact WAF?

因素1:FTL。在同一個種類、同樣容量的SSD盤中。固件版本FV2和版本FV3上的驅(qū)動器的WAF之間有明顯的區(qū)別。

db341d6a-880f-11ed-bfe3-dac502259ad0.png

因素2:工作負載。因為無法直接獲取工作負載的特性,因此通過五個角度特征代替:DWPD、RAID組中的角色、容量、接口、讀寫比。

因素3:DWPD。在不同的容量和驅(qū)動角色中,WAF隨著DWPD數(shù)量的增加而減少。這可能表明SSD在更高的寫力度下更有效地運行(在后臺任務和WAF方面)。這也可能意味著一些FTL背景功是恒定的,即不強烈依賴于DWPD;因此,較高的DWPD會降低這種恒定功對WAF比值的影響。

db4b4562-880f-11ed-bfe3-dac502259ad0.png

因素4:角色。不同角色盤的WAF的顯著差異。對于分區(qū)SSD的較高WAF的一個可能的解釋可能是,它們被迫處理來自具有潛在不同特征的不同工作負載的請求,因此經(jīng)歷了寫模式的混合。同時需要注意,隨著數(shù)據(jù)量的增加,差距減少。表明寫力度對WAF的影響大于它的作用。

因素5:容量。高容量的主機SSD(即8TB和15TB)與相同的小容量相比,經(jīng)歷更低的WAF,當主機總寫量較低時,差異更明顯。盡管如此,與960GB SSD相比,3.8TB SSD經(jīng)歷的WAF略高,這表明更小容量的SSD不一定會經(jīng)歷更高的WAF(即,其他因素對WAF的影響更強)。

因素6:設備接口。使用NVMe接口的盤明顯經(jīng)歷更少的WAF。考慮到NVMe還是新技術,因此可能的原因在于,使用NVMe的盤會用于一些特定的應用,導致工作負載上的差別,從而體現(xiàn)在WAF上的不同。同樣的,多流技術、op占比也是如此。

db6b25b2-880f-11ed-bfe3-dac502259ad0.png

Read/Write (R/W) Ratios

發(fā)現(xiàn)1:絕大多數(shù)盤,約94%,經(jīng)歷的讀取多于寫取。中位數(shù)為3.6:1,95th%為61:1。這與基于HDD的系統(tǒng)相差很大,先前的研究均經(jīng)歷寫大于讀。在華為的數(shù)據(jù)中,均為寫大于讀,MLC讀寫比在0.5左右,TLC讀寫比在0.57左右。

發(fā)現(xiàn)2:AFF系統(tǒng)中的R/W比值隨時間的推移保持相當穩(wěn)定,這表明相應的工作負載的特性不會隨時間發(fā)生顯著變化。

dbb7a252-880f-11ed-bfe3-dac502259ad0.png

dbd9e15a-880f-11ed-bfe3-dac502259ad0.png

Most Important Findings

整理一下文章所有的觀點可以得到以下重要發(fā)現(xiàn):

發(fā)現(xiàn)1:大多數(shù)SSD以非常慢的速度消耗PE周期。

發(fā)現(xiàn)2:用作緩存的SSD的主機寫力度明顯高于用作持久存儲的SSD。然而,并沒有看到更高的NAND使用率,因為他們也經(jīng)歷了更低的WAF。因此,并不一定需要對緩存工作負載使用更高的持久性驅(qū)動器

發(fā)現(xiàn)3:不同驅(qū)動器家族和制造商的WAF差異顯著(數(shù)量級)。

發(fā)現(xiàn)4:避免retention問題所作的后臺工作是WAF的一個很大的原因。

發(fā)現(xiàn)5:磨損水平度并不完美。5%的SSD報告的擦除比率超過6,也就是說,驅(qū)動器中有些塊的磨損速度是平均塊的6倍。

發(fā)現(xiàn)6:AFF系統(tǒng)平均已經(jīng)滿了43%。在生產(chǎn)的頭幾年,系統(tǒng)豐滿度增長得更快,之后增長緩慢。容量最大的系統(tǒng)比容量較小的系統(tǒng)更滿。

發(fā)現(xiàn)7:在研究的系統(tǒng)中,與SSD相關的絕大多數(shù)工作負載(94%)是讀取主導的,中位數(shù)R/W比為3.62:1,突出了基于SSD和基于HDD的系統(tǒng)在使用上的差異。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NAND
    +關注

    關注

    16

    文章

    1682

    瀏覽量

    136161
  • 存儲
    +關注

    關注

    13

    文章

    4314

    瀏覽量

    85851
  • SSD
    SSD
    +關注

    關注

    21

    文章

    2862

    瀏覽量

    117429

原文標題:企業(yè)級存儲盤中的操作特性

文章出處:【微信號:架構師技術聯(lián)盟,微信公眾號:架構師技術聯(lián)盟】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    SAS走進企業(yè)級存儲應用

    SAS走進企業(yè)級存儲應用串行SCSI(SAS)的出現(xiàn)已經(jīng)有幾年了。2005年,在主要的接口技術,由于OEM服務器制造商和系統(tǒng)集成商開始提供串行SCSI解決方案,企業(yè)級
    發(fā)表于 11-13 21:58

    國內(nèi)企業(yè)級固態(tài)硬盤生產(chǎn)研發(fā)企業(yè)招聘

    國內(nèi)企業(yè)級固態(tài)硬盤生產(chǎn)企業(yè),目前已經(jīng)完成C輪融資,現(xiàn)招聘嵌入式固件研發(fā)工程師,坐標北京、上海。職位描述:1、 負責公司存儲產(chǎn)品系統(tǒng)架構和功能的設計開發(fā);2、 聯(lián)合軟硬件設計人員進行系統(tǒng)集成測試、調(diào)試
    發(fā)表于 11-17 10:36

    當我們談論企業(yè)級存儲市場時,我們談論(做)了什么

    摘要: APSARA Block Storage是阿里云彈性計算塊存儲團隊推出的一款企業(yè)級分布式塊存儲產(chǎn)品,為企業(yè)級市場頭部客戶量身打造,構建高性能、彈性、可靠的大規(guī)模橫向擴展云
    發(fā)表于 06-28 15:37

    采用nvSRAM確保企業(yè)級SSD故障時電源可靠性

    等信息,并且需要每個文件的多次寫入操作。元數(shù)據(jù)要求隨著企業(yè)級SSD容量的增長而增長。  SDRAM緩存數(shù)據(jù)和元數(shù)據(jù)的電源故障備份  在企業(yè)存儲系統(tǒng)的數(shù)據(jù)傳輸
    發(fā)表于 09-26 09:44

    大話企業(yè)級Android開發(fā)

    大話企業(yè)級Android開發(fā)
    發(fā)表于 07-11 19:39

    大話企業(yè)級Android開發(fā)

    大話企業(yè)級Android開發(fā)
    發(fā)表于 03-31 11:37

    企業(yè)級的LInux系統(tǒng)日志管理

    企業(yè)級LInux系統(tǒng)日志管理
    發(fā)表于 05-29 11:33

    大話企業(yè)級Android開發(fā)

    大話企業(yè)級Android開發(fā)
    發(fā)表于 03-05 11:15

    希捷發(fā)布10TB氦氣企業(yè)級海量以滿足云數(shù)據(jù)中心存儲需求

     中國,北京,2016年1月14日——全球領先的存儲解決方案提供商希捷科技(NASDAQ:STX)日前發(fā)布首款10TB企業(yè)級海量,該兼具大容量及業(yè)界最低能耗和最輕重量,滿足個人和公
    發(fā)表于 01-14 15:53 ?964次閱讀

    以下五點 是2019年企業(yè)級存儲廠商業(yè)務增長的基礎

    這里所提到的中國企業(yè)級存儲廠商,不只是國產(chǎn)品牌的企業(yè)級存儲廠商,還包括國際品牌的企業(yè)級存儲廠商。
    發(fā)表于 12-11 17:22 ?705次閱讀

    華為2019年中國企業(yè)級存儲市場出貨份額排名第一

    IDC于近日發(fā)布《中國企業(yè)級外部存儲市場2019年四季度跟蹤報告》,報告顯示,華為在2019年企業(yè)級存儲市場出貨份額達到29.5%,排名第一。這是華為連續(xù)第5年在中國
    的頭像 發(fā)表于 04-03 17:30 ?4683次閱讀

    詳談SSD故障預測技術

    在上篇文章“企業(yè)級存儲操作特性,基于一家主
    的頭像 發(fā)表于 01-03 14:27 ?1315次閱讀

    聊聊企業(yè)級存儲操作特性

    本工作發(fā)表于FAST 2022。首次基于一家主要存儲供應商(NetApp)的近200萬個SSD的大量企業(yè)存儲系統(tǒng),對生產(chǎn)使用SSD的關鍵操作
    的頭像 發(fā)表于 10-19 11:29 ?676次閱讀
    聊聊<b class='flag-5'>企業(yè)級</b><b class='flag-5'>存儲</b><b class='flag-5'>盤</b><b class='flag-5'>中</b>的<b class='flag-5'>操作</b><b class='flag-5'>特性</b>

    細說企業(yè)級SSD的那些高價值特性

    企業(yè)級SSD(SolidStateDrive)是基于閃存技術的高性能、高可靠性的固態(tài)硬盤,專為滿足企業(yè)級應用場景的需求而設計。為了滿足各種高速數(shù)據(jù)處理和可靠性要求較高的應用場景,企業(yè)級SSD在
    的頭像 發(fā)表于 12-16 08:35 ?1070次閱讀
    細說<b class='flag-5'>企業(yè)級</b>SSD的那些高價值<b class='flag-5'>特性</b>

    江波龍進軍企業(yè)級存儲,萬事俱備堅定高端之路

    國內(nèi)存儲行業(yè)龍頭企業(yè)江波龍經(jīng)過二十多年的耕耘,已經(jīng)成為面向消費電子、嵌入式、工業(yè)、車規(guī)存儲的佼佼者,并轉(zhuǎn)型為半導體
    的頭像 發(fā)表于 03-25 14:19 ?1498次閱讀