在存儲(chǔ)基礎(chǔ)部件領(lǐng)域(Storage & Memory),這兩年討論最多的應(yīng)屬Intel Optane系列,全新的介質(zhì)、出色的性能、非揮發(fā)特性、適中的價(jià)格,Optane受到眾多存儲(chǔ)架構(gòu)師和數(shù)據(jù)中心架構(gòu)師的青睞,Intel也持續(xù)大力研發(fā)和推廣。本文原邏輯在2019年8月的DapuStor Haishen3系列產(chǎn)品發(fā)布會(huì)上已經(jīng)討論過,這里再引申一些內(nèi)容,拋磚引玉,供大家探討。
主要有以下內(nèi)容:
什么是SCM(StorageClassMemory);
為什么說SCM越來越重要(數(shù)據(jù)中心基礎(chǔ)設(shè)施在經(jīng)歷什么,存儲(chǔ)行業(yè)又在經(jīng)歷什么);
DapuStor在思考什么(Optane SSD & Haishen3-XL)。
什么是SCM
關(guān)于SCM的定義,個(gè)人覺得以下統(tǒng)稱比較合適:“介于DRAM和NAND FLASH之間的具備非揮發(fā)特性的產(chǎn)品”。因?yàn)闆]有精確的關(guān)于SCM參數(shù)的定義,我們先來看看DRAM和NAND的一些相關(guān)參數(shù):
表:DRAM vs NAND FLASH
可以看到這兩者之間存在比較大的GAP,SCM即填補(bǔ)了這個(gè)GAP,如下圖的產(chǎn)品級(jí)圖示:
圖:存儲(chǔ)層缺口Gap - SCM
為什么說SCM越來越重要
首先,每個(gè)CPU核的可用DRAM容量,每?jī)赡杲档?0~30%。
Intel創(chuàng)始人之一的Gordon Moore提出“集成電路上可容納的元器件的數(shù)目,約每隔18-24個(gè)月便會(huì)增加一倍,性能也將提升一倍”,這成為IT產(chǎn)業(yè)最著名的摩爾定律,Intel、AMD服務(wù)器CPU路線也符合這個(gè)發(fā)展規(guī)律:
表:服務(wù)器CPU的發(fā)展
但當(dāng)我們把服務(wù)器內(nèi)存容量的發(fā)展趨勢(shì)和CPU核數(shù)放在一起,就能看到其中的問題:
表:服務(wù)器CPU &內(nèi)存的發(fā)展
即“每個(gè)服務(wù)器CPU核的可用DRAM容量,每?jī)赡杲档?0~30%”,其實(shí)服務(wù)器CPU對(duì)內(nèi)存的“hungry”是業(yè)界的共識(shí):
圖:服務(wù)器CPU &內(nèi)存的發(fā)展
這個(gè)趨勢(shì)從美國(guó)阿岡國(guó)家實(shí)驗(yàn)室超級(jí)計(jì)算機(jī)計(jì)劃 Argonne National Labs plans也可以看出:
表:阿岡國(guó)家實(shí)驗(yàn)室HPC計(jì)劃
其次,CPU獲得的DRAM帶寬增速,遠(yuǎn)遠(yuǎn)不及SSD、網(wǎng)絡(luò)帶寬增速。
這里直接引用Sandisk Fellow Fritz Kruger的數(shù)據(jù),有興趣的朋友可以搜索“CPU Bandwidth – The Worrisome 2020 Trend”:
圖:網(wǎng)絡(luò)、存儲(chǔ)、DRAM趨勢(shì)(Log scale)
圖:網(wǎng)絡(luò)、存儲(chǔ)、DRAM趨勢(shì)(Linear scale)
第三,DRAM行業(yè)面臨scale up瓶頸。
熟悉DRAM行業(yè)的朋友,都知道DRAM行業(yè)經(jīng)歷了一個(gè)殘酷的廝殺過程:從上世紀(jì)80年代的超過20家,到現(xiàn)在的“3大1小”。
在這個(gè)行業(yè)發(fā)展過程中,每一家都在靠以下兩種方式競(jìng)爭(zhēng):“制程轉(zhuǎn)進(jìn)”與“擴(kuò)大產(chǎn)能”。前者即為新工藝的研發(fā),如20nm轉(zhuǎn)往17nm,會(huì)帶來比如20~30%的bit growth;后者即為更新、增加產(chǎn)線和設(shè)備,以增加投片和產(chǎn)出。這兩者都需要龐大的資本投入,而在早期資本的投入和整體bit growth基本呈線性關(guān)系。
而我們?nèi)绻痖_來看的話,可以發(fā)現(xiàn)隨著制程的發(fā)展,到了20nm及以下制程后,工藝的轉(zhuǎn)進(jìn)帶來的研發(fā)投入增長(zhǎng)越來越龐大,大白話是“原來有100塊錢,花30塊錢更新制程另外70塊錢擴(kuò)產(chǎn);但是現(xiàn)在更新一個(gè)制程需要花70塊甚至更高”。
因此,行業(yè)近5年雖然資本支出越來越大,但產(chǎn)出bit growth卻越來越低,也就是說整個(gè)行業(yè)面臨scale up的瓶頸,資本投入和bit growth并非線性關(guān)系,且越來越明顯:
圖:DRAM行業(yè)資本支出和位成長(zhǎng)率
DRAM是已經(jīng)商用的最快的存儲(chǔ)介質(zhì),從性能特性來說無法被替代,再加上現(xiàn)在行業(yè)的寡頭局面,任何一個(gè)IT OEM廠商或者數(shù)據(jù)中心,都需要至少3家供應(yīng)商。如果你是其中一家DRAM供應(yīng)商,你會(huì)怎么想?會(huì)不會(huì)是“這個(gè)生意太好了,慢慢來 :)”。
綜合以上各個(gè)趨勢(shì)發(fā)展,聰明的架構(gòu)師們就開始從系統(tǒng)角度來思考這個(gè)問題,這也說明了為什么SCM會(huì)被委以重任。
具體SCM的使用場(chǎng)景有兩種:Caching 和 Tiering,一般情況下Caching相對(duì)比較容易實(shí)現(xiàn),而Tiering需要更深入的上下層整合,包括配套的算法,以確保兼顧各Tier的容量比(即成本)和效率。很多大型數(shù)據(jù)中心和存儲(chǔ)廠商都在積極尋找和布局合適Optane SCM的應(yīng)用場(chǎng)景,比如HPE有“Memory-Driven Flash”(Caching),比如DellEMC PowerMAX支持Tiering。
DapuStor在思考什么
DapuStor(深圳大普微電子科技有限公司)致力于打造企業(yè)級(jí)智能固態(tài)硬盤、數(shù)據(jù)存儲(chǔ)處理器芯片及邊緣計(jì)算相關(guān)產(chǎn)品,企業(yè)級(jí)、數(shù)據(jù)中心級(jí)智能存儲(chǔ)基礎(chǔ)設(shè)施是我們現(xiàn)階段主要的方向,而在此領(lǐng)域如此重要的SCM產(chǎn)品,當(dāng)然非常關(guān)鍵。
合作伙伴KIOXIA(原Toshiba)在2018年提出SCM級(jí)XL-FLASH發(fā)展規(guī)劃,在接下來的時(shí)間里,DapuStor也針對(duì)XL-FLASH和KIOXIA進(jìn)行了長(zhǎng)時(shí)間的緊密溝通和合作,Haishen3-XL SCM級(jí)SSD也確定了如下特性:
圖:DapuStor Haishen3 SCM特性
關(guān)于Haishen3-XL和OptaneSSD、Z-SSD性能的比較
表:Optane SSD vs Z-SSD vs Haishen3-XL
Optane SSD采用3DXpoint,Z-SSD和Haishen3-XL采用optimized low-latency SLC NAND,從介質(zhì)上講3DXpoint已經(jīng)不是NAND而是PCRAM,是“cross point”型架構(gòu),尋址方式、寫入過程等與NAND完全不同,不需要垃圾回收,因此Optane SSD RW IOPS有明顯優(yōu)勢(shì),另外據(jù)說Optane Gen2 會(huì)進(jìn)一步提升至60DWPD,這是從介質(zhì)改革帶來的優(yōu)勢(shì);其它方面Haishen3-XL并不弱。
因此從整體性能方面,low-latency SLC NAND SSD,如Haishen3-XL可在大部分應(yīng)用場(chǎng)景和Optane SSD共同存在。
DapuStor也在2020年1月份的PM Summit上基于RWW(Real World Workload)對(duì)Optane SSD、Haishen3-XL進(jìn)行了比較,原文鏈接參考:http://www.dapustor.com/news_view.aspx?nid=2&typeid=139&id=543
關(guān)于Haishen3-XL和OptaneSSD成本的比較
因?yàn)镮ntel在數(shù)據(jù)中心CPU領(lǐng)域占絕對(duì)壟斷地位,針對(duì)CPU和Optane、SSD也有類似bundle program優(yōu)勢(shì),因此我們無法估算Optane SSD的to B實(shí)際成交價(jià)格,僅以電商平臺(tái)零售價(jià)來看還是挺高的:
表:Optane SSD零售價(jià)
另一方面,我們粗算一下,能看到3DXpoint Gen1的Wafer成本大概是96L low-latency SLC NAND的2倍:
表:Wafer Cost:TLC vs XL-FLASH vs 3DXpoint vs DRAM
下面再看看Intel 3DXpoint從Micron的采購(gòu)成本。
從Micron 2020FQ2 Earnings report,可以估算出Micron交付給Intel的3DXpoint業(yè)務(wù)預(yù)計(jì)為2B$的6%,即為120M$:
“……Revenue for the CNBU was approximately $2 billion, down approximately1% sequentially and down 17% year-over-year. We have now started to include all 3D XPoint revenue in CNBU reporting, as the use cases for 3D XPoint technology are more closely aligned with memory expansion and this business is being managed by CNBU. Excluding 3D XPoint, CNBU revenue would have been down 7% sequentially……”
而3DXpointGen1的產(chǎn)能約為135MGB/Q https://blocksandfiles.com/2019/08/27/3d-xpoint-revenue-forecasts/:
“……It will output 45m GB/month of Gen 1 XPoint in the fourth quarter and 5m GB/month of Gen 2 XPoint……”
即Intel采購(gòu)價(jià)格約為120M$/135MGB = 0.88$/GB。Intel和Micron的長(zhǎng)期合作協(xié)議,該價(jià)格應(yīng)該是Micron能提供的最優(yōu)價(jià),基本符合上面Wafer成本的測(cè)算(3DXpoint Gen1 wafer成本大概是96L TLC的10倍).
財(cái)務(wù)表現(xiàn)上, Intel在Optane上的巨大研發(fā)投入,也導(dǎo)致NSG絕大多數(shù)財(cái)季在虧損。從長(zhǎng)期來看,Intel大概率會(huì)持續(xù)推廣Optane產(chǎn)品,隨著3DXpoint的使用量越來越多,生產(chǎn)制造成本也會(huì)隨之降低,形成正循環(huán)。
而從一個(gè)健康的行業(yè)發(fā)展來看,現(xiàn)階段正是需要多個(gè)SCM玩家推高市場(chǎng)需求的時(shí)期。Low-latency NAND因?yàn)榛诜浅3墒斓?D NAND研發(fā)生產(chǎn)制造流程,從生態(tài)上來說是一個(gè)非常合適的SCM產(chǎn)品第二選擇,DapuStor也立志成為基于low-latency NAND的優(yōu)秀SCM解決方案提供商。
說明:文中部分內(nèi)容涉及對(duì)未來的判斷,可能和實(shí)際會(huì)有出入;另外有一些數(shù)據(jù)是通過參考公開數(shù)據(jù)推測(cè)而來,并非一手?jǐn)?shù)據(jù)。若有偏頗還望見諒,有問題歡迎討論lijinxing@dapustor.com :)
-
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4340瀏覽量
86009 -
SCM
+關(guān)注
關(guān)注
2文章
66瀏覽量
15335
原文標(biāo)題:珍藏!存儲(chǔ)級(jí)內(nèi)存SCM,看這一篇就夠了!
文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論