0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是文件的邏輯碎片和物理碎片

yYjs_江波龍 ? 來源:江波龍電子 ? 作者:江波龍電子 ? 2022-09-22 16:02 ? 次閱讀

UFS簡介

UFS(Universal Flash Storage, 通用閃存存儲)協(xié)議是JEDEC為移動存儲設(shè)備制定的通訊接口協(xié)議,業(yè)界通常將基于UFS協(xié)議的移動存儲產(chǎn)品稱為UFS設(shè)備。UFS設(shè)備廣泛應(yīng)用于智能手機(jī)、平板電腦、VR(虛擬現(xiàn)實(shí))設(shè)備、AR(增強(qiáng)現(xiàn)實(shí))設(shè)備、無人機(jī)、3D游戲、監(jiān)控系統(tǒng)、PDA、數(shù)字記錄器、MP3播放器、電子玩具等領(lǐng)域。

UFS是eMMC的替代者,它提供比eMMC更高的性能和能效比。圖1是eMMC和各代UFS的性能數(shù)據(jù)對比。

dfb1ff1c-398e-11ed-9e49-dac502259ad0.jpg

(圖 1:eMMC和UFS最大帶寬)

從圖1可以看到,最新UFS 4.0的最大帶寬可達(dá)到4GB/s以上,是eMMC最大帶寬的10倍有余。目前eMMC已停止演進(jìn),而UFS正在慢慢取代eMMC。

UFS經(jīng)歷幾次迭代,目前最新版本是UFS 4.0(2022年8月發(fā)布)。從圖1可以看到,每一次迭代,UFS性能都是在前一代的基礎(chǔ)上翻倍。UFS 4.0也不例外,它在UFS 3.0/3.1的基礎(chǔ)上性能翻倍,最大帶寬達(dá)到4GB/s以上。除此之外,UFS 4.0在UFS 3.0/3.1的基礎(chǔ)上,引入了一些新的特性,比如引入Barrier命令、高級RPMB、FBO等。今天我們將重點(diǎn)解讀FBO特性。

FBO,全稱為File Based Optimization,基于文件的優(yōu)化,顧名思義,它是基于文件來做性能優(yōu)化。在繼續(xù)FBO介紹之前,首先交代一下背景知識,了解什么是文件的邏輯碎片和物理碎片。

文件的邏輯碎片和物理碎片

對于一個文件來說,文件系統(tǒng)會為其分配若干個邏輯塊(Logical Block,用LBA尋址)用于存儲文件數(shù)據(jù)。當(dāng)文件系統(tǒng)在為一個文件分配邏輯塊時,會盡量為其分配連續(xù)的邏輯塊,但如果分配不到所需的連續(xù)邏輯塊,則會分配不連續(xù)的塊。

dfe8d866-398e-11ed-9e49-dac502259ad0.jpg

(圖 2:一個文件分配邏輯塊的兩個場景)

在這里,我們把LBA連續(xù)簡稱為“邏輯連續(xù)”。圖2場景1為“邏輯連續(xù)”,場景2則為“邏輯不連續(xù)”。一個文件的LBA如果“邏輯不連續(xù)”,通俗來講就是這個文件存在邏輯碎片化——該文件的LBA越離散,則表示其邏輯碎片化程度越高。

文件數(shù)據(jù)最終都是要存儲在存儲設(shè)備上,即這些邏輯塊(不管連續(xù)還是不連續(xù))都是要寫到存儲設(shè)備的閃存物理塊上去。在設(shè)備端,如果沒有其它寫入命令插入,存儲設(shè)備會把上述文件數(shù)據(jù)寫入到連續(xù)的閃存空間里。

如圖3所示:

e003c144-398e-11ed-9e49-dac502259ad0.jpg

(圖 3:存儲設(shè)備把文件數(shù)據(jù)寫入到連續(xù)的閃存空間)

我們把文件的數(shù)據(jù)在閃存空間連續(xù)寫入的場景稱之為“物理連續(xù)”。

但主機(jī)端在寫入上述文件的時候,可能會混雜著其它的寫入,比如該文件元數(shù)據(jù)的寫入,或者其它文件數(shù)據(jù)的寫入,設(shè)備端按接收到的寫命令依次接收寫入數(shù)據(jù),由于各種數(shù)據(jù)的穿插寫入,就可能導(dǎo)致上述文件的數(shù)據(jù)不是被連續(xù)寫到閃存空間。

如圖4所示:

e0284a3c-398e-11ed-9e49-dac502259ad0.jpg

(圖 4:存儲設(shè)備把文件數(shù)據(jù)寫入到不連續(xù)的閃存空間)

我們把文件數(shù)據(jù)在閃存空間不是連續(xù)寫入的場景稱之為“物理不連續(xù)”,通俗來講就是文件存在物理碎片化——一個文件的數(shù)據(jù)在閃存空間存儲越分散,則表示其物理碎片化程度越高。

值得一提的是,即使文件剛開始寫入到閃存是連續(xù)的,但由于后續(xù)存儲設(shè)備內(nèi)部的一些操作,比如垃圾回收,也有可能導(dǎo)致文件數(shù)據(jù)最后存儲在閃存空間的位置不是連續(xù)的。

文件碎片化對性能的影響

對存儲設(shè)備(比如UFS設(shè)備)來說,由于一個LBA的數(shù)據(jù)可能存儲在閃存的任意一個物理位置,因此存儲設(shè)備需要維護(hù)一張邏輯地址到物理地址的映射關(guān)系表,即L2P映射表。L2P映射表是一個大的數(shù)組:索引為LBA,內(nèi)容是該LBA在閃存的物理地址(簡稱為PBA)。當(dāng)存儲設(shè)備要讀取數(shù)據(jù)時,首先查找L2P映射表獲得該LBA對應(yīng)的PBA,然后根據(jù)該P(yáng)BA讀取該LBA對應(yīng)的數(shù)據(jù)。L2P映射表大小一般為存儲設(shè)備容量的1/1024,比如一個256GB的UFS設(shè)備,其L2P映射表大小為256MB。對消費(fèi)級存儲設(shè)備來說,一般不帶DRAM所以L2P映射表數(shù)據(jù)大多數(shù)時間都是存儲在閃存中的,而存儲設(shè)備固件則按需加載部分L2P映射關(guān)系到小容量的SRAM中。

在訪問一個文件的時候,如果該文件的LBA是連續(xù)的:一方面,主機(jī)端只要發(fā)很少的命令到存儲設(shè)備,以圖2場景1為例,要讀該文件,只需要發(fā)一個讀取命令即可,而對圖2場景2,即文件存在邏輯碎片,要讀取該文件,主機(jī)端需要發(fā)三個讀取命令,增加了I/O命令的個數(shù)。I/O命令個數(shù)的增多,無論是對主機(jī)端軟件,還是設(shè)備端固件,都帶來了不小的負(fù)擔(dān)。另一方面,如果文件LBA連續(xù),存儲設(shè)備從閃存設(shè)備一次加載4KB的L2P映射關(guān)系,就能滿足4MB的LBA數(shù)據(jù)訪問,相反,如果LBA不連續(xù),則最壞情況是每讀一個LBA,存儲設(shè)備需要從閃存中加載一個4KB的映射關(guān)系,然而頻繁的L2P加載,將會嚴(yán)重影響存儲設(shè)備的讀取性能。

簡而言之,無論是主機(jī)端還是設(shè)備端,都是特別喜歡“邏輯連續(xù)”的,不喜歡文件邏輯碎片化。

那“物理連續(xù)”呢?很顯然,存儲設(shè)備也同樣“喜聞樂見”。原因在于讀取的時候,如果數(shù)據(jù)都集中在一起,一次讀可以使用多Plane操作,比如對4 Plane閃存來說,一次讀取可以獲得64KB數(shù)據(jù)。但這64KB數(shù)據(jù)如果不是物理連續(xù)——分散在閃存中的不同地方,則最壞情況下要讀取16次閃存(每個命令只讀取4KB)。

至此我們能得出的結(jié)論是:“邏輯連續(xù)”和“物理連續(xù)”都滿足的場景下,文件具有最好的讀取性能。但只要其中任何一個場景不滿足,文件讀取性能則會受影響,最終可能導(dǎo)致手機(jī)出現(xiàn)“卡頓”的問題。因此,文件讀取性能優(yōu)化方向是避免或者減少文件邏輯碎片和物理碎片。

FBO特性

現(xiàn)在我們回到FBO特性上來。FBO作為UFS 4.0的一個擴(kuò)展協(xié)議,概括下來就是:主機(jī)和設(shè)備一起配合,把文件數(shù)據(jù)從“物理不連續(xù)”轉(zhuǎn)換成“物理連續(xù)”,以提升文件數(shù)據(jù)的讀取性能。

具體來說,系統(tǒng)空閑的時候(比如夜深人靜的時候),主機(jī)把需要性能優(yōu)化的某個(或某些)文件的LBA信息告訴存儲設(shè)備,讓存儲設(shè)備去檢查這些LBA在閃存塊上是否連續(xù)。設(shè)備會查詢這些LBA的映射關(guān)系,通過這些LBA在閃存上的物理地址,來分析該文件在閃存空間上是否物理連續(xù),以及不連續(xù)的程度(物理碎片化程度),然后把這些信息返回給主機(jī)。主機(jī)根據(jù)設(shè)備反饋信息,來指示存儲設(shè)備下一步動作:如果該文件在閃存空間上很分散,就要叫存儲設(shè)備把這些不連續(xù)的數(shù)據(jù)塊都搬到連續(xù)的地方去。在設(shè)備接到指示后,便會執(zhí)行數(shù)據(jù)的整理:將不連續(xù)的數(shù)據(jù)集中寫到新的連續(xù)閃存塊位置。FBO通過主機(jī)和設(shè)備的這種協(xié)作,就能夠解決文件數(shù)據(jù)在存儲空間的“碎片化”問題,從而改善文件的讀取性能。

e04e9642-398e-11ed-9e49-dac502259ad0.jpg

(圖5:FBO把文件數(shù)據(jù)從物理不連續(xù)整理成物理連續(xù))

FBO旨在解決文件物理碎片化問題。

FBO沒有解決的問題

FBO解決了文件的物理碎片化問題,即把“物理不連續(xù)”變成“物理連續(xù)”,但他沒有解決文件邏輯碎片化問題。有數(shù)據(jù)表明,文件“邏輯不連續(xù)”相比文件“物理不連續(xù)”,對文件性能影響更大,因此解決文件的邏輯碎片化問題顯得更為重要。

文件邏輯碎片化問題從古(HDD時代)至今(固態(tài)存儲時代)一直存在。業(yè)界對此做了不少努力。

首先是日志結(jié)構(gòu)文件系統(tǒng)(log-structured file system)的出現(xiàn),以F2FS(Flash Friendly File System,閃存友好文件系統(tǒng))為代表。F2FS是專門為基于閃存的存儲設(shè)備而設(shè)計的文件系統(tǒng),是手機(jī)中最常用的兩大文件系統(tǒng)之一(另一個是EXT4文件系統(tǒng))。F2FS在為文件分配邏輯塊的時候,一般采用追加方式分配邏輯塊,即按順序分配;只有當(dāng)存儲設(shè)備邏輯空間很滿的時候,才采用一種叫Threaded Logging的邏輯塊分配方式,這種方式可能為一個文件分配離散的邏輯塊。盡管如此,F(xiàn)2FS的出現(xiàn),仍然大幅緩解了文件的邏輯碎片化問題。

其次是SSD中的ZNS(Zoned Namespace)技術(shù),它把整個存儲空間劃分成若干個區(qū)塊(Zone),在區(qū)塊內(nèi)部強(qiáng)制順序?qū)懭?。這對存儲設(shè)備來說是個好消息,它的L2P映射表可以變得很?。ú捎酶蟮挠成淞6龋?,因此L2P映射表可常駐內(nèi)存,當(dāng)固件在處理讀取命令的時候,能夠快速獲取LBA的物理地址,從而提升讀取性能。在制定UFS 4.0標(biāo)準(zhǔn)的過程中,業(yè)界很多企業(yè)建議把Zoned Storage的概念應(yīng)用到UFS上來,但從結(jié)果來看,這個建議并沒有在UFS 4.0上被采納。但可以預(yù)見類似SSD的ZNS技術(shù)一定會出現(xiàn)在未來的某個UFS版本中。

點(diǎn)評FBO

雖然沒有解決文件邏輯碎片問題,但FBO解決了文件物理碎片問題,一定程度上能提升文件的讀取性能。如果考慮到類似F2FS文件系統(tǒng)的使用,即絕大多數(shù)文件的LBA是連續(xù)的,而現(xiàn)在有了FBO的加持,在手機(jī)上大文件的讀取性能將會得到改善,手機(jī)“越用越卡”的問題“可能”會得到解決。(為什么說“可能”?前面分析了影響文件系統(tǒng)性能最大因素是文件邏輯碎片化,如果文件邏輯碎片化問題沒有得到解決,F(xiàn)BO效果不會很好。)

俗話說“萬事有得必有失”,文件碎片整理需要從一個閃存塊把數(shù)據(jù)讀出來,然后集中寫到另外閃存塊,而FBO這種額外的寫會引入寫放大,影響存儲設(shè)備壽命。

另外,F(xiàn)BO是一種“亡羊補(bǔ)牢”的做法,即文件出現(xiàn)物理碎片,然后再將它們做整理。如果一開始存儲設(shè)備對文件的物理碎片化問題有針對性設(shè)計,即一開始就拒絕文件物理碎片的產(chǎn)生,那么FBO就失去了其意義。

導(dǎo)致文件物理碎片化主要有兩個原因:

1.由于各種數(shù)據(jù)混合著寫,某個文件的LBA數(shù)據(jù)一開始就有可能被寫到不連續(xù)的閃存空間;

2.還有就是有些存儲設(shè)備在設(shè)計上沒有意識到文件數(shù)據(jù)在閃存空間連續(xù)存放的意義,一些諸如垃圾回收的內(nèi)部操作,可能會導(dǎo)致最初連續(xù)寫入的文件數(shù)據(jù),被分散寫入到閃存空間,最終導(dǎo)致“物理不連續(xù)”。

如果知道物理碎片產(chǎn)生的原因,那么存儲設(shè)備就可以有針對性設(shè)計了。

比如存儲設(shè)備在算法上可以采用物理隔離的方式,將大尺寸數(shù)據(jù)寫入到一個閃存塊,而把小尺寸數(shù)據(jù)寫到另外一個閃存塊,這樣避免了因小尺寸元數(shù)據(jù)寫入,而導(dǎo)致大尺寸數(shù)據(jù)在物理空間上寫入不連續(xù)的情況。

或者一開始文件數(shù)據(jù)被不連續(xù)地寫入到閃存塊,但是在對這個閃存數(shù)據(jù)塊做垃圾回收的時候,將該閃存塊上連續(xù)的LBA數(shù)據(jù)寫到連續(xù)的新的物理塊上,從而達(dá)到類似FBO的功效。

江波龍Smart GC技術(shù)

江波龍UFS3.1在設(shè)計之初就意識到文件的物理碎片化問題,當(dāng)研發(fā)團(tuán)隊在設(shè)計垃圾回收算法時,不單只考慮到通過垃圾回收功能來回收閃存塊,還利用執(zhí)行垃圾回收的時機(jī)同時完成“物理不連續(xù)”到“物理連續(xù)”的整理。我們把這種“畢其功于一役”的垃圾回收技術(shù)稱為Smart GC。

e063c576-398e-11ed-9e49-dac502259ad0.jpg

(圖6:Smart GC:設(shè)備執(zhí)行垃圾回收的同時完成物理碎片整理)

Smart GC這項(xiàng)創(chuàng)新技術(shù)不僅解決了文件物理碎片化問題,改善了大文件的讀取性能,同時也避免了額外碎片整理對存儲設(shè)備壽命帶來的影響。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 閃存
    +關(guān)注

    關(guān)注

    16

    文章

    1797

    瀏覽量

    115033
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7115

    瀏覽量

    89333
  • 帶寬
    +關(guān)注

    關(guān)注

    3

    文章

    944

    瀏覽量

    41002
  • 文件系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    287

    瀏覽量

    19933

原文標(biāo)題:深度解讀UFS 4.0的FBO特性

文章出處:【微信號:江波龍電子,微信公眾號:江波龍電子】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    基于Altera FPGA的IP碎片重組模塊實(shí)現(xiàn)

    基于Altera FPGA的IP碎片重組模塊實(shí)現(xiàn)Implementation of an FPGA-Based IP Reassembly Module摘要:為了更好地支持網(wǎng)絡(luò)安全,IP碎片重組
    發(fā)表于 10-07 11:00

    【電腦日常維護(hù)教程】6個磁盤碎片整理技巧

    整理程序時系統(tǒng)會自動屏蔽掉屏幕保護(hù),運(yùn)行完成后自動恢復(fù)。4. 改變交換文件的位置 我們知道,如果大量碎片存在于C盤之中,可能會影響系統(tǒng)的啟動速度。為了加快系統(tǒng)的啟動速度,我們應(yīng)該盡量減少C盤中的碎片
    發(fā)表于 05-18 16:12

    請問mymalloc會產(chǎn)生內(nèi)存碎片嗎?

    malloc申請內(nèi)存在釋放后,會產(chǎn)生內(nèi)存碎片,所以UCOSIII內(nèi)有專門的內(nèi)存申請。原子哥視頻(UCOSIII視頻19講)最后的時候說可以用原子哥自己的mamalloc函數(shù)來申請內(nèi)存。我想問,難道原子哥的mymalloc不會產(chǎn)生內(nèi)存碎片
    發(fā)表于 10-16 04:35

    物聯(lián)網(wǎng)的技術(shù)碎片化與業(yè)務(wù)碎片化分析

    誰會關(guān)心物聯(lián)網(wǎng)碎片化?不同的企業(yè)對待物聯(lián)網(wǎng)碎片化,看法是不一樣的。關(guān)于碎片化的成因很多,那么到底挑戰(zhàn)碎片化有沒有解呢?
    發(fā)表于 03-05 07:33

    如何避免內(nèi)存碎片的產(chǎn)生

    內(nèi)存碎片的產(chǎn)生(從內(nèi)部碎片和外部碎片方面講述)編程題:第一題:解析頭文件,簡單來說就是大寫字母小寫之母通過一些特定的規(guī)則進(jìn)行轉(zhuǎn)換,具體題目要求忘了…(AC)#include #incl
    發(fā)表于 12-21 07:50

    磁盤碎片整理的工作原理是什么?

    磁盤碎片整理的工作原理是什么? “磁盤碎片整理”這個術(shù)語通常用于指代Microsoft Windows中稱為磁盤碎片整理程序的應(yīng)用程序。它的設(shè)計目的是解決一個由于硬盤存儲
    發(fā)表于 07-30 08:17 ?4206次閱讀

    如何加快磁盤碎片整理速度

    如何加快磁盤碎片整理速度 本文介紹可以幫助我們加快系統(tǒng)整理磁盤碎片速度的幾個技巧?! ?   關(guān)閉應(yīng)用程序  
    發(fā)表于 02-23 14:09 ?497次閱讀

    如何避免Linux的物理內(nèi)存碎片

    Linux buddyy系統(tǒng)是linux kernel比較穩(wěn)定的一個模塊,但是并不是說它沒有缺陷,Linux內(nèi)存管理系統(tǒng)自誕生之日,就一直存在物理內(nèi)存碎片化的問題:在系統(tǒng)啟動并且運(yùn)行很長一段時間后
    的頭像 發(fā)表于 05-01 16:43 ?5478次閱讀
    如何避免Linux的<b class='flag-5'>物理</b>內(nèi)存<b class='flag-5'>碎片</b>化

    你知道linux kernel內(nèi)存碎片防治技術(shù)?

    Linux kernel組織管理物理內(nèi)存的方式是buddy system(伙伴系統(tǒng)),而物理內(nèi)存碎片正式buddy system的弱點(diǎn)之一,為了預(yù)防以及解決碎片問題,kernel采取了
    發(fā)表于 05-10 10:59 ?963次閱讀

    系統(tǒng)碎片是什么?是怎么產(chǎn)生的?為什么會產(chǎn)生?

    系統(tǒng)碎片是系統(tǒng)頻繁地刪除文件再寫入文件造成的。理論上,只要刪除文件再寫入就有碎片,重復(fù)的越多,碎片
    的頭像 發(fā)表于 01-21 11:14 ?2.8w次閱讀

    物聯(lián)網(wǎng)的技術(shù)碎片化與業(yè)務(wù)碎片化資料下載

    電子發(fā)燒友網(wǎng)為你提供物聯(lián)網(wǎng)的技術(shù)碎片化與業(yè)務(wù)碎片化資料下載的電子資料下載,更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計、用戶指南、解決方案等資料,希望可以幫助到廣大的電子工程師們。
    發(fā)表于 04-07 08:50 ?34次下載
    物聯(lián)網(wǎng)的技術(shù)<b class='flag-5'>碎片</b>化與業(yè)務(wù)<b class='flag-5'>碎片</b>化資料下載

    濺射工藝對晶片碎片的影響

      介紹了半導(dǎo)體晶片制造設(shè)備濺射機(jī)和濺射工藝對晶片碎片的影響,給出了如何減少晶片應(yīng)力以達(dá)到少碎片的目的。
    發(fā)表于 03-10 14:45 ?2次下載

    FreeRTOS內(nèi)存碎片是怎么來的

    內(nèi)存碎片 在看 FreeRTOS的內(nèi)存分配方法之前我們先來看一下什么叫做內(nèi)存碎片,看名字就知道是小塊的、碎片化的內(nèi)存。那么內(nèi)存碎片是怎么來的呢?內(nèi)存
    的頭像 發(fā)表于 07-30 10:29 ?926次閱讀
    FreeRTOS內(nèi)存<b class='flag-5'>碎片</b>是怎么來的

    如何解決內(nèi)存碎片與內(nèi)存交換效率慢的問題

    內(nèi)存分頁 分段的好處是能產(chǎn)生連續(xù)的內(nèi)存空間,但是會出現(xiàn)大量內(nèi)存碎片與內(nèi)存交換效率低的問題 先思考一下怎么解決這兩個問題,內(nèi)存碎片是由多個不連續(xù)的小物理內(nèi)存空間造成,如果把這些不連續(xù)的小物理
    的頭像 發(fā)表于 10-09 16:57 ?1077次閱讀
    如何解決內(nèi)存<b class='flag-5'>碎片</b>與內(nèi)存交換效率慢的問題

    mysql磁盤碎片整理

    背景 數(shù)據(jù)結(jié)轉(zhuǎn)過程中經(jīng)常進(jìn)行 delete 操作,產(chǎn)生空白空間,如果進(jìn)行新的插入操作,MySQL將嘗試?yán)眠@些留空的區(qū)域,但仍然無法將其徹底占用,于是造成了數(shù)據(jù)的存儲位置不連續(xù),以及物理存儲順序
    的頭像 發(fā)表于 08-27 15:26 ?296次閱讀
    mysql磁盤<b class='flag-5'>碎片</b>整理