我們這個(gè)自制文件系統(tǒng),就是想從形意結(jié)合,讓讀者朋友能夠跟隨著筆者一起經(jīng)歷一次文件系統(tǒng)由 0 到 1 的過(guò)程,構(gòu)建好知識(shí)框架,后續(xù)的深造將會(huì)得心應(yīng)手。
好,話不多說(shuō),我們先從什么是文件系統(tǒng)講起,簡(jiǎn)單介紹一些探索文件系統(tǒng)的基礎(chǔ)知識(shí)。
1 查看現(xiàn)有文件系統(tǒng)實(shí)例
Linux 文件系統(tǒng)相比大家都使用過(guò)。大家在自己的 Linux 上機(jī)器上執(zhí)行 mount 命令就能看到當(dāng)前系統(tǒng)上掛載的所有文件系統(tǒng):
mount
示例如下:
root@localhost:~# mount
sysfs on /sys type sysfs (rw,nosuid,nodev,noexec,relatime,seclabel)
proc on /proc type proc (rw,nosuid,nodev,noexec,relatime)
/dev/mapper/cl-root on / type xfs (rw,relatime,seclabel,attr2,inode64,noquota)
。。。。
比如通過(guò)這一行信息我們能看出來(lái):
sysfs on /sys type sysfs (ro,nosuid,nodev,noexec,relatime)
信息拆解分析:
sysfs:文件系統(tǒng)名稱;
/sys :文件系統(tǒng)目錄掛載點(diǎn);
sysfs:文件系統(tǒng)類(lèi)型
(ro,nosuid,nodev,noexec,relatime):掛載參數(shù)
這里蘊(yùn)含的重要信息:
同一個(gè)文件系統(tǒng)類(lèi)型可以創(chuàng)建多個(gè)實(shí)例,掛載在不同的掛載點(diǎn),就跟面向?qū)ο罄锏念?lèi)和實(shí)例的關(guān)系;
掛載點(diǎn)必須是目錄;
其實(shí),mount 這個(gè)命令很強(qiáng)大,不僅能 list 所有的文件系統(tǒng),還能掛載文件系統(tǒng)。如下:
掛載文件系統(tǒng)命令:
# 把已經(jīng)格式化好的 /dev/sdb1 盤(pán)掛到 /mnt 目錄上
mount -t ext4 /dev/sdb1 /mnt/
對(duì)應(yīng)卸載文件系統(tǒng)命令:
# 卸載 /mnt 的掛載點(diǎn)
umount /mnt
2 查看目錄掛載的文件系統(tǒng)用量
mount 命令能看到所有的掛載列表,但是如果你想要看到所有文件系統(tǒng)的使用情況,則需要另一個(gè)命令:df。df 命令用來(lái)查看當(dāng)前操作系統(tǒng)掛載的文件系統(tǒng)和使用情況:
df -Tha
-T 參數(shù)能夠讓你看到所有的文件系統(tǒng)實(shí)例的類(lèi)型;
-h 參數(shù)能夠以更符合人類(lèi)的友好的形式展示數(shù)據(jù);
-a 參數(shù)展示所有的文件系統(tǒng),包括 0 Blocks 的文件系統(tǒng)(默認(rèn)是會(huì)過(guò)濾掉的);
示例如下:
root@localhost:~# df -ahT
Filesystem Type Size Used Avail Use% Mounted on
sysfs sysfs 0 0 0 - /sys
proc proc 0 0 0 - /proc
/dev/mapper/cl-root xfs 17G 11G 7.0G 60% /
。。。
注意,如果 df 沒(méi)有加 -a 參數(shù),類(lèi)似于上面 sysfs,proc 這種用量 0 的會(huì)被過(guò)濾掉。這也是 mount 和 df 兩個(gè)命令默認(rèn)顯式信息的區(qū)別。
3 查看文件系統(tǒng)掛載配置
文件系統(tǒng)掛載可以通過(guò) mount 命令直接掛載,但是 mount 命令掛載并沒(méi)有持久化,關(guān)機(jī)重啟就沒(méi)了。所以想要關(guān)機(jī)重啟之后,還能自動(dòng)掛載到指定目錄,那么就要把掛載規(guī)則寫(xiě)到 /etc/fstab 文件中,fstab 就是 fs table 的縮寫(xiě),很容易理解。
操作系統(tǒng)在啟動(dòng)的時(shí)候,就會(huì)解析這個(gè)文件,并按照這個(gè)文件里的配置,自動(dòng)掛載文件系統(tǒng)了。
如下:
root@localhost:~# cat /etc/fstab
/dev/mapper/cl-root / xfs defaults 0 0
UUID=600e3771-af4a-48ca-a557-02204c9a48a5 /boot ext4 defaults 1 2
/dev/mapper/cl-swap swap swap defaults 0 0
fstab 的文件格式:
《設(shè)備標(biāo)識(shí)》 《掛載目錄》 《文件系統(tǒng)類(lèi)型》 《掛載參數(shù)》 《dump選項(xiàng)》 《fsck選項(xiàng)》
從左到右參數(shù)拆解:
設(shè)備標(biāo)識(shí):能夠標(biāo)識(shí)到唯一的文件系統(tǒng)所在的設(shè)備,這里可以是設(shè)備路徑,也可以是 LABEL,或者 UUID;
掛載目錄:文件系統(tǒng)掛載的目錄點(diǎn);
文件系統(tǒng)類(lèi)型:比如 ext4,ext2,xfs 之類(lèi)的;
掛載參數(shù):可以填 defaults,也可以精細(xì)化配置,比如只讀還是可寫(xiě)(rw/ro),同步刷盤(pán)還是異步(async/sync),等等;
dump選項(xiàng):讓你能控制文件系統(tǒng)備份的頻率,0 表示不備份;
fsck選項(xiàng):讓你控制是否開(kāi)機(jī)用 fsck 自檢,0 表示不要;
4 查看內(nèi)核支持的文件系統(tǒng)
這個(gè)直接去看內(nèi)核模塊即可:
ls /lib/modules/${kernel_version}/kernel/fs/
不同的 Linux 發(fā)行版略有不同,比如,centos 一般為:
ls -l /lib/modules/4.18.0-80.el8.x86_64/kernel/fs/
ubuntu 一般為:
ls -l /lib/modules/4.4.0-142-generic/kernel/fs/
在對(duì)應(yīng)的目錄找到對(duì)應(yīng)的 .ko 模塊,比如 ext4.ko ,如果想看內(nèi)核已經(jīng)加載的內(nèi)核模塊,可以調(diào)用 lsmod 看到。
簡(jiǎn)單普及一下 .ko 模塊的知識(shí):
ko 其實(shí)是 kernel object 的縮寫(xiě),這類(lèi)文件存在的意義其實(shí)和用戶態(tài)的 .so 庫(kù)類(lèi)似,都是為了模塊化的編程實(shí)踐。內(nèi)核把核心主干框架之外的功能拆解成模塊,需要的時(shí)候就加載 ko 模塊,不需要的時(shí)候卸載即可。這樣帶來(lái)的好處就是方便開(kāi)發(fā)和使用,保持內(nèi)核的核心代碼極度精煉。
類(lèi)似于文件系統(tǒng),硬件驅(qū)動(dòng)等等,都是以這種形式來(lái)加載使用的。
開(kāi)發(fā)文件系統(tǒng)為什么難?
為什么文件系統(tǒng)的開(kāi)發(fā)大家會(huì)覺(jué)得非常難?原因其實(shí)不在于實(shí)現(xiàn),而在于調(diào)試和排障,因?yàn)樵缙谖募到y(tǒng)的開(kāi)發(fā)只能在內(nèi)核之中,這個(gè)帶來(lái)了非常高的門(mén)檻。
1 內(nèi)核文件系統(tǒng)
因?yàn)樵诖酥拔覀兛吹搅宋募到y(tǒng)是位于內(nèi)核之中, vfs 之下,塊存儲(chǔ)模塊之上的一個(gè)位置。對(duì)外呈現(xiàn)文件存儲(chǔ)實(shí)現(xiàn),對(duì)下管理裸塊設(shè)備。劃重點(diǎn),文件系統(tǒng)是位于內(nèi)核的一個(gè)模塊,那就可以理解了,內(nèi)核模塊的開(kāi)發(fā)之所以艱難就是難在調(diào)試和排障,用戶態(tài)的程序你可以隨意 debug,出問(wèn)題最多也就是 panic,coredump,內(nèi)核態(tài)的程序出了文件就是宕機(jī),所有現(xiàn)場(chǎng)都丟失,你只能通過(guò)日志,kdump 等手段來(lái)排查。并且內(nèi)核態(tài)程序的編寫(xiě)是要注意非常多的規(guī)范的,比如內(nèi)存分配,比用戶態(tài)的要謹(jǐn)慎的多。
那怎么辦?我們本次的目標(biāo)是要自制實(shí)現(xiàn)一個(gè)極簡(jiǎn)的文件系統(tǒng),但總不能帶大家趟一次內(nèi)核開(kāi)發(fā)的坑吧!那可是要嚇退 99% 的小伙伴。
有辦法的,內(nèi)核開(kāi)發(fā)者考慮到了這個(gè)問(wèn)題,又考慮到文件系統(tǒng)的需求是千變?nèi)f化的,所以提供了一種手段,把 IO 路徑導(dǎo)向用戶態(tài),由用戶態(tài)程序捕獲到 IO ,從而實(shí)現(xiàn)文件的存儲(chǔ),這個(gè)機(jī)制就叫 FUSE 機(jī)制。
2 FUSE 文件系統(tǒng)
作為自制 FS 系列第一篇,我們不講 FUSE 的實(shí)現(xiàn),而是通過(guò)一個(gè)動(dòng)畫(huà)來(lái)演示 IO 的旅途:
這里的路徑做了一些簡(jiǎn)化,簡(jiǎn)化了用戶態(tài)之上的邏輯處理,為什么路徑是這樣子?什么是 FUSE ?下篇專(zhuān)題解釋。
總結(jié)
本篇文章是為后續(xù)鋪墊一些基礎(chǔ)知識(shí),從形的方面,系統(tǒng)介紹了一些命令,告訴你文件系統(tǒng)怎么配置,怎么掛載,怎么查看,怎么獲取到使用詳情。這些基礎(chǔ)知識(shí)在后面自制文件系統(tǒng)的時(shí)候,都要用上。這些 Linux 命令都是幫助我們從文件系統(tǒng)的外圍去用,去摸,去嗅,從而再去深入理解。
我們目標(biāo)不止如此,我們是要親手做一個(gè)文件系統(tǒng),動(dòng)手做過(guò)一遍的東西,你對(duì)它理解也將會(huì)突飛猛進(jìn),更加深刻。
下面總結(jié)一下上面的基礎(chǔ)以上的知識(shí):
mount 用來(lái)列舉查看當(dāng)前所有文件系統(tǒng)實(shí)例,也能支持掛載命令(但 mount 掛載不會(huì)持久化,重啟就沒(méi)了),umount 用來(lái)卸載;
/etc/fstab 是用來(lái)配置文件系統(tǒng)掛載規(guī)則的,是持久化的配置,重啟不丟;
df -aTh 用來(lái)查看每個(gè)文件系統(tǒng)掛載目錄的詳情,包括空間使用量,總量,掛載點(diǎn)等信息;
內(nèi)核模塊的功能以 ko 文件的形式體現(xiàn),在 /lib/modules/${kernel_version}/kernel/fs/ 目錄可以看到支持的內(nèi)核文件系統(tǒng)模塊,lsmod 命令可以看到已經(jīng)加載的內(nèi)核模塊;
文件系統(tǒng)開(kāi)發(fā)之所以難?是因?yàn)橹霸趦?nèi)核中開(kāi)發(fā),內(nèi)核開(kāi)發(fā)最難的在于調(diào)試和排障手段不方便。那文件系統(tǒng)還有出路嗎?有,奇伢帶你自制一個(gè)極簡(jiǎn)的文件系統(tǒng),基于 Linux 系統(tǒng)使用純 Go 語(yǔ)言來(lái)做哦,敬請(qǐng)期待后續(xù),自己動(dòng)手,理解更深。
責(zé)任編輯:lq6
-
Linux
+關(guān)注
關(guān)注
87文章
11304瀏覽量
209521 -
文件系統(tǒng)
+關(guān)注
關(guān)注
0文章
284瀏覽量
19911
原文標(biāo)題:自制文件系統(tǒng):文件系統(tǒng)的樣子
文章出處:【微信號(hào):LinuxHub,微信公眾號(hào):Linux愛(ài)好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論