本文以 32 位系統(tǒng)為例介紹內(nèi)核空間(kernel space)和用戶空間(user space)。
內(nèi)核空間和用戶空間
對 32 位操作系統(tǒng)而言,它的尋址空間(虛擬地址空間,或叫線性地址空間)為 4G(2的32次方)。也就是說一個進(jìn)程的最大地址空間為 4G。
操作系統(tǒng)的核心是內(nèi)核(kernel),它獨(dú)立于普通的應(yīng)用程序,可以訪問受保護(hù)的內(nèi)存空間,也有訪問底層硬件設(shè)備的所有權(quán)限。為了保證內(nèi)核的安全,現(xiàn)在的操作系統(tǒng)一般都強(qiáng)制用戶進(jìn)程不能直接操作內(nèi)核。
具體的實(shí)現(xiàn)方式基本都是由操作系統(tǒng)將虛擬地址空間劃分為兩部分,一部分為內(nèi)核空間,另一部分為用戶空間。針對 Linux 操作系統(tǒng)而言,最高的 1G 字節(jié)(從虛擬地址 0xC0000000 到 0xFFFFFFFF)由內(nèi)核使用,稱為內(nèi)核空間。而較低的 3G 字節(jié)(從虛擬地址 0x00000000 到 0xBFFFFFFF)由各個進(jìn)程使用,稱為用戶空間。
對上面這段內(nèi)容我們可以這樣理解:「每個進(jìn)程的 4G 地址空間中,最高 1G 都是一樣的,即內(nèi)核空間。只有剩余的 3G 才歸進(jìn)程自己使用?!?/p>
「換句話說就是, 最高 1G 的內(nèi)核空間是被所有進(jìn)程共享的!」下圖描述了每個進(jìn)程 4G 地址空間的分配情況(此圖來自互聯(lián)網(wǎng)):
為什么需要區(qū)分內(nèi)核空間與用戶空間
在 CPU 的所有指令中,有些指令是非常危險的,如果錯用,將導(dǎo)致系統(tǒng)崩潰,比如清內(nèi)存、設(shè)置時鐘等。如果允許所有的程序都可以使用這些指令,那么系統(tǒng)崩潰的概率將大大增加。
所以,CPU 將指令分為特權(quán)指令和非特權(quán)指令,對于那些危險的指令,只允許操作系統(tǒng)及其相關(guān)模塊使用,普通應(yīng)用程序只能使用那些不會造成災(zāi)難的指令。
比如 Intel 的 CPU 將特權(quán)等級分為 4 個級別:Ring0~Ring3。其實(shí) Linux 系統(tǒng)只使用了 Ring0 和 Ring3 兩個運(yùn)行級別(Windows 系統(tǒng)也是一樣的)。
當(dāng)進(jìn)程運(yùn)行在 Ring3 級別時被稱為運(yùn)行在用戶態(tài),而運(yùn)行在 Ring0 級別時被稱為運(yùn)行在內(nèi)核態(tài)。
內(nèi)核態(tài)與用戶態(tài)
好了我們現(xiàn)在需要再解釋一下什么是內(nèi)核態(tài)、用戶態(tài):「當(dāng)進(jìn)程運(yùn)行在內(nèi)核空間時就處于內(nèi)核態(tài),而進(jìn)程運(yùn)行在用戶空間時則處于用戶態(tài)?!?/p>
在內(nèi)核態(tài)下,進(jìn)程運(yùn)行在內(nèi)核地址空間中,此時 CPU 可以執(zhí)行任何指令。運(yùn)行的代碼也不受任何的限制,可以自由地訪問任何有效地址,也可以直接進(jìn)行端口的訪問。
在用戶態(tài)下,進(jìn)程運(yùn)行在用戶地址空間中,被執(zhí)行的代碼要受到 CPU 的諸多檢查,它們只能訪問映射其地址空間的頁表項中規(guī)定的在用戶態(tài)下可訪問頁面的虛擬地址,且只能對任務(wù)狀態(tài)段(TSS)中 I/O 許可位圖(I/O Permission Bitmap)中規(guī)定的可訪問端口進(jìn)行直接訪問。
對于以前的 DOS 操作系統(tǒng)來說,是沒有內(nèi)核空間、用戶空間以及內(nèi)核態(tài)、用戶態(tài)這些概念的。可以認(rèn)為所有的代碼都是運(yùn)行在內(nèi)核態(tài)的,因而用戶編寫的應(yīng)用程序代碼可以很容易的讓操作系統(tǒng)崩潰掉。
對于 Linux 來說,通過區(qū)分內(nèi)核空間和用戶空間的設(shè)計,隔離了操作系統(tǒng)代碼(操作系統(tǒng)的代碼要比應(yīng)用程序的代碼健壯很多)與應(yīng)用程序代碼。
即便是單個應(yīng)用程序出現(xiàn)錯誤也不會影響到操作系統(tǒng)的穩(wěn)定性,這樣其它的程序還可以正常的運(yùn)行(Linux 可是個多任務(wù)系統(tǒng)啊!)。
「所以,區(qū)分內(nèi)核空間和用戶空間本質(zhì)上是要提高操作系統(tǒng)的穩(wěn)定性及可用性?!?/p>
如何從用戶空間進(jìn)入內(nèi)核空間
其實(shí)所有的系統(tǒng)資源管理都是在內(nèi)核空間中完成的。比如讀寫磁盤文件,分配回收內(nèi)存,從網(wǎng)絡(luò)接口讀寫數(shù)據(jù)等等。
我們的應(yīng)用程序是無法直接進(jìn)行這樣的操作的。但是我們可以通過內(nèi)核提供的接口來完成這樣的任務(wù)。
比如應(yīng)用程序要讀取磁盤上的一個文件,它可以向內(nèi)核發(fā)起一個 "系統(tǒng)調(diào)用" 告訴內(nèi)核:"我要讀取磁盤上的某某文件"。
其實(shí)就是通過一個特殊的指令讓進(jìn)程從用戶態(tài)進(jìn)入到內(nèi)核態(tài)(到了內(nèi)核空間),在內(nèi)核空間中,CPU 可以執(zhí)行任何的指令,當(dāng)然也包括從磁盤上讀取數(shù)據(jù)。具體過程是先把數(shù)據(jù)讀取到內(nèi)核空間中,然后再把數(shù)據(jù)拷貝到用戶空間并從內(nèi)核態(tài)切換到用戶態(tài)。
此時應(yīng)用程序已經(jīng)從系統(tǒng)調(diào)用中返回并且拿到了想要的數(shù)據(jù),可以開開心心的往下執(zhí)行了。簡單說就是應(yīng)用程序把高科技的事情(從磁盤讀取文件)外包給了系統(tǒng)內(nèi)核,系統(tǒng)內(nèi)核做這些事情既專業(yè)又高效。
對于一個進(jìn)程來講,從用戶空間進(jìn)入內(nèi)核空間并最終返回到用戶空間,這個過程是十分復(fù)雜的。舉個例子,比如我們經(jīng)常接觸的概念 "堆棧",其實(shí)進(jìn)程在內(nèi)核態(tài)和用戶態(tài)各有一個堆棧。
運(yùn)行在用戶空間時進(jìn)程使用的是用戶空間中的堆棧,而運(yùn)行在內(nèi)核空間時,進(jìn)程使用的是內(nèi)核空間中的堆棧。所以說,Linux 中每個進(jìn)程有兩個棧,分別用于用戶態(tài)和內(nèi)核態(tài)。
下圖簡明的描述了用戶態(tài)與內(nèi)核態(tài)之間的轉(zhuǎn)換:
既然用戶態(tài)的進(jìn)程必須切換成內(nèi)核態(tài)才能使用系統(tǒng)的資源,那么我們接下來就看看進(jìn)程一共有多少種方式可以從用戶態(tài)進(jìn)入到內(nèi)核態(tài)。
概括的說,有三種方式:系統(tǒng)調(diào)用、軟中斷和硬件中斷。這三種方式每一種都涉及到大量的操作系統(tǒng)知識,所以這里不做展開。
整體結(jié)構(gòu)
接下來我們從內(nèi)核空間和用戶空間的角度看一看整個 Linux 系統(tǒng)的結(jié)構(gòu)。它大體可以分為三個部分,從下往上依次為:硬件 -> 內(nèi)核空間 -> 用戶空間。如下圖所示(此圖來自互聯(lián)網(wǎng)):
在硬件之上,內(nèi)核空間中的代碼控制了硬件資源的使用權(quán),用戶空間中的代碼只有通過內(nèi)核暴露的系統(tǒng)調(diào)用接口(System Call Interface)才能使用到系統(tǒng)中的硬件資源。其實(shí),不光是 Linux,Windows 操作系統(tǒng)的設(shè)計也是大同小異。
實(shí)際上我們可以將每個處理器在任何指定時間點(diǎn)上的活動概括為下列三者之一:
運(yùn)行于用戶空間,執(zhí)行用戶進(jìn)程。
運(yùn)行于內(nèi)核空間,處于進(jìn)程上下文,代表某個特定的進(jìn)程執(zhí)行。
運(yùn)行于內(nèi)核空間,處于中斷上下文,與任何進(jìn)程無關(guān),處理某個特定的中斷。
以上三點(diǎn)幾乎包括所有的情況,比如當(dāng) CPU 空閑時,內(nèi)核就運(yùn)行一個空進(jìn)程,處于進(jìn)程上下文,但運(yùn)行在內(nèi)核空間。
說明:Linux 系統(tǒng)的中斷服務(wù)程序不在進(jìn)程的上下文中執(zhí)行,它們在一個與所有進(jìn)程都無關(guān)的、專門的中斷上下文中執(zhí)行。
之所以存在一個專門的執(zhí)行環(huán)境,就是為了保證中斷服務(wù)程序能夠在第一時間響應(yīng)和處理中斷請求,然后快速地退出。
總結(jié)
現(xiàn)代的操作系統(tǒng)大都通過內(nèi)核空間和用戶空間的設(shè)計來保護(hù)操作系統(tǒng)自身的安全性和穩(wěn)定性。所以在我們閱讀有關(guān)操作系統(tǒng)的資料時經(jīng)常遇到內(nèi)核空間、用戶空間和內(nèi)核態(tài)、用戶態(tài)等概念,希望本文能夠幫助您理解這些基本的概念。
責(zé)任編輯:xj
原文標(biāo)題:Linux系統(tǒng)中,為什么需要區(qū)分內(nèi)核空間與用戶空間?
-
嵌入式
+關(guān)注
關(guān)注
5088文章
19158瀏覽量
306477 -
內(nèi)核
+關(guān)注
關(guān)注
3文章
1378瀏覽量
40345 -
Linux
+關(guān)注
關(guān)注
87文章
11329瀏覽量
209969
原文標(biāo)題:Linux系統(tǒng)中,為什么需要區(qū)分內(nèi)核空間與用戶空間?
文章出處:【微信號:gh_c472c2199c88,微信公眾號:嵌入式微處理器】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論