當(dāng)配置Linux內(nèi)核的時(shí)候,我們可以選擇一些參數(shù),這些參數(shù)能影響系統(tǒng)的行為。你可以用不同的優(yōu)先級(jí)、調(diào)度類(lèi)和搶占模型來(lái)工作。正確地選擇這些參數(shù)是非常重要的。
本文將論述不同的搶占模型如何影響用戶(hù)和系統(tǒng)的行為。
當(dāng)你使用 make menuconfig配置內(nèi)核的時(shí)候,你能看到這樣的菜單:
為了深入理解這三個(gè)搶占模型的區(qū)別,我們將寫(xiě)一個(gè)案例:
2個(gè)線(xiàn)程,一個(gè)高優(yōu)先級(jí)RT(50),一個(gè)低優(yōu)先級(jí)RT(30)
高優(yōu)先級(jí)的線(xiàn)程要睡眠3秒
低優(yōu)先級(jí)的線(xiàn)程用CPU來(lái)做計(jì)算
3秒后高優(yōu)先級(jí)線(xiàn)程喚醒。
如果低優(yōu)先級(jí)的線(xiàn)程陷入系統(tǒng)調(diào)用,高優(yōu)先級(jí)的線(xiàn)程睡眠到期,究竟會(huì)發(fā)生什么?下面我們來(lái)一種模型一種模型地看。
No Forced Preemption
這種情況下,上下文切換發(fā)生在系統(tǒng)調(diào)用返回用戶(hù)空間的點(diǎn)。案例如下:
2個(gè)線(xiàn)程,一個(gè)高優(yōu)先級(jí)RT(50),一個(gè)低優(yōu)先級(jí)RT(30)
高優(yōu)先級(jí)的線(xiàn)程要睡眠3秒
低優(yōu)先級(jí)的線(xiàn)程進(jìn)入系統(tǒng)調(diào)用計(jì)算5秒
5秒后低優(yōu)先級(jí)線(xiàn)程從內(nèi)核系統(tǒng)調(diào)用返回
高優(yōu)先級(jí)線(xiàn)程將醒來(lái)(但是比預(yù)期遲了2秒)。
內(nèi)核代碼,簡(jiǎn)單的字符設(shè)備:
#include
讀里面delay了5秒, 注意mdelay是一個(gè)計(jì)算型的busy-loop。
用戶(hù)空間代碼如下:
#include
實(shí)驗(yàn)步驟:
高優(yōu)先級(jí)線(xiàn)程開(kāi)始睡眠3秒
低優(yōu)先級(jí)線(xiàn)程睡眠1秒然后做系統(tǒng)調(diào)用
高優(yōu)先級(jí)線(xiàn)程6秒后醒來(lái)(stop和start的時(shí)間差)
# insmod demo.ko # ./appthread1 start time=182thread2 startthread1 stop time=188thread2 stopend test
Preemptible Kernel
這種情況內(nèi)核里面也可以搶占,意味著上述程序里面的高優(yōu)先級(jí)線(xiàn)程3秒后可醒來(lái)。
這種情況下,系統(tǒng)會(huì)有更多的上下文切換,但是實(shí)時(shí)性更加好。對(duì)于要求軟實(shí)時(shí)的嵌入式系統(tǒng)而言,這個(gè)選項(xiàng)是最佳的。但是對(duì)于服務(wù)器而言,通常第一個(gè)選項(xiàng)更好——更少的上下文切換,更多的CPU時(shí)間用作有用功。
運(yùn)行結(jié)果(stop、start時(shí)間差3秒):
# insmod ./demo.ko#./appthread1 start time=234thread2 startthread1 stop time=237thread2 stopend test
Voluntary Kernel Preemption
這種情況和第一種情況"no forced preemption"類(lèi)似,但是內(nèi)核開(kāi)發(fā)者可以在進(jìn)行復(fù)雜操作的時(shí)候,時(shí)不時(shí)檢查一下是否可以reschedule。他們可以調(diào)用might_resched()函數(shù)。
在下面的代碼中,我們添加了一些檢查點(diǎn)(check point)
// callback for read system call on the devicestatic ssize_t my_read(struct file *file, char __user *buf,size_t count,loff_t *ppos){ int len=5; if(*ppos > 0) { return 0; } mdelay(4000); // busy-wait for 4 seconds might_resched(); delay(3000); // busy wait for 3 seconds if (copy_to_user(buf , "hello" , len)) { return -EFAULT; } else { *ppos +=len; return len; }}
如果我們把might_resched()注釋掉,它會(huì)delay 7秒。
添加cond_resched()調(diào)用將導(dǎo)致系統(tǒng)檢查是否有高優(yōu)先級(jí)的任務(wù)被喚醒,這樣高優(yōu)先級(jí)任務(wù)5秒可以醒來(lái)(其中1秒在systemcall之前,另外4秒在kernel)。
運(yùn)行結(jié)果:
#insmod./demo.ko#./appthread1 start time=320thread2 startthread1 stop time=325thread2 stopend test
Full Real Time Preemption
如果我們使能RT補(bǔ)丁,我們會(huì)得到一個(gè)硬實(shí)時(shí)的kernel。這意味著任何代碼可以搶占任何人。比如一個(gè)更加緊急的任務(wù)可以搶占中斷服務(wù)程序ISR。這個(gè)patch進(jìn)行了如下改動(dòng):
把中斷服務(wù)程序轉(zhuǎn)化為優(yōu)先級(jí)是50的RT線(xiàn)程
把softIRQ轉(zhuǎn)化為優(yōu)先級(jí)是49的RT線(xiàn)程
把所有的spinlock變成mutex
其他的細(xì)小改動(dòng)
打補(bǔ)丁后會(huì)看到2個(gè)新增的菜單:
其中“Preemptible Kernel (Basic RT)” 是為了調(diào)試目的的,為了全面使用RT補(bǔ)丁的功能,我們應(yīng)該選擇最后一項(xiàng) – Fully Preemptible Kernel。這樣我們會(huì)有更多的上下文切換,但是可以滿(mǎn)足RT的實(shí)時(shí)要求。
-
內(nèi)核
+關(guān)注
關(guān)注
3文章
1376瀏覽量
40316 -
Linux
+關(guān)注
關(guān)注
87文章
11314瀏覽量
209807
原文標(biāo)題:理解Linux內(nèi)核搶占模型(最透徹一篇)
文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場(chǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論