在現(xiàn)代操作系統(tǒng)里,同一時間可能有多個內(nèi)核執(zhí)行流在執(zhí)行,因此內(nèi)核其實(shí)象多進(jìn)程多線程編程一樣也需要一些同步機(jī)制來同步各執(zhí)行單元對共享數(shù)據(jù)的訪問。尤其是在多處理器系統(tǒng)上,更需要一些同步機(jī)制來同步不同處理器上的執(zhí)行單元對共享的數(shù)據(jù)的訪問。
在主流的Linux內(nèi)核中包含了幾乎所有現(xiàn)代的操作系統(tǒng)具有的同步機(jī)制,這些同步機(jī)制包括:原子操作、信號量(semaphore)、讀寫信號量(rw_semaphore)、spinlock、BKL(Big Kernel Lock)、rwlock、brlock(只包含在2.4內(nèi)核中)、RCU(只包含在2.6內(nèi)核中)和seqlock(只包含在2.6內(nèi)核中)。
比較經(jīng)典的有原子操作、spin_lock(忙等待的鎖)、mutex(互斥鎖)、semaphore(信號量)等。并且它們幾乎都有對應(yīng)的rw_XXX(讀寫鎖),以便在能夠區(qū)分讀與寫的情況下,讓讀操作相互不互斥(讀寫、寫寫依然互斥)。而seqlock和rcu應(yīng)該可以不算在經(jīng)典之列,它們是兩種比較有意思的同步機(jī)制。
原子操作
原子操作就是指某一個操作在執(zhí)行過程中不可以被打斷,要么全部執(zhí)行,要不就一點(diǎn)也不執(zhí)行。原子操作需要硬件的支持,與體系結(jié)構(gòu)相關(guān),使用匯編語言實(shí)現(xiàn)。原子操作主要用于實(shí)現(xiàn)資源計(jì)數(shù),很多引用計(jì)數(shù)就是通過原子操作實(shí)現(xiàn)。Linux中提供了兩種原子操作接口,分別是原子整數(shù)操作和原子位操作。
原子整數(shù)操作只對atomic_t類型的數(shù)據(jù)進(jìn)行操作,不能對C語言的int進(jìn)行操作,使用atomic_t只能將其作為24位數(shù)據(jù)處理,主要是在SPARC體系結(jié)構(gòu)中int的低8為中設(shè)置了一個鎖,避免對原子類型數(shù)據(jù)的并發(fā)訪問。
原子位操作是針對由指針變量指定的任意一塊內(nèi)存區(qū)域的位序列的某一位進(jìn)行操作。它只是針對普通指針的操作,不需要定義一個與該操作相對應(yīng)的數(shù)據(jù)類型。
原子類型定義如下:
typedefstruct { volatile int counter; }atomic_t;
volatile修飾字段告訴gcc不要對該類型的數(shù)據(jù)做優(yōu)化處理,對它的訪問都是對內(nèi)存的訪問,而不是對寄存器的訪問。
原子操作API包括:
atomic_read(atomic_t* v);
該函數(shù)對原子類型的變量進(jìn)行原子讀操作,它返回原子類型的變量v的值。
atomic_set(atomic_t* v, int i);
該函數(shù)設(shè)置原子類型的變量v的值為i。
voidatomic_add(int i, atomic_t *v);
該函數(shù)給原子類型的變量v增加值i。
atomic_sub(inti, atomic_t *v);
該函數(shù)從原子類型的變量v中減去i。
intatomic_sub_and_test(int i, atomic_t *v);
該函數(shù)從原子類型的變量v中減去i,并判斷結(jié)果是否為0,如果為0,返回真,否則返回假。
voidatomic_inc(atomic_t *v);
該函數(shù)對原子類型變量v原子地增加1。
voidatomic_dec(atomic_t *v);
該函數(shù)對原子類型的變量v原子地減1。
intatomic_dec_and_test(atomic_t *v);
該函數(shù)對原子類型的變量v原子地減1,并判斷結(jié)果是否為0,如果為0,返回真,否則返回假。
intatomic_inc_and_test(atomic_t *v);
該函數(shù)對原子類型的變量v原子地增加1,并判斷結(jié)果是否為0,如果為0,返回真,否則返回假。
intatomic_add_negative(int i, atomic_t*v);
該函數(shù)對原子類型的變量v原子地增加I,并判斷結(jié)果是否為負(fù)數(shù),如果是,返回真,否則返回假。
intatomic_add_return(int i, atomic_t *v);
該函數(shù)對原子類型的變量v原子地增加i,并且返回指向v的指針。
intatomic_sub_return(int i, atomic_t *v);
該函數(shù)從原子類型的變量v中減去i,并且返回指向v的指針。
intatomic_inc_return(atomic_t * v);
該函數(shù)對原子類型的變量v原子地增加1并且返回指向v的指針。
intatomic_dec_return(atomic_t * v);
該函數(shù)對原子類型的變量v原子地減1并且返回指向v的指針。
原子操作通常用于實(shí)現(xiàn)資源的引用計(jì)數(shù),在TCP/IP協(xié)議棧的IP碎片處理中,就使用了引用計(jì)數(shù),碎片隊(duì)列結(jié)構(gòu)structipq描述了一個IP碎片,字段refcnt就是引用計(jì)數(shù)器,它的類型為atomic_t,當(dāng)創(chuàng)建IP碎片時(在函數(shù)ip_frag_create中),使用atomic_set函數(shù)把它設(shè)置為1,當(dāng)引用該IP碎片時,就使用函數(shù)atomic_inc把引用計(jì)數(shù)加1,當(dāng)不需要引用該IP碎片時,就使用函數(shù)ipq_put來釋放該IP碎片,ipq_put使用函數(shù)atomic_dec_and_test把引用計(jì)數(shù)減1并判斷引用計(jì)數(shù)是否為0,如果是就釋放Ip碎片。函數(shù)ipq_kill把IP碎片從ipq隊(duì)列中刪除,并把該刪除的IP碎片的引用計(jì)數(shù)減1(通過使用函數(shù)atomic_dec實(shí)現(xiàn))。
自旋鎖
Linux自旋鎖保證了任意時刻只能有一個執(zhí)行線程進(jìn)入臨界區(qū),其他試圖進(jìn)入臨界區(qū)的線程將一直進(jìn)行嘗試(即自旋),直到獲得該鎖。自旋鎖主要應(yīng)用在加鎖時間不長并且不會睡眠的情況。
自旋鎖的本質(zhì)是對內(nèi)存區(qū)域的一個整數(shù)的操作,任何線程進(jìn)入臨界區(qū)之前都必須檢查該整數(shù),可用則進(jìn)入,都則一直忙循環(huán)等待。
自旋鎖機(jī)制讓試圖獲得該鎖的線程一直進(jìn)行忙循環(huán)(占用CPU),因此自旋鎖適合于斷時間內(nèi)進(jìn)行輕量級加鎖。而且自旋鎖絕對不可以遞歸使用,否則會被自己鎖死。
Linux自旋鎖主要應(yīng)用與多核處理器中,單CPU中不會進(jìn)行自旋鎖操作。
linux上的自旋鎖有三種實(shí)現(xiàn):
a. 在單cpu,不可搶占內(nèi)核中,自旋鎖為空操作。
b. 在單cpu,可搶占內(nèi)核中,自旋鎖實(shí)現(xiàn)為“禁止內(nèi)核搶占”,并不實(shí)現(xiàn)“自旋”。
c. 在多cpu,可搶占內(nèi)核中,自旋鎖實(shí)現(xiàn)為“禁止內(nèi)核搶占” + “自旋”。其中,禁止內(nèi)核搶占只是關(guān)閉“可搶占標(biāo)志”,而不是禁止進(jìn)程切換。顯式使用schedule或進(jìn)程阻塞(此也會導(dǎo)致調(diào)用schedule)時,還是會發(fā)生進(jìn)程調(diào)度的。
使用自旋鎖需要注意有可能造成的死鎖情況:
static DEFINE_SPINLOCK(xxx_lock);
unsigned long flags;
spin_lock_irqsave(&xxx_lock, flags);
。。。 critical section here 。。
spin_unlock_irqrestore(&xxx_lock, flags);
代碼中spin_lock_irqsave會禁止本地cpu中斷的搶占。以上代碼在任何情況下都是安全的。但問題是關(guān)中斷的代價太大。
如果把spin_lock_irqsave/spin_unlock_irqrestore換成spin_lock/spin_unlock會有什么問題嗎?
答案是,如果中斷中調(diào)用了spin_lock,可能會引起死鎖!
例如:
spin_lock(&lock);
。。。
《- interrupt comes in:
spin_lock(&lock);
值得注意的是,如果產(chǎn)生中斷的cpu和進(jìn)程中調(diào)用spin_lock的cpu不是同一個,則不會有問題。這也是irq版本的spin_lock函數(shù)實(shí)現(xiàn)時只需要禁止本地cpu中斷的原因。
結(jié)論:要想在進(jìn)程中用spin_lock代替spin_lock_irqsave,條件是中斷中不會使用相應(yīng)的spin_lock
何時使用自旋鎖?
不允許睡眠的上下文且臨界區(qū)操作較短時使用自旋鎖。
?
? ? 讀/寫自旋鎖
Linux中規(guī)定,讀/寫自旋鎖允許多個線程同時以只讀的方式訪問臨界資源,只有當(dāng)一個線程想更新數(shù)據(jù)時,才會互斥訪問資源。
讀寫自旋鎖包括一個24位讀者計(jì)數(shù)和一個解鎖標(biāo)記來實(shí)現(xiàn)的。
注意:讀寫鎖需要比spinlocks更多的訪問原子內(nèi)存操作,如果讀臨界區(qū)不是很大,最好別使用讀寫鎖。
讀寫鎖代碼:
點(diǎn)擊(此處)折疊或打開rwlock_t xxx_lock = __RW_LOCK_UNLOCKED(xxx_lock);
unsigned long flags;
read_lock_irqsave(&xxx_lock, flags);
。。 critical section that only reads the info 。。。
read_unlock_irqrestore(&xxx_lock, flags);
write_lock_irqsave(&xxx_lock, flags);
。。 read and write exclusive access to the info 。。。
write_unlock_irqrestore(&xxx_lock, flags);
讀寫鎖比較適合鏈表等數(shù)據(jù)結(jié)構(gòu),特別是查找遠(yuǎn)多于修改的情況。
另外,可以靈活的使用read-write和irq版本的自旋鎖。例如,如果中斷中只是用了讀鎖,進(jìn)程中就可以使用non-irq版本的讀鎖和irq版本的寫鎖。
注意:RCU比讀寫鎖更適合遍歷list,但需要更關(guān)注細(xì)節(jié)。目前kernel社區(qū)正在努力用RCU代替讀寫鎖。
評論