0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Linux內(nèi)核同步機制之原子操作

Linux閱碼場 ? 來源:lq ? 2018-12-13 14:05 ? 次閱讀

一、源由

我們的程序邏輯經(jīng)常遇到這樣的操作序列:

1、讀一個位于memory中的變量的值到寄存器

2、修改該變量的值(也就是修改寄存器中的值)

3、將寄存器中的數(shù)值寫回memory中的變量值

如果這個操作序列是串行化的操作(在一個thread中串行執(zhí)行),那么一切OK,然而,世界總是不能如你所愿。在多CPU體系結(jié)構(gòu)中,運行在兩個CPU上的兩個內(nèi)核控制路徑同時并行執(zhí)行上面操作序列,有可能發(fā)生下面的場景:

多個CPUs和memory chip是通過總線互聯(lián)的,在任意時刻,只能有一個總線master設(shè)備(例如CPU、DMA controller)訪問該Slave設(shè)備(在這個場景中,slave設(shè)備是RAM chip)。因此,來自兩個CPU上的讀memory操作被串行化執(zhí)行,分別獲得了同樣的舊值。完成修改后,兩個CPU都想進行寫操作,把修改的值寫回到memory。但是,硬件arbiter的限制使得CPU的寫回必須是串行化的,因此CPU1首先獲得了訪問權(quán),進行寫回動作,隨后,CPU2完成寫回動作。在這種情況下,CPU1的對memory的修改被CPU2的操作覆蓋了,因此執(zhí)行結(jié)果是錯誤的。

不僅是多CPU,在單CPU上也會由于有多個內(nèi)核控制路徑的交錯而導(dǎo)致上面描述的錯誤。一個具體的例子如下:

系統(tǒng)調(diào)用的控制路徑上,完成讀操作后,硬件觸發(fā)中斷,開始執(zhí)行中斷handler。這種場景下,中斷handler控制路徑的寫回的操作被系統(tǒng)調(diào)用控制路徑上的寫回覆蓋了,結(jié)果也是錯誤的。

二、對策

對于那些有多個內(nèi)核控制路徑進行read-modify-write的變量,內(nèi)核提供了一個特殊的類型atomic_t,具體定義如下:

從上面的定義來看,atomic_t實際上就是一個int類型的counter,不過定義這樣特殊的類型atomic_t是有其思考的:內(nèi)核定義了若干atomic_xxx的接口API函數(shù),這些函數(shù)只會接收atomic_t類型的參數(shù)。這樣可以確保atomic_xxx的接口函數(shù)只會操作atomic_t類型的數(shù)據(jù)。同樣的,如果你定義了atomic_t類型的變量(你期望用atomic_xxx的接口API函數(shù)操作它),這些變量也不會被那些普通的、非原子變量操作的API函數(shù)接受。

具體的接口API函數(shù)整理如下:

三、ARM中的實現(xiàn)

我們以atomic_add為例,描述linux kernel中原子操作的具體代碼實現(xiàn)細節(jié):

(1)ARMv6之前的CPU并不支持SMP,之后的ARM架構(gòu)都是支持SMP的(例如我們熟悉的ARMv7-A)。因此,對于ARM處理,其原子操作分成了兩個陣營,一個是支持SMP的ARMv6之后的CPU,另外一個就是ARMv6之前的,只有單核架構(gòu)的CPU。對于UP,原子操作就是通過關(guān)閉CPU中斷來完成的。

(2)這里的代碼和preloading cache相關(guān)。在strex指令之前將要操作的memory內(nèi)容加載到cache中可以顯著提高性能。

(3)為了完整性,我還是重復(fù)一下匯編嵌入c代碼的語法:嵌入式匯編的語法格式是:asm(code : output operand list : input operand list : clobber list)。output operand list 和 input operand list是c代碼和嵌入式匯編代碼的接口,clobber list描述了匯編代碼對寄存器的修改情況。為何要有clober list?我們的c代碼是gcc來處理的,當(dāng)遇到嵌入?yún)R編代碼的時候,gcc會將這些嵌入式匯編的文本送給gas進行后續(xù)處理。這樣,gcc需要了解嵌入?yún)R編代碼對寄存器的修改情況,否則有可能會造成大麻煩。例如:gcc對c代碼進行處理,將某些變量值保存在寄存器中,如果嵌入?yún)R編修改了該寄存器的值,又沒有通知gcc的話,那么,gcc會以為寄存器中仍然保存了之前的變量值,因此不會重新加載該變量到寄存器,而是直接使用這個被嵌入式匯編修改的寄存器,這時候,我們唯一能做的就是靜靜的等待程序的崩潰。還好,在output operand list 和 input operand list中涉及的寄存器都不需要體現(xiàn)在clobber list中(gcc分配了這些寄存器,當(dāng)然知道嵌入?yún)R編代碼會修改其內(nèi)容),因此,大部分的嵌入式匯編的clobber list都是空的,或者只有一個cc,通知gcc,嵌入式匯編代碼更新了condition code register。

大家對著上面的code就可以分開各段內(nèi)容了。@符號標(biāo)識該行是注釋。

這里的__volatile__主要是用來防止編譯器優(yōu)化的。也就是說,在編譯該c代碼的時候,如果使用優(yōu)化選項(-O)進行編譯,對于那些沒有聲明__volatile__的嵌入式匯編,編譯器有可能會對嵌入c代碼的匯編進行優(yōu)化,編譯的結(jié)果可能不是原來你撰寫的匯編代碼,但是如果你的嵌入式匯編使用__asm__ __volatile__(嵌入式匯編)的語法格式,那么也就是告訴編譯器,不要隨便動我的嵌入?yún)R編代碼哦。

(4)我們先看ldrex和strex這兩條匯編指令的使用方法。ldr和str這兩條指令大家都是非常的熟悉了,后綴的ex表示Exclusive,是ARMv7提供的為了實現(xiàn)同步的匯編指令。

LDREX , []

是base register,保存memory的address,LDREX指令從base register中獲取memory address,并且將memory的內(nèi)容加載到(destination register)中。這些操作和ldr的操作是一樣的,那么如何體現(xiàn)exclusive呢?其實,在執(zhí)行這條指令的時候,還放出兩條“狗”來負責(zé)觀察特定地址的訪問(就是保存在[]中的地址了),這兩條狗一條叫做local monitor,一條叫做global monitor。

STREX , , []

和LDREX指令類似,是base register,保存memory的address,STREX指令從base register中獲取memory address,并且將 (source register)中的內(nèi)容加載到該memory中。這里的保存了memeory 更新成功或者失敗的結(jié)果,0表示memory更新成功,1表示失敗。STREX指令是否能成功執(zhí)行是和local monitor和global monitor的狀態(tài)相關(guān)的。對于Non-shareable memory(該memory不是多個CPU之間共享的,只會被一個CPU訪問),只需要放出該CPU的local monitor這條狗就OK了,下面的表格可以描述這種情況

開始的時候,local monitor處于Open Access state的狀態(tài),thread 1執(zhí)行LDREX 命令后,local monitor的狀態(tài)遷移到Exclusive Access state(標(biāo)記本地CPU對xxx地址進行了LDREX的操作),這時候,中斷發(fā)生了,在中斷handler中,又一次執(zhí)行了LDREX ,這時候,local monitor的狀態(tài)保持不變,直到STREX指令成功執(zhí)行,local monitor的狀態(tài)遷移到Open Access state的狀態(tài)(清除xxx地址上的LDREX的標(biāo)記)。返回thread 1的時候,在Open Access state的狀態(tài)下,執(zhí)行STREX指令會導(dǎo)致該指令執(zhí)行失?。]有LDREX的標(biāo)記,何來STREX),說明有其他的內(nèi)核控制路徑插入了。

對于shareable memory,需要系統(tǒng)中所有的local monitor和global monitor共同工作,完成exclusive access,概念類似,這里就不再贅述了。

大概的原理已經(jīng)描述完畢,下面回到具體實現(xiàn)面。

其中%3就是input operand list中的"r" (&v->counter),r是限制符(constraint),用來告訴編譯器gcc,你看著辦吧,你幫我選擇一個通用寄存器保存該操作數(shù)吧。%0對應(yīng)output openrand list中的"=&r" (result),=表示該操作數(shù)是write only的,&表示該操作數(shù)是一個earlyclobber operand,具體是什么意思呢?編譯器在處理嵌入式匯編的時候,傾向使用盡可能少的寄存器,如果output operand沒有&修飾的話,匯編指令中的input和output操作數(shù)會使用同樣一個寄存器。因此,&確保了%3和%0使用不同的寄存器。

(5)完成步驟(4)后,%0這個output操作數(shù)已經(jīng)被賦值為atomic_t變量的old value,毫無疑問,這里的操作是要給old value加上i。這里%4對應(yīng)"Ir" (i),這里“I”這個限制符對應(yīng)ARM平臺,表示這是一個有特定限制的立即數(shù),該數(shù)必須是0~255之間的一個整數(shù)通過rotation的操作得到的一個32bit的立即數(shù)。這是和ARM的data-processing instructions如何解析立即數(shù)有關(guān)的。每個指令32個bit,其中12個bit被用來表示立即數(shù),其中8個bit是真正的數(shù)據(jù),4個bit用來表示如何rotation。更詳細的內(nèi)容請參考ARM ARM文檔。

(6)這一步將修改后的new value保存在atomic_t變量中。是否能夠正確的操作的狀態(tài)標(biāo)記保存在%1操作數(shù)中,也就是"=&r" (tmp)。

(7)檢查memory update的操作是否正確完成,如果OK,皆大歡喜,如果發(fā)生了問題(有其他的內(nèi)核路徑插入),那么需要跳轉(zhuǎn)到lable 1那里,從新進行一次read-modify-write的操作。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 寄存器
    +關(guān)注

    關(guān)注

    31

    文章

    5343

    瀏覽量

    120383
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10863

    瀏覽量

    211796
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4331

    瀏覽量

    62629

原文標(biāo)題:Linux內(nèi)核同步機制之(一):原子操作

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    詳解linux內(nèi)核中的mutex同步機制

    linux內(nèi)核中,互斥量(mutex,即mutual exclusion)是一種保證串行化的睡眠鎖機制。和spinlock的語義類似,都是允許一個執(zhí)行線索進入臨界區(qū),不同的是當(dāng)無法獲得鎖的時候
    的頭像 發(fā)表于 05-13 08:56 ?6850次閱讀
    詳解<b class='flag-5'>linux</b><b class='flag-5'>內(nèi)核</b>中的mutex<b class='flag-5'>同步機制</b>

    Linux內(nèi)核同步機制原子操作詳解

    系統(tǒng)調(diào)用的控制路徑上,完成讀操作之后,硬件觸發(fā)中斷,開始執(zhí)行中斷處理函數(shù)。中斷處理函數(shù)的寫回操作被系統(tǒng)調(diào)用控制路徑上的寫回操作覆蓋了,導(dǎo)致結(jié)果不一致。
    發(fā)表于 06-26 16:04 ?718次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內(nèi)核</b><b class='flag-5'>同步機制</b><b class='flag-5'>原子</b><b class='flag-5'>操作</b>詳解

    Linux內(nèi)核同步機制mutex詳解

    linux內(nèi)核中,互斥量mutex是一種保證CPU串行運行的睡眠鎖機制。和spinlock類似,都是同一個時刻只有一個線程進入臨界資源,不同的是,當(dāng)無法獲取鎖的時候,spinlock原地自旋,而mutex則是選擇掛起當(dāng)前線程,
    發(fā)表于 06-26 16:05 ?1122次閱讀

    Linux內(nèi)核同步機制

    在現(xiàn)代操作系統(tǒng)里,同一時間可能有多個內(nèi)核執(zhí)行流在執(zhí)行,因此內(nèi)核其實象多進程多線程編程一樣也需要一些同步機制同步各執(zhí)行單元對共享數(shù)據(jù)的訪問。
    發(fā)表于 08-06 07:08

    Vulkan同步機制和圖形轉(zhuǎn)換的風(fēng)險

    Vulkan同步機制和圖形-計算-圖形轉(zhuǎn)換的風(fēng)險(一)
    發(fā)表于 01-21 06:17

    RTT中的消息同步機制是如何實現(xiàn)的?

    RTT中的消息同步機制是如何實現(xiàn)的
    發(fā)表于 11-02 07:00

    linux內(nèi)核機制有哪些

    路徑(進程)以交錯的方式運行。對于這些交錯路徑執(zhí)行的內(nèi)核路徑,如不采取必要的同步措施,將會對一些關(guān)鍵數(shù)據(jù)結(jié)構(gòu)進行交錯訪問和修改,從而導(dǎo)致這些數(shù)據(jù)結(jié)構(gòu)狀態(tài)的不一致,進而導(dǎo)致系統(tǒng)崩潰。因此,為了確保系統(tǒng)高效穩(wěn)定有序地運行,linux
    發(fā)表于 11-14 15:25 ?5568次閱讀
    <b class='flag-5'>linux</b><b class='flag-5'>內(nèi)核</b><b class='flag-5'>機制</b>有哪些

    linux內(nèi)核機制

    在現(xiàn)代操作系統(tǒng)里,同一時間可能有多個內(nèi)核執(zhí)行流在執(zhí)行,因此內(nèi)核其實象多進程多線程編程一樣也需要一些同步機制同步各執(zhí)行單元對共享數(shù)據(jù)的訪問。
    發(fā)表于 11-14 15:52 ?7130次閱讀

    你知道linux 同步機制的complete?

    Linux內(nèi)核中,completion是一種簡單的同步機制,標(biāo)志"things may proceed"。 要使用completion,必須在文件中包含,同時創(chuàng)建一個類型為struct completion的變量。
    發(fā)表于 04-24 11:45 ?1286次閱讀

    你了解Linux內(nèi)核同步機制?

    在現(xiàn)代操作系統(tǒng)里,同一時間可能有多個內(nèi)核執(zhí)行流在執(zhí)行,因此內(nèi)核其實象多進程多線程編程一樣也需要一些同步機制同步各執(zhí)行單元對共享數(shù)據(jù)的訪問。
    發(fā)表于 05-12 08:26 ?636次閱讀

    可以了解并學(xué)習(xí)Linux 內(nèi)核同步機制

    Linux內(nèi)核同步機制,挺復(fù)雜的一個東西,常用的有自旋鎖,信號量,互斥體,原子操作,順序鎖,RCU,內(nèi)存屏障等。
    發(fā)表于 05-14 14:10 ?705次閱讀

    Linux內(nèi)核中有哪些鎖

    LInux操作系統(tǒng)里,同一時間可能有多個內(nèi)核執(zhí)行流在執(zhí)行,因此內(nèi)核其實象多進程多線程編程一樣也需要一些同步機制
    的頭像 發(fā)表于 02-24 15:26 ?3454次閱讀

    Linux內(nèi)核同步機制

    在現(xiàn)代操作系統(tǒng)里,同一時間可能有多個內(nèi)核執(zhí)行流在執(zhí)行,因此內(nèi)核其實像多進程多線程編程一樣也需要一些同步機制同步各執(zhí)行單元對共享數(shù)據(jù)的訪問,
    的頭像 發(fā)表于 09-22 09:46 ?2291次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內(nèi)核</b>的<b class='flag-5'>同步機制</b>

    關(guān)于Linux kernel同步機制的這些知識點你不得不知道

    同步就是進程與進程之間,進程與系統(tǒng)資源之間的交互。由于 Linux內(nèi)核采用的是多任務(wù),所以在多個進程之間,必須要有同步機制來保證彼此協(xié)調(diào)。
    的頭像 發(fā)表于 04-21 14:42 ?825次閱讀

    淺談Linux kernel中的同步機制

    同步就是進程與進程之間,進程與系統(tǒng)資源之間的交互。由于 Linux內(nèi)核采用的是多任務(wù),所以在多個進程之間,必須要有同步機制來保證彼此協(xié)調(diào)。
    的頭像 發(fā)表于 05-04 17:06 ?919次閱讀