越來(lái)越多的工作現(xiàn)如今都交給了編譯器,甚至連動(dòng)態(tài)代碼修改的數(shù)據(jù)組織這種事都交給了編譯器。gcc提供了一個(gè)特性用于嵌入式匯編,那就是asm goto,其實(shí)這個(gè)特性沒(méi)有什么神秘之處,就是在嵌入式匯編中g(shù)o to到c代碼的label,其最簡(jiǎn)單的用法如下(來(lái)自gcc的文檔):
asm goto其實(shí)就是在outputs,inputs,registers-modified之外提供了嵌入式匯編的第四個(gè)“:”,后面可以跟一系列的c語(yǔ)言的label,然后你可以在嵌入式匯編中g(shù)o to到這些label中一個(gè)。然而使用asm goto可以巧妙地將“一個(gè)大家都能想到的點(diǎn)子”規(guī)范化,就是說(shuō)你只需要調(diào)用一個(gè)統(tǒng)一的接口--一個(gè)宏,編譯器就將你想實(shí)現(xiàn)的東西給實(shí)現(xiàn)了,要不然代碼寫(xiě)起來(lái)會(huì)很麻煩,這點(diǎn)上,編譯器不嫌麻煩。這一個(gè)大家都能想出的點(diǎn)子的由來(lái)還得從內(nèi)核的效率說(shuō)起。
以下的代碼來(lái)自lwn的《Jump label》:
即使有了unlikey優(yōu)化,既然有if判斷,cpu的分支預(yù)測(cè)就有可能失敗,再者do_trace在代碼上離if這么近,即使編譯器再聰明,二進(jìn)制代碼的do_trace也不會(huì)離前面的代碼太遠(yuǎn)的,這樣由于局部性原理和cpu的預(yù)取機(jī)制,do_trace的代碼很有可能就被預(yù)取入了cpu的cache,就算我們從來(lái)不打算trace代碼也是如此。
我們需要的是如果不開(kāi)啟trace,那么do_trace永遠(yuǎn)不被欲取或者被預(yù)測(cè),唯一的辦法就是去掉if判斷,永遠(yuǎn)不調(diào)用goto語(yǔ)句,像下面這樣:
在運(yùn)行時(shí)修改載入內(nèi)存的二進(jìn)制代碼就是我們大家都能想到的點(diǎn)子,就是說(shuō)在運(yùn)行的時(shí)候當(dāng)我們知道trace_foo_enabled在某一時(shí)刻被設(shè)置為0的時(shí)候,我們動(dòng)態(tài)的將二進(jìn)制代碼修改掉,將if代碼段去掉,這樣一個(gè)分支預(yù)測(cè)就不存在了,而且trace_foo_enabled這一個(gè)變量也不需要再被訪問(wèn)了(該變量在內(nèi)存中,訪問(wèn)它肯定會(huì)涉及l(fā)oad/flush cache的動(dòng)作,為了一個(gè)很可能沒(méi)有用的變量操作cache很不值)。提前要說(shuō)的是,我們可以使用這種方式去掉所有的分支預(yù)測(cè),然而這并不可取,因?yàn)槌绦蚴莿?dòng)態(tài)運(yùn)行的,很多用于判斷的變量值都是根據(jù)程序的執(zhí)行瞬息萬(wàn)變,正是這種根據(jù)判斷結(jié)果采取不同動(dòng)作的機(jī)制給與了程序靈活性,如果每當(dāng)我們確定一個(gè)值時(shí)就修改二進(jìn)制代碼取消分支預(yù)測(cè)的話,其本身的開(kāi)銷(xiāo)將會(huì)遠(yuǎn)遠(yuǎn)大于分支預(yù)測(cè)的開(kāi)銷(xiāo),更重要的是,緊接著那個(gè)值又變化了,我們不得不再次修改二進(jìn)制代碼,這期間要訪問(wèn)那個(gè)變量好幾次。所以,只有在我們確定不經(jīng)常變化的變量的判斷上才能用這種方式取消分支預(yù)測(cè),而像trace與否的判斷正好符合我們的需求。
gcc編譯器提供了asm goto的機(jī)制來(lái)滿(mǎn)足我們的需求,使得我們可以在asm goto的基礎(chǔ)上構(gòu)建出一個(gè)叫做jump label的東西。下面的代碼段說(shuō)明了jump label的用法和原理:
標(biāo)號(hào)0僅僅執(zhí)行一個(gè)nop,不涉及cache,后面的pushsection保存現(xiàn)有的section,很多情況下當(dāng)前的section就是text,然后定義一個(gè)“表”,表中有兩個(gè)元素:0b和trace#NUM,其實(shí)就是兩個(gè)標(biāo)號(hào),在asm goto機(jī)制中,標(biāo)號(hào)還可以更多,它們?cè)谇度胧絽R編的最后一個(gè)“:”后面依次排布。這些標(biāo)號(hào)就是供選擇的標(biāo)號(hào),執(zhí)行流將跳入其中的一個(gè)標(biāo)號(hào)處,具體跳到哪一個(gè)就看當(dāng)前的二進(jìn)制代碼被修改成了“跳到哪一個(gè)”,因此asm goto為我們做的僅僅是提供一個(gè)地方(一個(gè)“:”)供我們將label傳入,保存了一系列的表還是需要我們的c代碼邏輯--jump label實(shí)現(xiàn),這些表(其實(shí)就是一系列的三元組)方便我們根據(jù)這些表來(lái)修改運(yùn)行中的二進(jìn)制代碼,最終修改二進(jìn)制代碼還是要由我們自己寫(xiě)代碼完成的。
有了這個(gè)asm goto以及我們jump label代碼的支持,內(nèi)核對(duì)于是否trace這種小事就再也不用愁了(使用中的kernel一般是不用trace的,只有在出了問(wèn)題以后或者調(diào)試內(nèi)核時(shí)才使用trace,因此在主代碼中加入“是否trace”的判斷實(shí)在是一種沉重的負(fù)擔(dān)),如果對(duì)于某一個(gè)函數(shù)不需要trace,內(nèi)核只需要執(zhí)行一個(gè)操作將asm goto附近的代碼改掉即可,比如改稱(chēng)下面這樣:
如果需要trace,那么就改成:
這一切在kernel中的用法如下:
第一行的“1”是一個(gè)標(biāo)號(hào),該標(biāo)號(hào)后的代碼執(zhí)行的內(nèi)容就是nop-第二行,第三行重新開(kāi)始了一個(gè)section,這樣的意義很大,下面的三元組:[instruction address] [jump target] [tracepoint key]的二進(jìn)制代碼就不會(huì)緊接著標(biāo)號(hào)1(nop)了,這個(gè)三元組就是jump label機(jī)制的核心,指示了所有可能跳轉(zhuǎn)到的標(biāo)號(hào),這里的技巧在于標(biāo)號(hào)1,標(biāo)號(hào)1也作為一個(gè)合法的可能跳轉(zhuǎn)到的標(biāo)號(hào)存在,和標(biāo)號(hào)label是并列的,由于pushsection和popsection的存在,上面的代碼匯編結(jié)果看起來(lái)是下面這樣:
如果啟用了trace,那么只需要將標(biāo)號(hào)1修改成標(biāo)號(hào)label就可以了:
內(nèi)核之所以能夠找到需要修改代碼的地址,就是借助于上面說(shuō)的那個(gè)三元組(instruction address,jump target,tracepoint key),其中instruction address就是這個(gè)地址,在linux的JUMP LABEL機(jī)制中,它固定為標(biāo)號(hào)1,也就是nop的標(biāo)號(hào),如果不啟用trace,那么直接執(zhí)行nop,如果啟用了trace,那么將nop修改為jmp label即可,如果后來(lái)又禁用了trace,只需將它再次修改成三元組中的標(biāo)號(hào)1即可,這一切過(guò)程中,三元組本身是不會(huì)改變的。注意,三元組中的tracepoint key在jump label機(jī)制中并沒(méi)有什么實(shí)質(zhì)的意義,它僅僅是為了組織kernel中“是否trace”變量用的,所有的“是否trace”變量組織成一個(gè)鏈表,鏈表的每一個(gè)節(jié)點(diǎn)下面掛著另一個(gè)子鏈表,該子鏈表中元素是所有使用這個(gè)“是否trace”變量的代碼環(huán)境,包括代碼的地址,標(biāo)號(hào)的地址等。
下面看一下kernel對(duì)于JUMP_LABEL的實(shí)現(xiàn)框架。首先看一下三元組的數(shù)據(jù)結(jié)構(gòu):
其次一個(gè)比較重要的數(shù)據(jù)結(jié)構(gòu)是一個(gè)key節(jié)點(diǎn),表示一個(gè)“是否trace”的變量:
啟用一個(gè)trace意味著需要將一個(gè)key(類(lèi)似于trace_foo_enabled)設(shè)置為1,然后修改所有判斷該key的代碼附近的二進(jìn)制代碼:
以上就是使用asm goto實(shí)現(xiàn)的jump label,在2.6.37內(nèi)核中被引入。
附:.section以及.previous
在匯編語(yǔ)言中使用.section和.previous指令可以將它們之間的代碼編譯到不同的section中,也就是不緊接著.section上面的代碼。linux kernel中的異常處理就是用這兩個(gè)偽指令實(shí)現(xiàn)的,定義了一個(gè)叫做fix的section和一個(gè)叫做ex_table的section,可能出現(xiàn)exception的代碼用一個(gè)標(biāo)號(hào)表示,ex_table中保存了一些二元組(出現(xiàn)異常代碼的標(biāo)號(hào),異常處理程序的標(biāo)號(hào)),異常處理程序在fix這個(gè)section中,這樣雖然代碼看起來(lái)是下面這樣:
然而編譯器會(huì)將fix和ex_table放到離text很遠(yuǎn)的地方的,這樣cpu預(yù)取時(shí)就不會(huì)將fix或者ex_table的代碼預(yù)取到執(zhí)行cache了,只有在發(fā)生異常的時(shí)候才會(huì)使用fix和ex_table,而發(fā)生異常畢竟是一種罕見(jiàn)現(xiàn)象,這就是一種優(yōu)化。
原文標(biāo)題:asm goto與JUMP_LABEL
文章出處:【微信公眾號(hào):Linuxer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
代碼
+關(guān)注
關(guān)注
30文章
4808瀏覽量
68813 -
編譯器
+關(guān)注
關(guān)注
1文章
1638瀏覽量
49197
原文標(biāo)題:asm goto與JUMP_LABEL
文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場(chǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論