寄存器這個(gè)太多太復(fù)雜,不適合寫(xiě)故事,拖了很久,總算是寫(xiě)完了,這篇文章就來(lái)詳細(xì)聊聊x86/x64架構(gòu)的CPU中那些紛繁復(fù)雜的寄存器們。
長(zhǎng)文預(yù)警,時(shí)速較快,請(qǐng)系好安全帶~起飛~
自1946年馮·諾伊曼領(lǐng)導(dǎo)下誕生的世界上第一臺(tái)通用電子計(jì)算機(jī)ENIAC至今,計(jì)算機(jī)技術(shù)已經(jīng)發(fā)展了七十多載。
從當(dāng)初專(zhuān)用于數(shù)學(xué)計(jì)算的龐然大物,到后來(lái)大型機(jī)服務(wù)器時(shí)代,從個(gè)人微機(jī)技術(shù)蓬勃發(fā)展,到互聯(lián)網(wǎng)浪潮席卷全球,再到移動(dòng)互聯(lián)網(wǎng)、云計(jì)算日新月異的當(dāng)下,計(jì)算機(jī)變的形態(tài)各異,無(wú)處不在。
這七十多年中,出現(xiàn)了數(shù)不清的編程語(yǔ)言,通過(guò)這些編程語(yǔ)言,又開(kāi)發(fā)了無(wú)數(shù)的應(yīng)用程序。
可無(wú)論什么樣的應(yīng)用程序,什么樣的編程語(yǔ)言,最終的程序邏輯都是要交付給CPU去執(zhí)行實(shí)現(xiàn)的(當(dāng)然這里有些不嚴(yán)謹(jǐn),除了CPU,還有協(xié)處理器、GPU等等)。所以了解和學(xué)習(xí)CPU的原理都是對(duì)計(jì)算機(jī)基礎(chǔ)知識(shí)的夯實(shí)大有裨益。
在七十多年的漫長(zhǎng)歷程中,也涌現(xiàn)了不少架構(gòu)的CPU。
- MIPS
- PowerPC
- x86/x64
- IA64
- ARM
- ······
這篇文章就以市場(chǎng)應(yīng)用最為廣泛的x86-x64架構(gòu)為目標(biāo),通過(guò)學(xué)習(xí)了解它內(nèi)部的100個(gè)寄存器功能作用,來(lái)串聯(lián)闡述CPU底層工作原理。
通過(guò)這篇文章,你將了解到:
- CPU指令執(zhí)行原理
- 內(nèi)存尋址技術(shù)
- 軟件調(diào)試技術(shù)原理
- 中斷與異常處理
- 系統(tǒng)調(diào)用
- CPU多任務(wù)技術(shù)
什么是寄存器?
寄存器是CPU內(nèi)部用來(lái)存放數(shù)據(jù)的一些小型存儲(chǔ)區(qū)域,用來(lái)暫時(shí)存放參與運(yùn)算的數(shù)據(jù)和運(yùn)算結(jié)果以及一些CPU運(yùn)行需要的信息。
x86架構(gòu)CPU走的是復(fù)雜指令集(CISC) 路線,提供了豐富的指令來(lái)實(shí)現(xiàn)強(qiáng)大的功能,與此同時(shí)也提供了大量寄存器來(lái)輔助功能實(shí)現(xiàn)。這篇文章將覆蓋下面這些寄存器:
- 通用寄存器
- 標(biāo)志寄存器
- 指令寄存器
- 段寄存器
- 控制寄存器
- 調(diào)試寄存器
- 描述符寄存器
- 任務(wù)寄存器
- MSR寄存器
通用寄存器
首當(dāng)其沖的是通用寄存器,這些的寄存器是程序執(zhí)行代碼最最常用,也最最基礎(chǔ)的寄存器,程序執(zhí)行過(guò)程中,絕大部分時(shí)間都是在操作這些寄存器來(lái)實(shí)現(xiàn)指令功能。
所謂通用,即這些寄存器CPU沒(méi)有特殊的用途,交給應(yīng)用程序“隨意”使用。注意,這個(gè)隨意,我打了引號(hào),對(duì)于有些寄存器,CPU有一些潛規(guī)則,用的時(shí)候要注意。
- eax : 通常用來(lái)執(zhí)行加法,函數(shù)調(diào)用的返回值一般也放在這里面
- ebx : 數(shù)據(jù)存取
- ecx : 通常用來(lái)作為計(jì)數(shù)器,比如for循環(huán)
- edx : 讀寫(xiě)I/O端口時(shí),edx用來(lái)存放端口號(hào)
- esp : 棧頂指針,指向棧的頂部
- ebp : 棧底指針,指向棧的底部,通常用ebp+偏移量的形式來(lái)定位函數(shù)存放在棧中的局部變量
- esi : 字符串操作時(shí),用于存放數(shù)據(jù)源的地址
- edi : 字符串操作時(shí),用于存放目的地址的,和esi兩個(gè)經(jīng)常搭配一起使用,執(zhí)行字符串的復(fù)制等操作
在x64架構(gòu)中,上面的通用寄存器都擴(kuò)展成為64位版本,名字也進(jìn)行了升級(jí)。當(dāng)然,為了兼容32位模式程序,使用上面的名字仍然是可以訪問(wèn)的,相當(dāng)于訪問(wèn)64位寄存器的低32位。
rax rbx rcx rdx rsp rbp rsi rdi
除了擴(kuò)展原來(lái)存在的通用寄存器,x64架構(gòu)還引入了8個(gè)新的通用寄存器:
r8-r15
在原來(lái)32位時(shí)代,函數(shù)調(diào)用時(shí),那個(gè)時(shí)候通用寄存器少,參數(shù)絕大多數(shù)時(shí)候是通過(guò)線程的棧來(lái)進(jìn)行傳遞(當(dāng)然也有使用寄存器傳遞的,比如著名的C++ this指針使用ecx寄存器傳遞,不過(guò)能用的寄存器畢竟不多)。
進(jìn)入x64時(shí)代,寄存器資源富裕了,參數(shù)傳遞絕大多數(shù)都是用寄存器來(lái)傳了。寄存器傳參的好處是速度快,減少了對(duì)內(nèi)存的讀寫(xiě)次數(shù)。
當(dāng)然,具體使用棧還是用寄存器傳參數(shù),這個(gè)不是編程語(yǔ)言決定的,而是編譯器在編譯生成CPU指令時(shí)決定的,如果編譯器非要在x64架構(gòu)CPU上使用線程棧來(lái)傳參那也不是不行,這個(gè)對(duì)高級(jí)語(yǔ)言是無(wú)感知的。
標(biāo)志寄存器
標(biāo)志寄存器,里面有眾多標(biāo)記位,記錄了CPU執(zhí)行指令過(guò)程中的一系列狀態(tài),這些標(biāo)志大都由CPU自動(dòng)設(shè)置和修改:
- CF 進(jìn)位標(biāo)志
- PF 奇偶標(biāo)志
- ZF 零標(biāo)志
- SF 符號(hào)標(biāo)志
- OF 補(bǔ)碼溢出標(biāo)志
- TF 跟蹤標(biāo)志
- IF 中斷標(biāo)志 ······
在x64架構(gòu)下,原來(lái)的eflags寄存器升級(jí)為64位的rflags,不過(guò)其高32位并沒(méi)有新增什么功能,保留為將來(lái)使用。
指令寄存器
eip : 指令寄存器可以說(shuō)是CPU中最最重要的寄存器了,它指向了下一條要執(zhí)行的指令所存放的地址,CPU的工作其實(shí)就是不斷取出它指向的指令,然后執(zhí)行這條指令,同時(shí)指令寄存器繼續(xù)指向下面一條指令,如此不斷重復(fù),這就是CPU工作的基本日常。
而在漏洞攻擊中,黑客想盡辦法費(fèi)盡心機(jī)都想要修改指令寄存器的地址,從而能夠執(zhí)行惡意代碼。
同樣的,在x64架構(gòu)下,32位的eip升級(jí)為64位的rip寄存器。
段寄存器
段寄存器與CPU的內(nèi)存尋址技術(shù)緊密相關(guān)。
早在16位的8086CPU時(shí)代,內(nèi)存資源寶貴,CPU使用分段式內(nèi)存尋址技術(shù):
16位的寄存器能尋址的范圍是64KB,通過(guò)引入段的概念,將內(nèi)存空間劃分為不同的區(qū)域:分段,通過(guò)段基址+段內(nèi)偏移段方式來(lái)尋址。
這樣一來(lái),段的基地址保存在哪里呢?8086CPU專(zhuān)門(mén)設(shè)置了幾個(gè)段寄存器用來(lái)保存段的基地址,這就是段寄存器段的由來(lái)。
段寄存器也是16位的。
段寄存器有下面6個(gè),前面4個(gè)是早期16位模式就引入了,到了32位時(shí)代,又新增了fs和gs兩個(gè)段寄存器。
- cs : 代碼段
- ds : 數(shù)據(jù)段
- ss : 棧段
- es : 擴(kuò)展段
- fs : 數(shù)據(jù)段
- gs : 數(shù)據(jù)段
段寄存器里面存儲(chǔ)的內(nèi)容與CPU當(dāng)前工作的內(nèi)存尋址模式緊密相關(guān)。
當(dāng)CPU處于16位實(shí)地址模式下時(shí),段寄存器存儲(chǔ)段的基地址,尋址時(shí),將段寄存器內(nèi)容左移4位(乘以16)得到段基地址+段內(nèi)偏移得到最終的地址。
當(dāng)CPU工作于保護(hù)模式下,段寄存器存儲(chǔ)的內(nèi)容不再是段基址了,此時(shí)的段寄存器中存放的是 段選擇子 ,用來(lái)指示當(dāng)前這個(gè)段寄存器“指向”的是哪個(gè)分段。
注意我這里的指向打了引號(hào),段寄存器中存儲(chǔ)的并不是內(nèi)存段的直接地址,而是段選擇子,它的結(jié)構(gòu)如下:
16個(gè)bit長(zhǎng)度的段寄存器內(nèi)容劃分了三個(gè)字段:
這里提到了兩個(gè)表,全局描述符表GDT和局部描述符表LDT,關(guān)于這兩個(gè)表的介紹,下面介紹描述符寄存器時(shí)再詳述,這里只需要知道,這是CPU支持分段式內(nèi)存管理需要的表格,放在內(nèi)存中,表格中的每一項(xiàng)都是一個(gè)描述符,記錄了一個(gè)內(nèi)存分段的信息。
保護(hù)模式下的段寄存器和段描述符到最后的內(nèi)存分段,通過(guò)下圖的方式聯(lián)系在一起:
通用寄存器、段寄存器、標(biāo)志寄存器、指令寄存器,這四組寄存器共同構(gòu)成了一個(gè)基本的指令執(zhí)行環(huán)境,一個(gè)線程的上下文也基本上就是這些寄存器,在執(zhí)行線程切換的時(shí)候,就是修改它們的內(nèi)容。
控制寄存器
控制寄存器是CPU中一組相當(dāng)重要的寄存器,我們知道eflags寄存器記錄了當(dāng)前運(yùn)行線程的一系列關(guān)鍵信息。
那CPU運(yùn)行過(guò)程中自身的一些關(guān)鍵信息保存在哪里呢?答案是控制寄存器!
32位CPU總共有cr0-cr4共5個(gè)控制寄存器,64位增加了cr8。他們各自有不同的功能,但都存儲(chǔ)了CPU工作時(shí)的重要信息:
- cr0 : 存儲(chǔ)了CPU控制標(biāo)記和工作狀態(tài)
- cr1 : 保留未使用
- cr2 : 頁(yè)錯(cuò)誤出現(xiàn)時(shí)保存導(dǎo)致出錯(cuò)的地址
- cr3 : 存儲(chǔ)了當(dāng)前進(jìn)程的虛擬地址空間的重要信息——頁(yè)目錄地址
- cr4 : 也存儲(chǔ)了CPU工作相關(guān)以及當(dāng)前人任務(wù)的一些信息
- cr8 : 64位新增擴(kuò)展使用 其中,CR0尤其重要,它包含了太多重要的CPU信息。
一些重要的標(biāo)記位含義如下:
PG
: 是否啟用內(nèi)存分頁(yè)
AM
: 是否啟用內(nèi)存對(duì)齊自動(dòng)檢查
WP
: 是否開(kāi)啟內(nèi)存寫(xiě)保護(hù),若開(kāi)啟,對(duì)只讀頁(yè)面嘗試寫(xiě)入時(shí)將觸發(fā)異常,這一機(jī)制常常被用來(lái)實(shí)現(xiàn)寫(xiě)時(shí)復(fù)制功能
PE
: 是否開(kāi)啟保護(hù)模式
除了CR0,另一個(gè)值得關(guān)注的寄存器是CR3,它保存了當(dāng)前進(jìn)程所使用的虛擬地址空間的頁(yè)目錄地址,可以說(shuō)是整個(gè)虛擬地址翻譯中的頂級(jí)指揮棒,在進(jìn)程空間切換的時(shí)候,CR3也將同步切換。
-
寄存器
+關(guān)注
關(guān)注
31文章
5343瀏覽量
120383 -
cpu
+關(guān)注
關(guān)注
68文章
10863瀏覽量
211796 -
X86
+關(guān)注
關(guān)注
5文章
294瀏覽量
43472 -
X64
+關(guān)注
關(guān)注
0文章
5瀏覽量
7842
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論