計算機如何執(zhí)行你寫的代碼?知乎上有人提問:電腦怎樣執(zhí)行編程語言的?
很多剛剛?cè)肟拥男“卓赡軐Υ送耆珱]有概念,或者模模糊糊知道個大概,我們寫下的一行行代碼,計算機到底是如何在執(zhí)行的呢?
我們以x86架構(gòu)的CPU為研究對象,從一個例子出發(fā),來嘗試解答這個問題。
1、高級語言為了方便編程,偉大的計算機先驅(qū)們發(fā)明了一個又一個的編程語言,使得我們可以用人類最容易理解的語法規(guī)則去告訴計算機完成我們想要的功能。
int sum = a + b;
一句簡單的不能再簡單的C語言語句。
但即便是如此簡單,聰明絕頂?shù)挠嬎銠C卻還是看不懂:這是弄啥捏?
這時候就需要一個翻譯,負責把人類編寫的高級語言“翻譯”成計算機能看得懂的東西,這個翻譯就是編譯器。
2、編譯鏈接上面的高級語言語句經(jīng)過編譯器編譯鏈接后,生成了一個目標運行平臺為x86架構(gòu)的可執(zhí)行程序exe/elf,使用反編譯工具IDA進行分析,可以看到這行代碼編譯后的樣子是這樣的:
mov eax, a : 將變量a的值存入eax寄存器中
add eax, b : 把變量b的值和eax寄存器的值相加,并將結(jié)果保存在eax寄存器中
mov sum, eax : 將計算結(jié)果從eax寄存器寫入sum變量
看到了嗎,就像把大象關(guān)進冰箱需要分三步,計算機完成程序員的一條加法語句,也分了三步:取出被加數(shù)、加上加數(shù)、寫入結(jié)果。
3、機器指令上面的匯編指令只是為了人類理解方便的助記符,計算機同樣也不認識這玩意,那幾條指令在內(nèi)存中實際上是這樣的一串數(shù)據(jù):
十六進制:
8B 45 EC 03 45 E0 89 45 F8
十六進制是為了書寫方便,計算機真正能看到的只有二進制的比特流:
10001011 01000101 11101100 00000011 01000101 11100000 10001001 01000101 11111000
接下來,計算機要做的事情就是識別這些二進制流都是什么意思,轉(zhuǎn)換成一條條的指令來執(zhí)行。
在開始執(zhí)行之前,先來了解一下指令格式。
4、指令格式x86架構(gòu)CPU指令集中的指令格式如下:
主要有六個部分:
[非必需] 指令前綴:我們經(jīng)常用到的原子操作指令前面有一個lock前綴,就屬于指令前綴。
[必需] 操作碼:指令最核心的部分,標識這條指令是什么功能。
[非必需] ModR/M:內(nèi)存/寄存器操作數(shù)字節(jié)
[非必需] SIB:索引尋址描述字節(jié)
[非必需] Displacement:常數(shù)偏移字節(jié)/半字/字
[非必需] Immediate:立即數(shù)字節(jié)/半字/字
需要注意的是,并不是每一條指令都包含上面的所有部分,許多指令只包含其中一部分字段。
根據(jù)操作碼的長度不同,指令分為單字節(jié)操作碼指令、雙字節(jié)操作碼指令、三字節(jié)操作碼指令。
5、執(zhí)行指令計算機中真正負責指令執(zhí)行的核心部件是中央處理器CPU,在CPU中有一個指令寄存器IP,全稱是Instruction Pointer,在32位下,它叫EIP,在64位下它叫RIP。
下面開始執(zhí)行:
指令寄存器EIP指向了第一條指令,開始讀取第一個字節(jié):10001011,也就是0x8B。
開始指令譯碼,翻譯出這是一條什么指令。
下面是x86架構(gòu)的CPU指令操作碼表:
CPU中的指令譯碼模塊拿到手一看,呀,不是指令前綴,是個單字節(jié)操作碼的mov指令,要往eax寄存器里面塞數(shù)據(jù),數(shù)據(jù)從哪來呢?
再往后一看,0x45,再來譯碼:
好家伙,原來是根據(jù)ebp寄存器的值+一個8位的偏移來讀取數(shù)據(jù)。
再往后讀取一個字節(jié),就是偏移值:EC。
現(xiàn)在第一條指令就譯碼出來了:將ebp+0xEC位置處的4個字節(jié)的數(shù)據(jù)取出來,放到eax寄存器中。,這就是這一條指令要干的事情。
同時CPU還得出了另一個信息:這一條指令長度是3個字節(jié),下一條指令的起始地址是在3個字節(jié)之后,隨后,指令寄存器EIP向后撥動,指向下一條指令的地址:$+3。
指令譯碼完成之后,開始來正式執(zhí)行它。
執(zhí)行完一條以后,又來到指令寄存器EIP指向的地方,隨后再次指令譯碼、執(zhí)行,不斷重復這個過程,依次執(zhí)行每一條指令。
這其實就是CPU工作最基本的原理。
拓展上面描述的過程是CPU在硬件電路層面完成的,但這種設計思想在軟件領域也同樣適用。
大家如果去研究Java虛擬機JVM和Python的解釋器源代碼時,也會發(fā)現(xiàn)有相似之處:JVM和解釋器通過定義一套自己的“指令集”,然后它們的編譯器使用這套指令集將Java和Python代碼編譯成對應的程序。
運行的時候也類似,虛擬機或者解釋器不斷識別每一條指令,譯碼、執(zhí)行,和CPU執(zhí)行指令的過程頗有幾分相似。
C/C++語言編譯的程序,最后是直接編譯成了CPU的指令,所以跨平臺能力差,如果換到ARM架構(gòu)平臺,原來的程序?qū)o法執(zhí)行,需要重新編譯成新的平臺的程序。
而Java、Python這類語言,是自己在軟件層面的指令集,因為其自身已經(jīng)開發(fā)了針對不同CPU平臺的虛擬機、解釋器,所以這些語言編寫的程序移植性好,真正做到一次編寫,到處運行。
總結(jié)我們使用高級語言C、C++編寫的程序代碼,經(jīng)過編譯器的編譯鏈接,最終變成CPU可以理解的機器指令,隨后CPU在執(zhí)行時通過不斷的譯碼、執(zhí)行,最終實現(xiàn)高級語言所描述的功能。
現(xiàn)在你知道你用編程語言寫下的程序是如何跑起來的了嗎?
責任編輯:haq
-
cpu
+關(guān)注
關(guān)注
68文章
10891瀏覽量
212440 -
計算機
+關(guān)注
關(guān)注
19文章
7525瀏覽量
88356 -
C語言
+關(guān)注
關(guān)注
180文章
7614瀏覽量
137270
原文標題:一行代碼,揭開CPU執(zhí)行原理!
文章出處:【微信號:gh_c472c2199c88,微信公眾號:嵌入式微處理器】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論