日本亲近相奷中文字幕,99偷拍视频精品一区二区,久久国产情侣露脸精品

問題描述

昨天下午，旁邊的同事在學習Linux系統(tǒng)中的虛擬地址映射（經(jīng)典書籍《程序員的自我修養(yǎng)－鏈接、裝載與庫》），在看到6．4章節(jié)的時候，對于一個可執(zhí)行的ELF文件中，虛擬地址的值百思不得其解！

例如下面這段C代碼：

首先編譯出32位的可執(zhí)行程序（為了避開一些與主題無關的干擾因素，采用了靜態(tài)鏈接）：

gcc －m32 －static test．c －o test

編譯得到ELF格式的可執(zhí)行文件：test。

這個時候，使用readelf工具來查看這個可執(zhí)行文件中的段信息（segment）：

上圖中的紅色矩形框中，第二個段的地址為什么是 0x080e＿9f5c？

這篇文章主要根據(jù)書中的解釋，來具體的分析這個值的來龍去脈。

ELF 文件格式

在Linux系統(tǒng)中，有4種類型的文件都是ELF格式，包括：目標文件，可執(zhí)行文件，動態(tài)鏈接庫文件、核心轉(zhuǎn)儲文件。

如果想系統(tǒng)掌握Linux系統(tǒng)中的底層知識，研究ELF的格式是避免不了的事情。

很久之前總結過這篇文章：《Linux系統(tǒng)中編譯、鏈接的基石－ELF文件：扒開它的層層外衣，從字節(jié)碼的粒度來探索》，里面詳細總結了ELF文件的內(nèi)部結構。

這里就不再贅述了，只要記住2點：

1.從編譯器的角度看，ELF 文件是由很多的節(jié)（Section）組成的；

2.從程序加載器的角度看，ELF 文件是又很多的段（Segment）組成的；

其實它倆沒有本質(zhì)區(qū)別，只不過是鏈接器在鏈接階段，把不同目標文件中相同的section組織在一起，形成一個 segment。

對于剛才編譯出的test可執(zhí)行文件，其加載視圖如下：

可以看到該文件一共有5個段（segment），前2個需要LOAD到內(nèi)存的段，它們屬性分別是：讀、執(zhí)行（R E）和讀、寫（RW），它們分別是代碼段和數(shù)據(jù)段。

綠色的箭頭反映出：代碼段中包含了很多的 section；黃色的箭頭反映出數(shù)據(jù)段也包含了很多的 section。

地址轉(zhuǎn)換和內(nèi)存映射

從地址轉(zhuǎn)換的角度來看：

Linux 系統(tǒng)中CPU中使用的都是虛擬地址，該虛擬地址在尋址的時候，需要經(jīng)過MMU地址轉(zhuǎn)換，得到實際的物理地址，然后才能在物理內(nèi)存中讀取指令，或者讀取、寫入數(shù)據(jù)。

在現(xiàn)代操作系統(tǒng)中，MMU地址轉(zhuǎn)換單元基本上都是通過頁表來進行地址轉(zhuǎn)換的：

當然了，有些系統(tǒng)是兩級轉(zhuǎn)換（頁目錄、頁表），有些系統(tǒng)是三級或者四級頁表。

從內(nèi)存映射的角度來看：

操作系統(tǒng)在把一個可執(zhí)行程序加載到系統(tǒng)中時，把ELF文件中每個段的內(nèi)容讀取到物理內(nèi)存中，然后把這個物理內(nèi)存映射到該段對應的虛擬地址上（VirtAddr）。

假設一個可執(zhí)行程序中的代碼段長度是1．2K字節(jié)，數(shù)據(jù)段長度是1．3K字節(jié)。

操作系統(tǒng)在把它倆讀取到內(nèi)存中時，需要 2 個物理內(nèi)存頁來分別存儲它們（每 1 個物理頁的長度是4K）：

雖然每一個物理內(nèi)存頁的大小是 4K，但是代碼段和數(shù)據(jù)段實際上只使用了每個頁面剛開始的一段空間。

當CPU中需要讀取物理內(nèi)存上代碼段中的指令時，使用的虛擬地址是 0x0000＿1000 ～ 0x0000＿1000 ＋ 1．2K這個區(qū)間的地址，MMU單元經(jīng)過頁表轉(zhuǎn)換之后，就會得到這個存放著代碼段的物理頁的物理地址。

數(shù)據(jù)段的尋址方式也是如此：當CPU中需要讀寫物理內(nèi)存上數(shù)據(jù)段中的數(shù)據(jù)時，使用的虛擬地址是 0x0000＿2000 ～ 0x0000＿2000 ＋ 1．3K這個區(qū)間的地址。

MMU單元經(jīng)過頁表轉(zhuǎn)換之后，就會得到存放著數(shù)據(jù)段的物理頁的物理地址。

可以看出在這樣的安排下，每一個段的虛擬地址，都是按照4K（0x1000）對齊的。

如果操作系統(tǒng)都是這樣簡單映射的話，那么事情就簡單多了。

如果按照這樣的安排，來分析一下文章開頭的 test 可執(zhí)行程序中的虛擬地址安排：

1.代碼段安排的開始虛擬地址是 0x0804＿8000，這是 4K 對齊的；

2.代碼段的結束虛擬地址就應該是 0x0804＿8000 ＋ 0xa0725 ＝ 0x080e＿8725；

3.那么數(shù)據(jù)段的開始地址就可以安排在 0x080e＿8725 之后的下一個 4K 對齊的邊界地址，即：0x080e＿9000。

但是這樣的地址安排，嚴重浪費了物理內(nèi)存空間！

1．2K 字節(jié)的代碼段加上1．3K字節(jié)的數(shù)據(jù)段，本來只需要1個物理頁就夠了（4KB），但是這里卻消耗掉2個物理頁（8KB）。

為了減少物理內(nèi)存的浪費，Linux操作系統(tǒng)就采用了一些巧妙的辦法來減少物理內(nèi)存的浪費，那就是：把文件中接壤部分的代碼段和數(shù)據(jù)段，讀取到同一個物理內(nèi)存頁中，然后在虛擬地址空間中映射兩次，詳述如下。

Linux 中的內(nèi)存重復映射

先來看一下test文件的結構：

代碼段在文件中的開始位置是：0x00000，長度是 0xa0725。

數(shù)據(jù)段的開始位置是：0xa0f5c，長度是0x1024。

可以看到它倆之間有一個空白區(qū)間，長度是： 0xa0f5c － 0xa0725 ＝ 0x837（十進制：2103字節(jié)）。

由于操作系統(tǒng)在把test文件讀取到物理內(nèi)存的時候，從文件開始代碼段的0x00000地址開始讀取，按照4KB為一個單位存放到一個物理頁中。

1.文件中代碼段的 0x00000 ～ 0x00FFF 讀取到一個物理頁中；

2.文件中代碼段的 0x01000 ～ 0x01FFF 讀取到物理頁中；

3.下面的內(nèi)容都是如此分割、復制；

也就是說：相當于把test文件從開始位置，按照4KB為一個單位進行＂切割＂，然后復制到不同的物理內(nèi)存頁中，如下所示：

注意：這些物理頁的地址很可能是不連續(xù)的。

這里有意思的是：代碼段與數(shù)據(jù)段接壤的這個4KB的空間，它的開始地址是0xA0000，結束地址是0xA0FFF，被復制到物理內(nèi)存中最上面的橙色物理頁中。

再來看一下代碼段的虛擬地址：在執(zhí)行gcc指令的的時候，鏈接器把代碼段的虛擬地址安排在0x0804＿8000處：

也就是說：當CPU中（或者說程序代碼中），使用0x0804＿8000 ～ 0x0804＿7FFF 這個區(qū)間的地址時，經(jīng)過地址映射，就會找到物理內(nèi)存中淺綠色的物理頁，而這個物理頁也對應著test可執(zhí)行文件開始的第一個4KB的空間。

而且，從虛擬地址的角度看，它的地址都是連續(xù)的，對應著test文件中連續(xù)的內(nèi)容，這也是虛擬地址映射的本質(zhì)。

把代碼段的開始位置安排在 0x0804＿8000 地址，這是 Linux 操作系統(tǒng)確定的。

那么考慮一下：代碼段的最后一部分指令相應的4K頁面，其對應的開始虛擬地址是多少呢？

上圖中已經(jīng)標記出來了，就是虛擬地址中橙色部分：0x080e＿8000，計算如下：

通過代碼段的開始地址0x0804＿8000，再加上代碼段在內(nèi)存中的長度0xa0725，結果就是 0x080e＿8725。

按照4K （0x1000）對齊之后，最后一個虛擬頁就應該是0x080e＿8000。

也就是說：虛擬地址中0x080e＿8000 ～ 0x080e＿8724 這個區(qū)間就對應著test文件中代碼段的最后一部分指令（0x725個字節(jié)）。

此外，上圖中最右側：test文件結構中的2個紅色地址：0xA0000， 0xA1000，是如何計算得到的？

代碼段的長度是 0xA0725，按照4K為一個單位來進行分割，也就是把0xA0725對0x1000進行整除，就得到這個4KB的開始地址0xA0000。

同理，下一個4KB的開始地址就是0xA1000。

把文件中這部分4K的數(shù)據(jù)（包括：一部分代碼段內(nèi)容＋ 0x837 字節(jié)空洞＋一部分數(shù)據(jù)段內(nèi)容），復制到上圖中物理內(nèi)存中最上面的橙色物理頁中。

又因為虛擬地址空間中，0x080E＿8000開始的這個4KB空間映射到這個物理頁中，所以：在這個虛擬地址空間中，也有一個0x837字節(jié)的空洞，如下所示：

空洞的下方，是代碼段的指令；空洞的上方，是數(shù)據(jù)段的數(shù)據(jù)。

現(xiàn)在，這個物理頁中即存放了代碼，又存放了數(shù)據(jù)。

那么CPU中在查找部分的代碼和數(shù)據(jù)的時候，必須都能夠找得到才行！

對于代碼段比較好理解：從這個物理頁開始的前0x725個字節(jié)是有效的，從虛擬地址的角度看，就是從0x080e＿8000開始的前0x725個字節(jié)是有效的。

因此，對于這部分代碼的尋址，使用的虛擬地址處于0x080e＿8000 ～ 0x080e＿8724這個區(qū)間中。

那么數(shù)據(jù)段呢？

重點來了：Linux系統(tǒng)把虛擬地址空間 0x080e＿9000 ～ 0x080e＿9FFF 也映射到圖中物理內(nèi)存中最上面的橙色物理頁上！

如下所示：

因為物理頁中，是從0x837個字節(jié)空洞的上面開始，才是真正的數(shù)據(jù)段內(nèi)容，那么相應的：虛擬地址0x080e＿9000 ～ 0x080e＿9FFF空間中，0x837字節(jié)上面的內(nèi)容才是數(shù)據(jù)段內(nèi)容。

那么在虛擬地址空間中，這個數(shù)據(jù)段的開始地址應該是多少呢？

只要計算出0x837字節(jié)空洞的上方，距離這個4K頁面開始地址的偏移量就可以了，然后再加上這個4K頁面的起始地址 0x080E＿9000，就得到了數(shù)據(jù)段的開始地址（虛擬地址）。

因為虛擬地址、物理地址、test文件中，都是按照4K的單位進行劃分的，因此這個偏移量就等于：test文件中數(shù)據(jù)段的開始地址（0xA0F5C）距離這個頁面的開始地址（0xA0000）的偏移量。

0xA0F5C － 0xA0000 ＝ 0xF5C 。

即：從這個4K頁面的開始地址，偏移量為0xF5C的地方，才是數(shù)據(jù)段內(nèi)容的開始。

因此對于虛擬地址來說，從0x080e＿9000地址開始，偏移量為0xF5C之后的內(nèi)容才是數(shù)據(jù)段的內(nèi)容，這個地址值就是：0x080e＿9000 ＋ 0xF5C ＝ 0x080e＿9F5C，如下所示：

這個地址正是readelf工具讀所顯示的：數(shù)據(jù)段加載到虛擬地址空間中的開始地址，如下所示：

至此，就解釋了文章開頭提出的問題！

再來看一下整個數(shù)據(jù)段的內(nèi)容：在內(nèi)存中數(shù)據(jù)段占據(jù)的空間是 0x01e48（readelf 工具讀取到的 MemSiz），那么數(shù)據(jù)段的結束地址就是（虛擬地址）：

0x080e＿9F5C ＋ 0x01e48 ＝ 0x080e＿bda4

如下所示：

小結

Linux系統(tǒng)中的這個操作：對屬于不同段的內(nèi)容進行重復映射，有點類似于共享內(nèi)存的味道了。

只不過這里重復映射之后，每個段的虛擬地址還是需要修正為該段的合法地址。

經(jīng)過這樣的操作之后，在虛擬地址中每一個段的界限是涇渭分明的，但是映射到的物理內(nèi)存頁，則有可能是同一個。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

Linux

Linux

+關注

關注
87

文章
11310

瀏覽量
209615
操作系統(tǒng)

操作系統(tǒng)

+關注

關注
37

文章
6834

瀏覽量
123348

搜索歷史

gcc編譯時，鏈接器安排的【虛擬地址】是如何計算出來的？

評論

用INA233來監(jiān)控主芯片的幾個PORT的供電情況，這顆芯片I2C直接輸出電流值是怎么算出來的？

ads1115在采集距離傳感器輸入的0.9v時誤差較大，怎么解決？

ADS1299器件手冊里的這個衰減怎么計算出來的？

TPA2013D1功率是如何計算出來的，和哪些因素有關？

使用TAS5756做一款低音炮，需要隨時調(diào)節(jié)低通濾波寬帶，請問這些數(shù)據(jù)是怎么算出來的？

PCM1808從模擬信號輸入到I2S信號輸出的延遲時間是多少？怎樣計算出來？

TAS5805內(nèi)部的硬件CRC8對應標準的哪種? CRC校驗的數(shù)據(jù)是offset和value值嗎？

LPV521 Vout是怎么計算得出的呢？

LTSR 25-NP計算出來的電流誤差特別大，為什么？

st2.0的電機庫，hall電角度是怎么計算出來？

ESP8266_RTOS在線升級FOTA CRC遇到的疑問求解

dd馬達偏差量怎么計算出來的

MCSDK5.4.8中STEVAL-ESC001V1過流保護里邊的current threshold是怎么計算出來的？

隔離開關的額定電流怎么計算出來

ADUCM360 demo里面這個3.75Hz怎么算出來的？

搜索歷史

gcc編譯時，鏈接器安排的【虛擬地址】是如何計算出來的？

評論

gcc編譯時，鏈接器安排的【虛擬地址】是如何計算出來的？