0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深入淺出Linux的進(jìn)程地址空間

如意 ? 來源:CSDN ? 作者:程姚根 ? 2020-06-20 09:57 ? 次閱讀

我們知道,在32位機(jī)器上linux操作系統(tǒng)中的進(jìn)程的地址空間大小是4G,其中0-3G是用戶空間,3G-4G是內(nèi)核空間。其實,這個4G的地址空間是不存在的,也就是我們所說的虛擬內(nèi)存空間。

那虛擬內(nèi)存空間是什么呢,它與實際物理內(nèi)存空間又是怎樣對應(yīng)的呢,為什么有了虛擬內(nèi)存技術(shù),我們就能運行比實際物理內(nèi)存大的應(yīng)用程序,它是怎么做到的呢?呵呵,這一切的一切都是個迷呀,下面我們就一步一步解開心中的謎團(tuán)吧!

我們來看看,當(dāng)我們寫好一個應(yīng)用程序,編譯后它都有什么東東?

例如:

用命令size a.out會得到:

其中text是放的是代碼,data放的是初始化過的全局變量或靜態(tài)變量,bss放的是未初始化的全局變量或靜態(tài)變量。

由于歷史原因,C程序一直由下列幾部分組成:

A、正文段。這是由cpu執(zhí)行的機(jī)器指令部分。通常,正文段是可共享的,所以即使是經(jīng)常執(zhí)行的程序(如文本編輯程序、C編譯程序、shell等)在存儲器中也只需要有一個副本,另外,正文段常常是只讀的,以防止程序由于意外事故而修改器自身的指令。

B、初始化數(shù)據(jù)段。通常將此段稱為數(shù)據(jù)段,它包含了程序中需賦初值的變量。例如,C程序中任何函數(shù)之外的說明:

int maxcount = 99;(全局變量)

C、非初始化數(shù)據(jù)段。通常將此段稱為bss段,這一名稱來源于早期匯編程序的一個操作,意思是“block started by symbol”,在程序開始執(zhí)行之前,內(nèi)核將此段初始化為0。函數(shù)外的說明:

long sum[1000];

使此變量存放在非初始化數(shù)據(jù)段中。

D、棧。自動變量以及每次函數(shù)調(diào)用時所需保存的信息都存放在此段中。每次函數(shù)調(diào)用時,其返回地址、以及調(diào)用者的環(huán)境信息(例如某些機(jī)器寄存器)都存放在棧中。然后,新被調(diào)用的函數(shù)在棧上為其自動和臨時變量分配存儲空間。通過以這種方式使用棧,C函數(shù)可以遞歸調(diào)用。

E、堆。通常在堆中進(jìn)行動態(tài)存儲分配。由于歷史上形成的慣例,堆位于非初始化數(shù)據(jù)段頂和棧底之間。

從上圖我們看到??臻g是下增長的,堆空間是從下增長的,他們會會碰頭呀?一般不會,因為他們之間間隔很大,如:

#include 《stdio.h》

#include 《stdlib.h》

int bss_var;

int data_var0 = 1;

int main()

{

printf(“Test location:\n”);

printf(“\tAddress of main(Code Segment):%p\n”,main);

printf(“_____________________________________\n”);

int stack_var0 = 2;

printf(“Stack location:\n”);

printf(“\tInitial end of stack:%p\n”,&stack_var0);

int stack_var1 = 3;

printf(“\tNew end of stack:%p\n”,&stack_var1);

printf(“_____________________________________\n”);

printf(“Data location:\n”);

printf(“\tAddress of data_var(Data Segment):%p\n”,&data_var0);

static int data_var1 = 4;

printf(“\tNew end of data_var(Data Segment):%p\n”,&data_var1);

printf(“_____________________________________\n”);

printf(“BSS location:\n”);

printf(“\tAddress of bss_var:%p\n”,&bss_var);

printf(“_____________________________________\n”);

printf(“Heap location:\n”);

char *p = (char *)malloc(10);

printf(“\tAddress of head_var:%p\n”,p);

return 0;

}

運行結(jié)果如下:

呵呵,這里我們看到地址了,這個地址是虛擬地址,這些地址時怎么來的呢?其實在我們編譯的時候,這些地址就已經(jīng)確定了,如下圖中紅線。

也就是說,我們不論我們運行a.out程序多少次這些地址都是一樣的。我們知道,linux操作系統(tǒng)每個進(jìn)程的地址空間都是獨立的,其實這里的獨立說得是物理空間上得獨立。那相同的虛擬地址,不同的物理地址,他們之間是怎樣聯(lián)系起來的呢?我們繼續(xù)探究。。.。

在linux操作系統(tǒng)中,每個進(jìn)程都通過一個task_struct的結(jié)構(gòu)體描敘,每個進(jìn)程的地址空間都通過一個mm_struct描敘,c語言中的每個段空間都通過vm_area_struct表示,他們關(guān)系如下 :

當(dāng)運行一個程序時,操作系統(tǒng)需要創(chuàng)建一個進(jìn)程,這個進(jìn)程和程序之間都干了些什么呢?

當(dāng)一個程序被執(zhí)行時,該程序的內(nèi)容必須被放到進(jìn)程的虛擬地址空間,對于可執(zhí)行程序的共享庫也是如此??蓤?zhí)行程序并非真正讀到物理內(nèi)存中,而只是鏈接到進(jìn)程的虛擬內(nèi)存中。

當(dāng)一個可執(zhí)行程序映射到進(jìn)程虛擬地址空間時,一組vm_area_struct數(shù)據(jù)結(jié)構(gòu)將被產(chǎn)生。每個vm_area_struct數(shù)據(jù)結(jié)構(gòu)表示可執(zhí)行印象的一部分;是可執(zhí)行代碼,或是初始化的數(shù)據(jù),以及未初始化的數(shù)據(jù)等。

linux操作系統(tǒng)是通過sys_exec對可執(zhí)行文件進(jìn)行映射以及讀取的,有如下幾步:

1、創(chuàng)建一組vm_area_struct;

2、圈定一個虛擬用戶空間,將其起始結(jié)束地址(elf段中已設(shè)置好)保存到vm_start和vm_end中;

3、將磁盤file句柄保存在vm_file中;

4、將對應(yīng)段在磁盤file中的偏移值(elf段中已設(shè)置好)保存在vm_pgoff中;

5、將操作該磁盤file的磁盤操作函數(shù)保存在vm_ops中;

注意:這里沒有對應(yīng) 的頁目錄表項創(chuàng)建頁表,更不存在設(shè)置頁表項了。

假設(shè)現(xiàn)在程序中有一條指令需要讀取上面vm_start--vm_end之間的某內(nèi)容

例如:mov [0x08000011],%eax,那么將會執(zhí)行如下序列:

1、cpu依據(jù)CR3(current-》pgd)找到0x08000011地址對應(yīng)的pgd[i],由于該pgd[i]內(nèi)容保持為初始化狀態(tài)即為0,導(dǎo)致cpu異常。

2、.do_page_fault被調(diào)用,在該函數(shù)中,為pgd[i]在內(nèi)存中分配一個頁表,并讓該表項指向它,如下圖所示:

注意:這里i為0x08000011高10位,j為其中間10位,此時pt表項全部為0(pte[j]也為0);

3、為pte[j]分配一個真正的物理內(nèi)存頁面,依據(jù)vm_area_struct中的vm_file、vm_pgoff和vm_ops,調(diào)用filemap_nopage將磁盤file中vm_pgoff偏移處的內(nèi)容讀入到該物理頁面中,如下圖所示:

①分配物理內(nèi)存頁面;

②從磁盤文件中將內(nèi)容讀取到物理內(nèi)存頁面中

從上面我們可以知道,在進(jìn)程創(chuàng)建的過程中,程序內(nèi)容被映射到進(jìn)程的虛擬內(nèi)存空間,為了讓一個很大的程序在有限的物理內(nèi)存空間運行,我們可以把這個程序的開始部分先加載到物理內(nèi)存空間運行,因為操作系統(tǒng)處理的是進(jìn)程的虛擬地址,如果在進(jìn)行虛擬到物理地址的轉(zhuǎn)換工程中,發(fā)現(xiàn)物理地址不存在時,這個時候就會發(fā)生缺頁異常(nopage),接著操作系統(tǒng)就會把磁盤上還沒有加載到內(nèi)存中的數(shù)據(jù)加載到物理內(nèi)存中,對應(yīng)的進(jìn)程頁表進(jìn)行更新。也許你會問,如果此時物理內(nèi)存滿了,操作系統(tǒng)將如何處理?

下面我們看看linux操作系統(tǒng)是如何處理的:

如果一個進(jìn)程想將一個虛擬頁裝入物理內(nèi)存,而又沒有可使用的空閑物理頁,操作系統(tǒng)就必須淘汰物理內(nèi)存中的其他頁來為此頁騰出空間。

在linux操作系統(tǒng)中,物理頁的描敘如下:

struct mem_map

{

1、本頁使用計數(shù),當(dāng)該頁被許多進(jìn)程共享時計數(shù)將大于1

2、age描敘本頁的年齡,用來判斷該頁是否為淘汰或交換的好候選

3、map_nr描敘物理頁的頁幀號

}

如果從物理內(nèi)存中被淘汰的頁來自于一個映像或數(shù)據(jù)文件,并且還沒有被寫過,則該頁不必保存,它可以丟掉。如果有進(jìn)程在需要該頁時就可以把它從映像或數(shù)據(jù)文件中取回內(nèi)存。

然而,如果該頁被修改過,操作系統(tǒng)必須保留該頁的內(nèi)容以便晚些時候在被訪問。這種頁稱為“臟(dirty)頁”,當(dāng)它被從內(nèi)存中刪除時,將被保存在一個稱為交換文件的特殊文件中。

相對于處理器和物理內(nèi)存的速度,訪問交換文件要很長時間,操作系統(tǒng)必須在將頁寫到磁盤以及再次使用時取回內(nèi)存的問題上花費心機(jī)。

如果用來決定哪一頁被淘汰或交換的算法不夠高效的話,就可能出現(xiàn)稱為“抖動”的情況。在這種情況下,頁面總是被寫到磁盤又讀回來,操作系統(tǒng)忙于此而不能進(jìn)行真正的工作。

linux使用“最近最少使用(Least Recently Used ,LRU)”頁面調(diào)度技巧來公平地選擇哪個頁可以從系統(tǒng)中刪除。這種設(shè)計系統(tǒng)中每個頁都有一個“年齡”,年齡隨頁面被訪問而改變。頁面被訪問越多它越年輕;被訪問越少越老。年老的頁是用于交換的最佳候選頁。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11310

    瀏覽量

    209621
  • ip地址
    +關(guān)注

    關(guān)注

    0

    文章

    303

    瀏覽量

    17059
  • 進(jìn)程
    +關(guān)注

    關(guān)注

    0

    文章

    203

    瀏覽量

    13962
收藏 人收藏

    評論

    相關(guān)推薦

    深入淺出AVR

    深入淺出AVR,一本書。
    發(fā)表于 07-15 12:02

    深入淺出玩轉(zhuǎn)FPGA

    深入淺出玩轉(zhuǎn)FPGA
    發(fā)表于 07-21 09:21

    深入淺出Linux_設(shè)備驅(qū)動編程

    深入淺出Linux_設(shè)備驅(qū)動編程
    發(fā)表于 08-16 15:57

    深入淺出ARM7

    深入淺出ARM7
    發(fā)表于 08-18 10:12

    HDMI技術(shù)深入淺出

    HDMI技術(shù)深入淺出
    發(fā)表于 08-19 10:52

    深入淺出Android

    深入淺出Android
    發(fā)表于 08-20 10:14

    深入淺出Linux_設(shè)備驅(qū)動編程

    深入淺出Linux_設(shè)備驅(qū)動編程
    發(fā)表于 08-20 14:58

    深入淺出Android

    深入淺出Android
    發(fā)表于 04-26 10:48

    深入淺出安防視頻監(jiān)控系統(tǒng)

    深入淺出安防視頻監(jiān)控系統(tǒng)深入淺出安防視頻監(jiān)控系統(tǒng)
    發(fā)表于 05-22 19:28

    深入淺出AVR

    深入淺出AVR
    發(fā)表于 08-23 10:10

    深入淺出數(shù)據(jù)分析

    深入淺出數(shù)據(jù)分析,有需要的朋友下來看看。
    發(fā)表于 01-15 14:22 ?0次下載

    深入淺出談多層面板布線技巧

    深入淺出談多層面板布線技巧
    發(fā)表于 12-13 22:20 ?0次下載

    深入淺出Android—Android開發(fā)經(jīng)典教材

    深入淺出Android—Android開發(fā)經(jīng)典教材
    發(fā)表于 10-24 08:52 ?15次下載
    <b class='flag-5'>深入淺出</b>Android—Android開發(fā)經(jīng)典教材

    深入淺出數(shù)字信號處理

    深入淺出數(shù)字信號處理
    發(fā)表于 12-07 20:14 ?539次閱讀

    深入淺出學(xué)習(xí)250個通信原理資源下載

    深入淺出學(xué)習(xí)250個通信原理資源下載
    發(fā)表于 04-12 09:16 ?28次下載