0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Linux中匿名頁的訪問分析

Linux閱碼場 ? 來源:Linux內(nèi)核遠航者 ? 作者:Linux內(nèi)核遠航者 ? 2021-10-12 17:52 ? 次閱讀

Linux有后備文件支持的頁稱為文件頁,如屬于進程的代碼段、數(shù)據(jù)段的頁,內(nèi)存回收的時候這些頁面只需要做臟頁的同步即可(干凈的頁面可以直接丟棄掉)。反之為匿名頁,如進程的堆棧使用的頁,內(nèi)存回收的時候這些頁面不能簡單的丟棄掉,需要交換到交換分區(qū)或交換文件。本文中,主要分析匿名頁的訪問將發(fā)生哪些可能顛覆我們認知的"化學反應"。

1.實例代碼

首先以一個簡單的示例代碼來說明:

#include
#include
#include
#include
#include

#defineMAP_SIZE(100*1024*1024)

intmain(intargc,char*argv[])
{
char*p;
charval;
inti;

puts("beforemmapok,pleaceexec'free-m'!");
sleep(5);


//mmap

p=mmap(NULL,MAP_SIZE,PROT_READ|PROT_WRITE,MAP_PRIVATE|MAP_ANONYMOUS,-1,0);
if(p==NULL){
perror("failtomalloc");
return-1;
}
puts("aftermmapok,pleaceexec'free-m'!");
sleep(5);


//read
for(i=0;i"readok,pleaceexec'free-m'!");
sleep(5);

#if1
//write
memset(p,0x55,MAP_SIZE);
puts("writeok,pleaceexec'free-m'!");
#endif
//sleep
pause();

return0;
}

代碼非常簡單:首先通過mmap分配100M的私有可讀可寫匿名頁面,然后進行讀寫訪問,分別在提示的時候在另外一個窗口執(zhí)行free -m命令查看輸出結果。

程序執(zhí)行結果如下:

$./anon_rw_demo
beforemmapok,pleaceexec'free-m'!
aftermmapok,pleaceexec'free-m'!
readok,pleaceexec'free-m'!
writeok,pleaceexec'free-m'!


命令執(zhí)行結果如下:

$free-m
總計已用空閑共享緩沖/緩存可用
內(nèi)存: 15729  8286  1945  895  5497  6220
交換: 16290 1599  14691
$free-m
總計已用空閑共享緩沖/緩存可用
內(nèi)存: 15729  8286  1945  895  5497  6220
交換: 16290 1599  14691
$free-m
總計已用空閑共享緩沖/緩存可用
內(nèi)存: 15729  8286  1945  895  5497  6220
交換: 16290 1599  14691
$free-m
總計已用空閑共享緩沖/緩存可用
內(nèi)存: 15729  8383  1848  895  5497  6123
交換: 16290 1599  14691

可以看到:

第一次提示執(zhí)行free命令的時候,我們還沒有開始通過mmap分配內(nèi)存,此時free命令輸出作為參考。

第二次提示執(zhí)行free命令的時候,我們已經(jīng)通過mmap分配了100M的內(nèi)存,此時發(fā)現(xiàn)free命令輸出內(nèi)存消耗基本沒有變化。

第三次提示執(zhí)行free命令的時候,我們對于分配的匿名頁面進行了讀操作,此時發(fā)現(xiàn)free命令輸出內(nèi)存消耗頁基本沒有變化,這基本上會顛覆我們的認知。

第四次提示執(zhí)行free命令的時候,我們對于分配的匿名頁面進行了寫操作,此時發(fā)現(xiàn)free命令輸出內(nèi)存消耗大概為100M。

2.內(nèi)核原理

下面我們從Linux內(nèi)核的層面來解析發(fā)生以上神奇現(xiàn)象的原理。

2.1 mmap的內(nèi)存消耗

mmap申請匿名頁的時候,只是申請了虛擬內(nèi)存(通過vm_area_struct結構來描述,如描述虛擬內(nèi)存區(qū)域的地址范圍、訪問權限等,以下簡稱vma),實際的物理內(nèi)存并沒有申請(除了用于管理虛擬內(nèi)存區(qū)域的vma等結構內(nèi)存的申請),當前虛擬內(nèi)存和物理內(nèi)存并沒有建立頁表映射關系,而真正的申請的匿名頁所對應的物理頁在實際訪問的時候按需分配獲得,所以此時我們看不到內(nèi)存的消耗情況。

2.2 第一次讀匿名頁的內(nèi)存消耗

通過mmap申請完虛擬內(nèi)存之后,進程就可以按照之前申請vma的訪問權限進行訪問,第一發(fā)生讀訪問,這個時候由于虛擬內(nèi)存和物理內(nèi)存并沒有建立頁表映射關系,通過虛擬地址并不能查找到物理內(nèi)存,所以會發(fā)生處理器的異常,最終分析是因為數(shù)據(jù)訪問異常導致,就由處理器架構相關的代碼進入了我們通用的缺頁異常處理例程中。

缺頁異常調(diào)用鏈如下:

"mm/memory.c"

處理器架構相關異常處理代碼
->handle_mm_fault
->__handle_mm_fault
->handle_pte_fault
->if(!vmf->pte){-------------------1
if(vma_is_anonymous(vmf->vma))-------------------2
returndo_anonymous_page(vmf);-------------------3

缺頁異常進入handle_pte_fault后,在1標簽代碼處,來判斷訪問的虛擬內(nèi)存頁的頁表項是否為空,為空說明這個這個虛擬頁沒有和物理頁建立映射關系。然后在2標簽代碼處判斷是否為匿名頁缺頁異常(實際上是判斷是否為私有的匿名頁,當前當前示例代碼場景申請的為私有匿名頁面)。在3標簽代碼處,進行真正的私有匿名頁缺頁異常處理。

下面主要看下第一次讀匿名頁的處理:

do_anonymous_page
->pte_alloc(vma->vm_mm,vmf->pmd)-------------------1
->/*Usethezero-pageforreads*/
if(!(vmf->flags&FAULT_FLAG_WRITE)&&-------------------2
!mm_forbids_zeropage(vma->vm_mm)){-------------------3
entry=pte_mkspecial(pfn_pte(my_zero_pfn(vmf->address),
vma->vm_page_prot));-------------------4
vmf->pte=pte_offset_map_lock(vma->vm_mm,vmf->pmd,
vmf->address,&vmf->ptl);-------------------5

...
gotosetpte;
}
->page=alloc_zeroed_user_highpage_movable(vma,vmf->address);-------------------6
->entry=mk_pte(page,vma->vm_page_prot);-------------------7
entry=pte_sw_mkyoung(entry);-------------------8
if(vma->vm_flags&VM_WRITE)
entry=pte_mkwrite(pte_mkdirty(entry));-------------------9

vmf->pte=pte_offset_map_lock(vma->vm_mm,vmf->pmd,vmf->address,
&vmf->ptl);-------------------10

->set_pte_at(vma->vm_mm,vmf->address,vmf->pte,entry);-------------------11

1標簽處:判斷虛擬地址對應的pmd表項是否為空,為空來分配直接頁表設置到pmd表項中。

2標簽處:判斷是否是進行讀訪問。

3標簽處:判斷是否沒有禁止0頁。

4標簽處:就是對于沒有禁止0頁的匿名頁讀訪問設置頁表,這里通過0頁的頁幀號和mmap映射時指定的訪問權限組合頁表項的值。

5標簽處:通過發(fā)生缺頁的虛擬地址來計算出頁表項的地址保存在 vmf->pte。

最11標簽處:將4標簽初組合出的頁表項的值寫入到5標簽初計算出的頁表項中。

以上分析可知:對于私有的匿名頁,第一次讀訪問的時候都會發(fā)生缺頁異常,然后通過頁表映射0頁,這個0頁沒有什么特殊之處,只不過它是在系統(tǒng)啟動過程中初始化好的一塊內(nèi)容全為0的頁面,這樣做可以為進程分配了內(nèi)存只進行讀訪問節(jié)省大量物理內(nèi)存。

2.3 第一次寫匿名頁的內(nèi)存消耗

大家可以將示例代碼中,讀訪問屏蔽掉只進行寫訪問,觀察內(nèi)存消耗。

這個時候發(fā)生缺頁異常時,不會在走2 3 4 5 便簽處代碼,而在6處分配了一個物理頁面,在7 8 9組合頁表項的值, 10處計算出頁表項的地址,最后把組合的值設置到頁表項中。

需要注意第9處,如果是寫訪問會設置頁表項的可寫標志位。

以上分析可知:對于私有的匿名頁,第一次寫訪問的時候都會發(fā)生缺頁異常,會真正分配一個物理頁面,然后將虛擬頁面通過頁面映射到物理頁面,所以我們能觀察到寫之后發(fā)生了大量內(nèi)存消耗。

2.4 第一次讀然后寫匿名頁的內(nèi)存消耗

這種場景就是示例代碼中所做的實驗,可以看到讀的時候基本上沒有內(nèi)存消耗,寫的時候發(fā)生了大量內(nèi)存消耗。

關于第一次讀,上面已經(jīng)做過解釋,下面主要看讀完之后的頁面發(fā)生寫訪問的情況。

2.4.1 從mmap說起

實際上,對于一個私有的內(nèi)存映射,在mmap的時候為頁表映射準備訪問權限的時候并不是給予所有的權限,而是把可寫屬性去掉了。

我們可以從源代碼找到答案:

"mm/mmap.c"

do_mmap
->mmap_region
->vma_set_page_prot(vma)
->vm_page_prot=vm_pgprot_modify(vma->vm_page_prot,vm_flags);---------1
->pgprot_modify(oldprot,vm_get_page_prot(vm_flags))
->WRITE_ONCE(vma->vm_page_prot,vm_page_prot);---------------2


/*descriptionofeffectsofmappingtypeandprotincurrentimplementation.
*thisisduetothelimitedx86pageprotectionhardware.Theexpected
*behaviorisinparens:
*
*map_typeprot
*PROT_NONEPROT_READPROT_WRITEPROT_EXEC
*MAP_SHAREDr:(no)nor:(yes)yesr:(no)yesr:(no)yes
*w:(no)now:(no)now:(yes)yesw:(no)no
*x:(no)nox:(no)yesx:(no)yesx:(yes)yes
*
*MAP_PRIVATEr:(no)nor:(yes)yesr:(no)yesr:(no)yes
*w:(no)now:(no)now:(copy)copyw:(no)no
*x:(no)nox:(no)yesx:(no)yesx:(yes)yes
*/
->vm_get_page_prot
pgprot_tprotection_map[16]__ro_after_init={
__P000,__P001,__P010,__P011,__P100,__P101,__P110,__P111,
__S000,__S001,__S010,__S011,__S100,__S101,__S110,__S111
};


對于__Pxxx, 最后一個x表示vma屬性是否可讀,倒數(shù)第二個x表示vma屬性是否可寫,P后面的x表示是否可執(zhí)行。

1標簽處根據(jù)mmap傳遞的訪問權限來構造最終的訪問權限標識。

2標簽處將構造好的訪問權限標識記錄到vma->vm_page_prot中,供缺頁異常設置頁表使用。

注釋中已經(jīng)做了詳細的解釋,具體頁表屬性如何表示由各自的處理器架構相關代碼來做(eg: 對于x86架構 #define __P111 PAGE_COPY_EXEC),我們只需要知道:無論我們想讓vma具備那些屬性組合,都會屏蔽掉寫屬性,具體可以查看相關的處理器架構實現(xiàn)。

所以,再次回到缺頁異常處理代碼中。在2.2小節(jié)的4標簽處,使用mmap設置好的頁表訪問權限設置頁表屬性,當前場景我們知道,mmap中指定為私有的可讀可寫屬性,而頁表中只是設置為了只讀屬性。

2.4.2 寫時復制的觸發(fā)

讀訪問將虛擬頁以只讀的方式映射到了0頁,當再次發(fā)生寫操作時,就會再次觸數(shù)據(jù)訪問異常,最終進入缺頁異常處理例程中。

下面給出調(diào)用鏈:

"mm/memory.c"

handle_pte_fault
->if(vmf->flags&FAULT_FLAG_WRITE){-----------1
if(!pte_write(entry))-----------2
returndo_wp_page(vmf);-----------3

可以看到最終也是在handle_pte_fault中處理:在1標簽處判斷是否為寫訪問。在2標簽處判斷頁表項的屬性是否是只讀。在3標簽處進行實際的寫時復制處理。

以上分析可知:發(fā)生寫訪問操作時,如果vma可寫,但是頁表屬性標識不可寫(只讀),會發(fā)生寫時復制缺頁異常,對于當前場景的0頁的寫訪問就是如此,在do_wp_page中會重新分配物理頁面映射到虛擬頁面,然后頁表設置為可寫屬性,就完成了缺頁處理。

3.總結

1)mmap分配私有匿名內(nèi)存時,會設置vma的vm_page_prot成員,去除掉頁表的寫訪問標識。

2)第一次讀匿名頁時,對于可讀可寫的vma,虛擬頁會以只讀的方式映射到0頁。

3)第一次寫匿名頁時,對于可讀可寫的vma,會申請物理頁面,虛擬頁以可讀可寫的方式映射到此物理頁。

4)第一次讀匿名頁后,然后寫匿名頁,先只讀方式映射到0頁,然后發(fā)生寫時復制,分配物理頁,虛擬頁以可讀可寫的方式映射到此物理頁。

可以發(fā)現(xiàn),訪問匿名頁面時發(fā)生的“化學反應”并不是那么的簡單,其中會涉及mmap的映射原則,0頁的映射,匿名頁面的處理,寫時復制的處理等等,而且讀寫順序不一樣,產(chǎn)生的結果也會不一樣,大家可以結合內(nèi)核源代碼進行分析,希望對大家理解匿名頁缺頁異常有所幫助。

責任編輯:haq


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Linux
    +關注

    關注

    87

    文章

    11336

    瀏覽量

    210097
  • 代碼
    +關注

    關注

    30

    文章

    4819

    瀏覽量

    68879

原文標題:3.總結

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Linux lsof命令的基本用法

    linux 系統(tǒng),一切皆文件。通過文件不僅僅可以訪問常規(guī)數(shù)據(jù),還可以訪問網(wǎng)絡連接和硬件。所以 lsof 命令不僅可以查看進程打開的文件、目錄,還可以查看進程監(jiān)聽的端口等 sock
    的頭像 發(fā)表于 10-23 11:52 ?385次閱讀
    <b class='flag-5'>Linux</b> lsof命令的基本用法

    存儲器訪問速度最快的是什么

    在探討存儲器訪問速度最快的是哪一種時,我們首先需要了解計算機存儲系統(tǒng)的層次結構以及各類存儲器的特性和功能。計算機存儲系統(tǒng)通常包括多個層次的存儲器,從速度最快、容量最小的寄存器開始,到速度較慢、容量較大的外存儲器結束。這些存儲器在訪問
    的頭像 發(fā)表于 10-12 17:01 ?2304次閱讀

    匿名瀏覽到數(shù)據(jù)安全:代理IP用戶心聲全記錄

    匿名瀏覽到數(shù)據(jù)安全,代理IP技術在現(xiàn)代網(wǎng)絡環(huán)境扮演著重要角色。以下是代理IP用戶心聲的全記錄,涵蓋了其應用、優(yōu)勢、挑戰(zhàn)及用戶心聲。
    的頭像 發(fā)表于 09-30 08:59 ?232次閱讀

    動態(tài)代理IP的匿名性和透明度,為主要考慮關鍵!

    動態(tài)代理IP的匿名性和透明度是用戶選擇代理服務時需要考慮的關鍵因素。根據(jù)用戶的需求和場景,可以選擇不同匿名級別和透明度的代理服務來平衡隱私保護和網(wǎng)絡訪問的需求。
    的頭像 發(fā)表于 09-20 07:36 ?317次閱讀
    動態(tài)代理IP的<b class='flag-5'>匿名</b>性和透明度,為主要考慮關鍵!

    Linux內(nèi)核表映射的基礎知識

    大家在看內(nèi)核代碼時會經(jīng)??吹囊陨闲g語,但在ARM的芯片手冊并沒有用到這些術語,而是使用L1,L2,L3表這種術語。
    的頭像 發(fā)表于 08-07 15:53 ?1093次閱讀
    <b class='flag-5'>Linux</b>內(nèi)核<b class='flag-5'>中</b><b class='flag-5'>頁</b>表映射的基礎知識

    Linux內(nèi)核的頁面分配機制

    Linux內(nèi)核是如何分配出頁面的,如果我們站在CPU的角度去看這個問題,CPU能分配出來的頁面是以物理頁面為單位的。也就是我們計算機中常講的分頁機制。本文就看下Linux內(nèi)核是如何管理,釋放和分配這些物理頁面的。
    的頭像 發(fā)表于 08-07 15:51 ?331次閱讀
    <b class='flag-5'>Linux</b>內(nèi)核<b class='flag-5'>中</b>的頁面分配機制

    Linux查看IP地址的方法

    ifconfig是一個網(wǎng)絡管理工具,用于配置、控制和查詢網(wǎng)絡接口。在許多舊的Linux發(fā)行版,ifconfig是查看和配置網(wǎng)絡接口的主要工具。
    的頭像 發(fā)表于 08-07 15:16 ?7815次閱讀
    在<b class='flag-5'>Linux</b><b class='flag-5'>中</b>查看IP地址的方法

    詳解Linux的權限控制

    本章將和大家分享Linux的權限控制。廢話不多說,下面我們直接進入主題。
    的頭像 發(fā)表于 08-05 15:32 ?653次閱讀
    詳解<b class='flag-5'>Linux</b><b class='flag-5'>中</b>的權限控制

    云服務器linux搭建ftp服務訪問不了怎么解決?

    如果你在云服務器linux上搭建了FTP服務但無法訪問,這可能是由于幾種原因引起的。以下是一些常見問題和解決方法: 1、防火墻配置:確保防火墻允許FTP流量通過。FTP服務器通常使用端口21(控制
    的頭像 發(fā)表于 04-18 17:23 ?1625次閱讀

    使用 PREEMPT_RT 在 Ubuntu 構建實時 Linux 內(nèi)核

    盟通技術干貨構建實時Linux內(nèi)核簡介盟通技術干貨Motrotech如果需要在Linux實現(xiàn)實時計算性能,進而有效地將Linux轉變?yōu)镽TOS,那么大多數(shù)發(fā)行版都可以打上名為PREE
    的頭像 發(fā)表于 04-12 08:36 ?2691次閱讀
    使用 PREEMPT_RT 在 Ubuntu <b class='flag-5'>中</b>構建實時 <b class='flag-5'>Linux</b> 內(nèi)核

    loongarch是如何區(qū)分大和基本頁的?

    在開發(fā)loongarch架構的操作系統(tǒng)的時候,我遇到了這樣的問題:我不知道硬件是如何區(qū)分大和基本頁的。 如圖,關于基本頁和大的格式在手冊是這樣的敘述的: 即便手冊闡述了基本頁和
    發(fā)表于 03-30 12:05

    Linux內(nèi)核內(nèi)存管理之內(nèi)核非連續(xù)物理內(nèi)存分配

    我們已經(jīng)知道,最好將虛擬地址映射到連續(xù)幀,從而更好地利用緩存并實現(xiàn)更低的平均內(nèi)存訪問時間。然而,如果對內(nèi)存區(qū)域的請求并不頻繁,那么考慮基于通過連續(xù)線性地址訪問非連續(xù)幀的分配方案是有
    的頭像 發(fā)表于 02-23 09:44 ?1054次閱讀
    <b class='flag-5'>Linux</b>內(nèi)核內(nèi)存管理之內(nèi)核非連續(xù)物理內(nèi)存分配

    Linux內(nèi)存管理之CPU本地幀緩存

    在前一節(jié),我們學習了buddy伙伴關系系統(tǒng),它適用于申請連續(xù)的大塊物理內(nèi)存;而有些時候,經(jīng)常需要申請和釋放單個幀。
    的頭像 發(fā)表于 02-20 09:23 ?547次閱讀

    Linux系統(tǒng)設置環(huán)境變量的方法和技巧

    Linux中環(huán)境變量是一種保存有關系統(tǒng)環(huán)境配置的信息的對象。它們被廣泛用于存儲有關系統(tǒng)操作的信息比如路徑、文件名等。通過合理配置環(huán)境變量我們可以方便地訪問和執(zhí)行各種命令和程序。
    的頭像 發(fā)表于 02-01 11:09 ?1739次閱讀
    <b class='flag-5'>Linux</b>系統(tǒng)<b class='flag-5'>中</b>設置環(huán)境變量的方法和技巧

    鴻蒙ArkUI開發(fā)-實現(xiàn)增刪Tab

    本文以瀏覽器增加或刪除簽為例,實現(xiàn)Tabs簽的增刪功能。
    的頭像 發(fā)表于 01-29 18:43 ?1622次閱讀
    鴻蒙ArkUI開發(fā)-實現(xiàn)增刪Tab<b class='flag-5'>頁</b>簽