0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

解析Linux內核頁表管理中那些鮮為人知的秘密

Linux閱碼場 ? 來源:Linux內核遠航者 ? 作者:Linux內核遠航者 ? 2021-06-11 16:32 ? 次閱讀

1.開場白

環(huán)境:

處理器架構:arm64

內核源碼:linux-5.11

ubuntu版本:20.04.1

代碼閱讀工具:vim+ctags+cscope

通用操作系統(tǒng),通常都會開啟mmu來支持虛擬內存管理,而頁表管理是在虛擬內存管理中尤為重要,本文主要以回答幾個頁表管理中關鍵性問題來解析Linux內核頁表管理,看一看頁表管理中那些鮮為人知的秘密。

2.頁表的作用是什么?

1)地址轉換

將虛擬地址轉換為物理地址

2)權限管理

管理cpu對物理頁的訪問,如讀寫執(zhí)行權限

3)隔離地址空間

隔離各個進程的地址空間,使其互不影響,提供系統(tǒng)的安全性

打開mmu后,對沒有頁表映射的虛擬內存訪問或者有頁表映射但是沒有訪問權限都會發(fā)生處理器異常,內核選擇殺死進程或者panic;通過頁表給一段內存設置用戶態(tài)不可訪問, 這樣可以做到用戶態(tài)的用戶進程不能訪問內核地址空間的內容;而由于用戶進程各有一套自己的頁表,所以彼此看不到對方的地址空間,更別提訪問,造成每個進程都認為自己擁有所有虛擬內存的錯覺;通過頁表給一段內存設置只讀屬性,那么就不容許修改這段內存內容,從而保護了這段內存不被改寫;對應用戶進程地址空間映射的物理內存,內核可以很方便的進行頁面遷移和頁面交換,而對使用虛擬地址的用戶進程來說是透明的;通過頁表,很容易實現內存共享,使得一份共享庫很多進程都可以映射到自己地址空間使用;通過頁表,可以小內存加載大應用程序運行,在運行時按需加載和映射。..

3.頁表的存放在哪?

頁表存放在物理內存中,打開mmu之后,如果需要修改頁表,需要將頁表所在的物理地址映射到虛擬地址才能訪問頁表(如內核初始化后會將物理內存線性映射,這樣通過物理地址和虛擬地址的偏移就可以獲得頁表物理地址對應的虛擬地址)。

4. 頁表項中存放是虛是實?

頁表基地址寄存器和各級頁表項中存放的都是物理地址,而不是虛擬地址。

5. 開啟mmu后地址轉換過程?

虛擬地址轉換物理地址的過程:打開mmu后,cpu訪問的都是虛擬地址,當cpu訪問一個虛擬地址的時候,會通過cpu內部的mmu來查詢物理地址,mmu首先通過虛擬地址在tlb中查找,如果找到相應表項,直接獲得物理地址;如果tlb沒有找到,就會通過虛擬地址從頁表基地址寄存器保存的頁表基地址開始查詢多級頁表,最終查詢到找到相應表項,會將表項緩存到tlb中,然后從表項中獲得物理地址。

6. Linux內核為何使用多級頁表?

1)使用一級頁表結構優(yōu)劣:

優(yōu)勢:

只需要2次訪問內存(一次訪問頁表,一次訪問數據),效率高,實現簡單

劣勢:

需要連續(xù)的大塊內存存放每個進程的頁表(如32位系統(tǒng)每個進程需要4M頁表),浪費內存,虛擬內存越大頁表越大,內存碎片化的時候很難分配到連續(xù)大塊內存,大多數虛擬內存并沒有使用。

2)使用多級頁表結構優(yōu)劣:

優(yōu)勢:

1.節(jié)省內存

2.可以按需分配各級頁表

3.可以離散存儲頁表

劣勢:

需要遍歷多級頁表,需要多次訪問內存,實現復雜度高點

3)Linux內核綜合考慮:

典型的以時間換空間,可以將各級頁表放到物理內存的任何地方,無論是硬件遍歷還是內核遍歷,比一級頁表更復雜,但是為了節(jié)省內存,內核選擇多級頁表結構。

7.減小多級頁表遍歷的優(yōu)化?

1)mmu中添加tlb

來緩存最近訪問的頁表表項,根據程序的時間和空間的局部性原理,tlb能有很高的命中率。

2)使用巨型頁

減少訪存次數(如使用1G或2M巨型頁),可以減少tlb miss和缺頁異常。

8. 硬件做了哪些事情?

遍歷頁表,將va轉換為pa,頁面權限管理

涉及到的硬件為:

mmu

->功能:查詢tlb或者遍歷頁表

tlb

->功能:緩存最近轉換的頁表條目

頁表基地址寄存器 如ttbr0_el1 ttbr1_el1

->功能:存放頁表基地址(物理地址)作為mmu遍歷多級頁表的起點

mmu進行多級頁表遍歷時當發(fā)現虛擬地址的最高bit為1時使用 ttbr1_el1作為遍歷起點,最高bit為0時使用 ttbr0_el1作為遍歷起點。

9. 軟件做了哪些事情?

1)應用程序

訪問虛擬內存即可如執(zhí)行指令、讀寫內存, 沒有權限管理頁表

不管虛擬內存如何轉換為物理內存,對應用來說透明。

2)Linux內核

填寫頁表,將頁表基地址告訴mmu

內核初始化建立內核頁表,實現缺頁異常等機制為用戶任務按需分配并映射頁表。

當然,內核也可以遍歷頁表,如缺頁異常時遍歷進程頁表。

10. 內核中涉及到的頁表基地址?

內核:

idmap_pg_dir 恒等映射頁表(va=pa 映射2M)

init_pg_dir 粗粒度內核頁表

swapper_pg_dir 主內核頁表

用戶:

tsk->mm->pgd用戶進程fork的時候分配私有的pgd頁,用于保存pgd表項(僅僅分配了第一級頁表)。

11. 頁表填寫/切換時機

1)內核頁表填充

內核初始化過程:

物理地址 -> 恒等映射(建立恒等映射頁表和粗粒度內核頁表) ->打開mmu -> paging_init(建立細粒度的內核頁表和內存線性映射) -> 。..

恒等映射階段:

將恒等映射頁表idmap_pg_dir 地址保存到ttbr0_el1

將 粗粒度內核頁表init_pg_dir 地址保存到ttbr1_el1

paging_init階段:

將內核主頁表swapper_pg_dir 地址保存到ttbr1_el1

paging_init之后丟棄idmap_pg_dir 和init_pg_dir 頁表的使用。

2)用戶頁表填充

訪問時缺頁填充:

用戶進程訪問已經申請的虛擬內存時,發(fā)生缺頁,缺頁處理程序中為進程分配各級頁表等物理頁并建立頁表映射關系。

進程切換時切換進程頁表:

switch_mm的時候切換tsk->mm->pgd到ttbr0_el1以及asid 到ttbr1_el1,從而完成了進程地址空間切換。

12.頁表遍歷過程

下面以arm64處理器架構多級頁表遍歷作為結束(使用4級頁表,頁大小為4K):

Linux內核中 可以將頁表擴展到5級,分別是頁全局目錄(Page Global Directory, PGD), 頁4級目錄(Page 4th Directory, P4D), 頁上級目錄(Page Upper Directory, PUD),頁中間目錄(Page Middle Directory, PMD),直接頁表(Page Table, PT),而支持arm64的linux使用4級頁表結構分別是 pgd, pud, pmd, pt ,arm64手冊中將他們分別叫做L0,L1,L2,L3級轉換表,所以一下使用L0-L3表示各級頁表。

tlb miss時,mmu會進行多級頁表遍歷遍歷過程如下:

1.mmu根據虛擬地址的最高位判斷使用哪個頁表基地址寄存器作為起點:當最高位為0時,使用ttbr0_el1作為起點(訪問的是用戶空間地址);當最高位為1時,使用ttbr1_el1作為起點(訪問的是內核空間地址)mmu從相應的頁表基地址寄存器中獲得L0轉換表基地址。

2.找到L0級轉換表,然后從虛擬地址中獲得L0索引,通過L0索引找到相應的表項(arm64中稱為L0表描述符,內核中叫做PGD表項),從表項中獲得L1轉換表基地址。

3.找到L1級轉換表,然后從虛擬地址中獲得L1索引,通過L1索引找到相應的表項(arm64中稱為L1表描述符,內核中叫做PUD表項),從表項中獲得L2轉換表基地址。

4.找到L2級轉換表,然后從虛擬地址中獲得L2索引,通過L2索引找到相應的表項(arm64中稱為L2表描述符,內核中叫做PUD表項),從表項中獲得L3轉換表基地址。

5.找到L3級轉換表,然后從虛擬地址中獲得L3索引,通過L3索引找到頁表項(arm64中稱為頁描述符,內核中叫做頁表項)。

6.從頁表項中取出物理頁幀號然后加上物理地址偏移(VA[11,0])獲得最終的物理地址。

原文標題:Linux內核頁表管理-那些鮮為人知的秘密

文章出處:【微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 內核
    +關注

    關注

    3

    文章

    1372

    瀏覽量

    40300
  • Linux
    +關注

    關注

    87

    文章

    11310

    瀏覽量

    209616

原文標題:Linux內核頁表管理-那些鮮為人知的秘密

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Linux系統(tǒng)shell命令解析

    shell是Linux系統(tǒng)的用戶界面,提供了用戶與內核交互的一種接口,它接收用戶輸入的命令并到送到內核去執(zhí)行,因此也被稱為Linux的命令解釋器。
    的頭像 發(fā)表于 11-05 15:40 ?273次閱讀

    linux內核通用HID觸摸驅動

    linux內核,為HID觸摸面板實現了一個通用的驅動程序,位于/drivers/hid/hid-multitouch.c文件。hid觸摸驅動是以struct hid_driver
    的頭像 發(fā)表于 10-29 10:55 ?666次閱讀
    <b class='flag-5'>linux</b><b class='flag-5'>內核</b><b class='flag-5'>中</b>通用HID觸摸驅動

    linux驅動程序如何加載進內核

    Linux系統(tǒng),驅動程序是內核與硬件設備之間的橋梁。它們允許內核與硬件設備進行通信,從而實現對硬件設備的控制和管理。 驅動程序的編寫 驅
    的頭像 發(fā)表于 08-30 15:02 ?486次閱讀

    Linux內核測試技術

    Linux 內核Linux操作系統(tǒng)的核心部分,負責管理硬件資源和提供系統(tǒng)調用接口。隨著 Linux
    的頭像 發(fā)表于 08-13 13:42 ?508次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內核</b>測試技術

    Linux內核映射的基礎知識

    大家在看內核代碼時會經??吹囊陨闲g語,但在ARM的芯片手冊并沒有用到這些術語,而是使用L1,L2,L3這種術語。
    的頭像 發(fā)表于 08-07 15:53 ?931次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內核</b><b class='flag-5'>中</b><b class='flag-5'>頁</b><b class='flag-5'>表</b>映射的基礎知識

    Linux內核的頁面分配機制

    Linux內核是如何分配出頁面的,如果我們站在CPU的角度去看這個問題,CPU能分配出來的頁面是以物理頁面為單位的。也就是我們計算機中常講的分頁機制。本文就看下Linux
    的頭像 發(fā)表于 08-07 15:51 ?299次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內核</b><b class='flag-5'>中</b>的頁面分配機制

    歡創(chuàng)播報 華為宣布鴻蒙內核已超越Linux內核

    1 華為宣布鴻蒙內核已超越Linux內核 ? 6月21日,在華為開發(fā)者大會上, HarmonyOS NEXT(鴻蒙NEXT)——真正獨立于安卓和iOS的鴻蒙操作系統(tǒng),正式登場。這是HarmonyOS
    的頭像 發(fā)表于 06-27 11:30 ?849次閱讀

    蘋果谷歌200億美元秘密交易曝光

    在近期美國司法部對谷歌提起的反壟斷訴訟,一項此前鮮為人知的巨額交易細節(jié)被曝光。據法庭文件顯示,谷歌在2022年向蘋果支付了高達200億美元的款項。這一巨額交易背后,其實質是確保谷歌能夠持續(xù)作為蘋果Safari瀏覽器在iPhone、iPad及Mac設備上的默認搜索引擎。
    的頭像 發(fā)表于 05-07 09:47 ?336次閱讀

    使用 PREEMPT_RT 在 Ubuntu 構建實時 Linux 內核

    盟通技術干貨構建實時Linux內核簡介盟通技術干貨Motrotech如果需要在Linux實現實時計算性能,進而有效地將Linux轉變?yōu)镽T
    的頭像 發(fā)表于 04-12 08:36 ?2536次閱讀
    使用 PREEMPT_RT 在 Ubuntu <b class='flag-5'>中</b>構建實時 <b class='flag-5'>Linux</b> <b class='flag-5'>內核</b>

    Linux內核內存管理內核非連續(xù)物理內存分配

    的主要優(yōu)點是避免了外部碎片,而缺點是需要修改內核。顯然,非連續(xù)內存區(qū)域的大小必須是4096的倍數。Linux使用非連續(xù)物理內存區(qū)的場景有幾種:(1)為swap區(qū)分配數據結構;(2)
    的頭像 發(fā)表于 02-23 09:44 ?983次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內核</b>內存<b class='flag-5'>管理</b>之<b class='flag-5'>內核</b>非連續(xù)物理內存分配

    Linux內核內存管理之ZONE內存分配器

    內核中使用ZONE分配器滿足內存分配請求。該分配器必須具有足夠的空閑幀,以便滿足各種內存大小請求。
    的頭像 發(fā)表于 02-21 09:29 ?906次閱讀

    Linux內存管理之CPU本地幀緩存

    在前一節(jié),我們學習了buddy伙伴關系系統(tǒng),它適用于申請連續(xù)的大塊物理內存;而有些時候,經常需要申請和釋放單個幀。
    的頭像 發(fā)表于 02-20 09:23 ?507次閱讀

    C++在Linux內核開發(fā)從爭議到成熟

    Linux 內核郵件列表中一篇已有六年歷史的老帖近日再次引發(fā)激烈討論 —— 主題是建議將 Linux 內核的開發(fā)語言從 C 轉換為更現代的 C++。
    的頭像 發(fā)表于 01-31 14:11 ?638次閱讀
    C++在<b class='flag-5'>Linux</b><b class='flag-5'>內核</b>開發(fā)<b class='flag-5'>中</b>從爭議到成熟

    linux內核主要由哪幾個部分組成,作用是什么

    Linux內核主要由以下幾個部分組成: 進程管理Linux內核負責管理和調度系統(tǒng)
    的頭像 發(fā)表于 01-22 14:34 ?2705次閱讀

    Linux內核內存管理架構解析

    內存管理子系統(tǒng)可能是linux內核中最為復雜的一個子系統(tǒng),其支持的功能需求眾多,如頁面映射、頁面分配、頁面回收、頁面交換、冷熱頁面、緊急頁面、頁面碎片管理、頁面緩存、頁面統(tǒng)計等,而且對
    的頭像 發(fā)表于 01-04 09:24 ?669次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內核</b>內存<b class='flag-5'>管理</b>架構<b class='flag-5'>解析</b>