0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Linux內(nèi)核內(nèi)存管理架構(gòu)解析

技術(shù)讓夢(mèng)想更偉大 ? 來(lái)源:技術(shù)讓夢(mèng)想更偉大 ? 2024-01-04 09:24 ? 次閱讀

作者 | 大師兄


內(nèi)存管理子系統(tǒng)可能是linux內(nèi)核中最為復(fù)雜的一個(gè)子系統(tǒng),其支持的功能需求眾多,如頁(yè)面映射、頁(yè)面分配、頁(yè)面回收、頁(yè)面交換、冷熱頁(yè)面、緊急頁(yè)面、頁(yè)面碎片管理、頁(yè)面緩存、頁(yè)面統(tǒng)計(jì)等,而且對(duì)性能也有很高的要求。本文從內(nèi)存管理硬件架構(gòu)、地址空間劃分和內(nèi)存管理軟件架構(gòu)三個(gè)方面入手,嘗試對(duì)內(nèi)存管理的軟硬件架構(gòu)做一些宏觀上的分析總結(jié)。

002277a6-aa9d-11ee-8b88-92fbcf53809c.png

來(lái)自:極客星球-深入理解Linux內(nèi)存子系統(tǒng)。

內(nèi)存管理硬件架構(gòu)

因?yàn)閮?nèi)存管理是內(nèi)核最為核心的一個(gè)功能,針對(duì)內(nèi)存管理性能優(yōu)化,除了軟件優(yōu)化,硬件架構(gòu)也做了很多的優(yōu)化設(shè)計(jì)。下圖是一個(gè)目前主流處理器上的存儲(chǔ)器層次結(jié)構(gòu)設(shè)計(jì)方案。

00292592-aa9d-11ee-8b88-92fbcf53809c.png

從圖中可以看出,對(duì)于邏輯cache架構(gòu)讀寫內(nèi)存,硬件設(shè)計(jì)了3條優(yōu)化路徑。

1)首先L1 cache支持虛擬地址尋址,保證CPU出來(lái)的虛擬地址(VA)不需要轉(zhuǎn)換成物理地址(PA)就可以用來(lái)直接查找L1 cache,提高cache查找效率。當(dāng)然用VA查找cache,有安全等缺陷,這需要CPU做一些特別的設(shè)計(jì)來(lái)進(jìn)行彌補(bǔ),具體可以閱讀《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法》了解相關(guān)細(xì)節(jié)。

2)如果L1 cache沒(méi)有命中,這就需要進(jìn)行地址轉(zhuǎn)換,把VA轉(zhuǎn)換成PA。linux的內(nèi)存映射管理是通過(guò)頁(yè)表來(lái)實(shí)現(xiàn)的,但是頁(yè)表是放在內(nèi)存中的,如果每次地址轉(zhuǎn)換過(guò)程都需要訪問(wèn)一次內(nèi)存,其效率是十分低下的。這里CPU通過(guò)TLB硬件單元(在MMU中)來(lái)加速地址轉(zhuǎn)換。

3)獲得PA后,在L2 cache中再查找緩存數(shù)據(jù)。L2 cache一般比L1 cache大一個(gè)數(shù)量級(jí),其查找命中率也更高。如果命中獲得數(shù)據(jù),則可避免去訪問(wèn)內(nèi)存,提高訪問(wèn)效率。

002f7172-aa9d-11ee-8b88-92fbcf53809c.png

來(lái)自:極客星球-深入理解Linux內(nèi)存子系統(tǒng)。

可見(jiàn),為了優(yōu)化內(nèi)存訪問(wèn)效率,現(xiàn)代處理器引入多級(jí)cache、TLB等硬件模塊。每個(gè)硬件模塊內(nèi)部還有大量的設(shè)計(jì)細(xì)節(jié),這里不再深入,如有興趣可以閱讀《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法》等書籍進(jìn)一步了解。

0035f25e-aa9d-11ee-8b88-92fbcf53809c.png

內(nèi)存映射空間劃分

根據(jù)不同的內(nèi)存使用方式和使用場(chǎng)景需要,內(nèi)核把內(nèi)存映射地址空間劃分成多個(gè)部分,每個(gè)劃分空間都有自己的起止地址、分配接口和使用場(chǎng)景。下圖是一個(gè)常見(jiàn)的32位地址空間劃分結(jié)構(gòu)。

004f0c58-aa9d-11ee-8b88-92fbcf53809c.png

005bc2fe-aa9d-11ee-8b88-92fbcf53809c.png

DMA內(nèi)存動(dòng)態(tài)分配地址空間:

一些DMA設(shè)備因?yàn)槠渥陨韺ぶ纺芰Φ南拗?,不能訪問(wèn)所有內(nèi)存空間。如早期的ISA設(shè)備只能在24位地址空間執(zhí)行DMA,即只能訪問(wèn)前16MB內(nèi)存。所以需要?jiǎng)澐殖鯠MA內(nèi)存動(dòng)態(tài)分配空間,即DMA zone。其分配通過(guò)加上GFP_ATOMIC控制符的kmalloc接口來(lái)申請(qǐng)。

直接內(nèi)存動(dòng)態(tài)分配地址空間

因?yàn)樵L問(wèn)效率等原因,內(nèi)核對(duì)內(nèi)存采用簡(jiǎn)單的線性映射,但是因?yàn)?2位CPU的尋址能力(4G大?。┖蛢?nèi)核地址空間起始的設(shè)置(3G開始),會(huì)導(dǎo)致內(nèi)核的地址空間資源不足,當(dāng)內(nèi)存大于1GB時(shí),就無(wú)法直接映射所有內(nèi)存。無(wú)法直接映射的地址空間部分,即highmem zone。在DMA zone和highmem zone中間的區(qū)域即normal zone,主要用于內(nèi)核的動(dòng)態(tài)內(nèi)存分配。其分配通過(guò)kmalloc接口來(lái)申請(qǐng)。

高端內(nèi)存動(dòng)態(tài)分配地址空間:

高端內(nèi)存分配的內(nèi)存是虛擬地址連續(xù)而物理地址不連續(xù)的內(nèi)存,一般用于內(nèi) 核動(dòng)態(tài)加載的模塊和驅(qū)動(dòng),因?yàn)閮?nèi)核可能運(yùn)行了很久,內(nèi)存頁(yè)面碎片情況嚴(yán) 重,如果要申請(qǐng)大的連續(xù)地址的內(nèi)存頁(yè)會(huì)比較困難,容易導(dǎo)致分配失敗。根 據(jù)應(yīng)用需要,高端內(nèi)存分配提供多個(gè)接口:

vmalloc:指定分配大小,page位置和虛擬地址隱式分配;

vmap:指定page位置數(shù)組,虛擬地址隱式分配;

ioremap:指定物理地址和大小,虛擬地址隱式分配。

持久映射地址空間

內(nèi)核上下文切換會(huì)伴隨著TLB刷新,這會(huì)導(dǎo)致性能下降。但一些使用高端內(nèi)存的模塊對(duì)性能也有很高要求。持久映射空間在內(nèi)核上下文切換時(shí),其TLB不刷新,所以它們映射的高端地址空間尋址效率較高。其分配通過(guò)kmap接口來(lái)申請(qǐng)。kmap與vmap的區(qū)別是:vmap可以映射一組page,即page不連續(xù),但虛擬地址連續(xù),而kmap只能映射一個(gè)page到虛擬地址空間。kmap主要用于fs、net等對(duì)高端內(nèi)存訪問(wèn)有較高性能要求的模塊中。

固定映射地址空間:

持久映射的問(wèn)題是可能會(huì)休眠,在中斷上下文、自旋鎖臨界區(qū)等不能阻塞的場(chǎng)景中不可用。為了解決這個(gè)問(wèn)題,內(nèi)核又劃分出固定映射,其接口不會(huì)休眠。固定映射空間通過(guò)kmap_atomic接口來(lái)映射。kmap_atomic的使用場(chǎng)景與kmap較為相似,主要用于mm、fs、net等對(duì)高端內(nèi)存訪問(wèn)有較高性能要求而且不能休眠的模塊中。

不同的CPU體系架構(gòu)在地址空間劃分上不盡相同,但為了保證CPU體系差異對(duì)外部模塊不可見(jiàn),內(nèi)存地址空間的分配接口的語(yǔ)義是一致的。

因?yàn)?4位CPU一般都不需要高端內(nèi)存(當(dāng)然也可以支持),在地址空間劃分上與32位CPU的差異較大,下圖是一個(gè)X86_64的內(nèi)核地址空間劃分圖:

007b24aa-aa9d-11ee-8b88-92fbcf53809c.png

來(lái)自:極客星球-深入理解Linux內(nèi)存子系統(tǒng)。

內(nèi)存管理;軟件架構(gòu)

內(nèi)核內(nèi)存管理的核心工作就是內(nèi)存的分配回收管理,其內(nèi)部分為2個(gè)體系:頁(yè)管理和對(duì)象管理。頁(yè)管理體系是一個(gè)兩級(jí)的層次結(jié)構(gòu),對(duì)象管理體系是一個(gè)三級(jí)的層次結(jié)構(gòu),分配成本和操作對(duì)CPU cache和TLB的負(fù)面影響,從上而下逐漸升高。

00934fee-aa9d-11ee-8b88-92fbcf53809c.png

來(lái)自:極客星球-深入理解Linux內(nèi)存子系統(tǒng)。

頁(yè)管理層次結(jié)構(gòu):由冷熱緩存、伙伴系統(tǒng)組成的兩級(jí)結(jié)構(gòu)。負(fù)責(zé)內(nèi)存頁(yè)的緩存、分配、回收。

對(duì)象管理層次結(jié)構(gòu):由per-cpu高速緩存、slab緩存、伙伴系統(tǒng)組成的三級(jí)結(jié)構(gòu)。負(fù)責(zé)對(duì)象的緩存、分配、回收。這里的對(duì)象指小于一頁(yè)大小的內(nèi)存塊。

除了內(nèi)存分配,內(nèi)存釋放也是按照此層次結(jié)構(gòu)操作。如釋放對(duì)象,先釋放到per-cpu緩存,再釋放到slab緩存,最后再釋放到伙伴系統(tǒng)。

00a10c6a-aa9d-11ee-8b88-92fbcf53809c.png

框圖中有三個(gè)主要模塊,即伙伴系統(tǒng)、slab分配器和per-cpu(冷熱)緩存。他們的對(duì)比分析如下。

00a6972a-aa9d-11ee-8b88-92fbcf53809c.png


審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    3

    文章

    1412

    瀏覽量

    41192
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11055

    瀏覽量

    216327
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11479

    瀏覽量

    213086
  • 內(nèi)存管理
    +關(guān)注

    關(guān)注

    0

    文章

    168

    瀏覽量

    14516

原文標(biāo)題:Linux內(nèi)核內(nèi)存管理架構(gòu)

文章出處:【微信號(hào):技術(shù)讓夢(mèng)想更偉大,微信公眾號(hào):技術(shù)讓夢(mèng)想更偉大】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Linux內(nèi)存管理是什么,Linux內(nèi)存管理詳解

    Linux內(nèi)存管理 Linux內(nèi)存管理是一個(gè)非常復(fù)雜的過(guò)程,主要分成兩個(gè)大的部分:
    的頭像 發(fā)表于 05-11 17:54 ?6471次閱讀
    <b class='flag-5'>Linux</b>的<b class='flag-5'>內(nèi)存</b><b class='flag-5'>管理</b>是什么,<b class='flag-5'>Linux</b>的<b class='flag-5'>內(nèi)存</b><b class='flag-5'>管理</b>詳解

    深度解析Linux內(nèi)存管理體系

    Linux內(nèi)存管理的整體模式是虛擬內(nèi)存管理(分頁(yè)內(nèi)存管理
    發(fā)表于 08-06 16:55 ?2022次閱讀

    走進(jìn)Linux內(nèi)存系統(tǒng)探尋內(nèi)存管理的機(jī)制和奧秘

    Linux 內(nèi)存是后臺(tái)開發(fā)人員,需要深入了解的計(jì)算機(jī)資源。合理的使用內(nèi)存,有助于提升機(jī)器的性能和穩(wěn)定性。本文主要介紹Linux 內(nèi)存組織結(jié)構(gòu)
    的頭像 發(fā)表于 01-05 09:47 ?1913次閱讀

    關(guān)于Linux內(nèi)存管理的詳細(xì)介紹

    Linux內(nèi)存管理是指對(duì)系統(tǒng)內(nèi)存的分配、釋放、映射、管理、交換、壓縮等一系列操作的管理。在
    發(fā)表于 03-06 09:28 ?1199次閱讀

    Linux內(nèi)核內(nèi)存泄漏怎么辦

    Linux內(nèi)核開發(fā)中,Kmemleak是一種用于檢測(cè)內(nèi)核內(nèi)存泄漏的工具。
    發(fā)表于 07-04 11:04 ?981次閱讀

    Linux內(nèi)核內(nèi)存管理詳解

    內(nèi)存管理的主要工作就是對(duì)物理內(nèi)存進(jìn)行組織,然后對(duì)物理內(nèi)存的分配和回收。但是Linux引入了虛擬地址的概念。
    發(fā)表于 08-31 14:46 ?998次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內(nèi)核</b>的<b class='flag-5'>內(nèi)存</b><b class='flag-5'>管理</b>詳解

    Linux內(nèi)核地址映射模型與Linux內(nèi)核高端內(nèi)存詳解

    Linux 操作系統(tǒng)和驅(qū)動(dòng)程序運(yùn)行在內(nèi)核空間,應(yīng)用程序運(yùn)行在用戶空間,兩者不能簡(jiǎn)單地使用指針傳遞數(shù)據(jù),因?yàn)?b class='flag-5'>Linux使用的虛擬內(nèi)存機(jī)制,用戶空間的數(shù)據(jù)可能被換出,當(dāng)
    發(fā)表于 05-08 10:33 ?3588次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內(nèi)核</b>地址映射模型與<b class='flag-5'>Linux</b><b class='flag-5'>內(nèi)核</b>高端<b class='flag-5'>內(nèi)存</b>詳解

    Linux內(nèi)核電源管理的整體架構(gòu)介紹

    電子產(chǎn)品來(lái)說(shuō),電源管理相當(dāng)重要。因此,這部分工作往往在開發(fā)周期中占據(jù)相當(dāng)大的比重,圖1呈現(xiàn)了Linux內(nèi)核電源管理的整體架構(gòu)。大體可以歸納為
    發(fā)表于 07-05 07:00

    《深入Linux內(nèi)核架構(gòu)》 莫爾勒著

    電子發(fā)燒友為您提供了免費(fèi)下載,《深入Linux內(nèi)核架構(gòu)》一書討論了Linux內(nèi)核的概念、結(jié)構(gòu)和實(shí)現(xiàn)。內(nèi)核
    發(fā)表于 07-10 11:24 ?0次下載

    linux內(nèi)存管理機(jī)制淺析

    本內(nèi)容介紹了arm linux內(nèi)存管理機(jī)制,詳細(xì)說(shuō)明了linux內(nèi)核內(nèi)存
    發(fā)表于 12-19 14:09 ?73次下載
    <b class='flag-5'>linux</b><b class='flag-5'>內(nèi)存</b><b class='flag-5'>管理</b>機(jī)制淺析

    linux內(nèi)存管理

    linux內(nèi)存管理
    發(fā)表于 10-24 11:12 ?3次下載
    <b class='flag-5'>linux</b><b class='flag-5'>內(nèi)存</b><b class='flag-5'>管理</b>

    一文解析Linux內(nèi)存系統(tǒng)

    Linux 內(nèi)存是后臺(tái)開發(fā)人員,需要深入了解的計(jì)算機(jī)資源。合理的使用內(nèi)存,有助于提升機(jī)器的性能和穩(wěn)定性。本文主要介紹Linux 內(nèi)存組織結(jié)構(gòu)
    的頭像 發(fā)表于 09-01 10:46 ?2633次閱讀
    一文<b class='flag-5'>解析</b><b class='flag-5'>Linux</b><b class='flag-5'>內(nèi)存</b>系統(tǒng)

    解析Linux內(nèi)核頁(yè)表管理中那些鮮為人知的秘密

    虛擬內(nèi)存管理,而頁(yè)表管理是在虛擬內(nèi)存管理中尤為重要,本文主要以回答幾個(gè)頁(yè)表管理中關(guān)鍵性問(wèn)題來(lái)
    的頭像 發(fā)表于 06-11 16:32 ?1864次閱讀

    Linux內(nèi)核實(shí)現(xiàn)內(nèi)存管理的基本概念

    本文概述Linux內(nèi)核實(shí)現(xiàn)內(nèi)存管理的基本概念,在了解基本概念后,逐步展開介紹實(shí)現(xiàn)內(nèi)存管理的相關(guān)技
    發(fā)表于 06-23 11:56 ?1093次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內(nèi)核</b>實(shí)現(xiàn)<b class='flag-5'>內(nèi)存</b><b class='flag-5'>管理</b>的基本概念

    Linux 內(nèi)存管理總結(jié)

    一、Linux內(nèi)存管理概述 Linux內(nèi)存管理是指對(duì)系統(tǒng)內(nèi)存
    的頭像 發(fā)表于 11-10 14:58 ?768次閱讀
    <b class='flag-5'>Linux</b> <b class='flag-5'>內(nèi)存</b><b class='flag-5'>管理</b>總結(jié)

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品