0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

glibc的內(nèi)存分配回收策略

科技綠洲 ? 來源:Linux開發(fā)架構(gòu)之路 ? 作者:Linux開發(fā)架構(gòu)之路 ? 2023-11-13 11:16 ? 次閱讀

Linux內(nèi)存空間簡介

32位Linux平臺下進程虛擬地址空間分布如下圖:

圖片

進程虛擬地址空間分布

圖中,0xC0000000開始的最高1G空間是內(nèi)核地址空間,剩下3G空間是用戶態(tài)空間。用戶態(tài)空間從上到下依次為stack棧(向下增長)、mmap(匿名文件映射區(qū))、Heap堆(向上增長)、bss數(shù)據(jù)段、數(shù)據(jù)段、只讀代碼段。

其中,Heap區(qū)是程序的動態(tài)內(nèi)存區(qū),同時也是C++內(nèi)存泄漏的溫床。malloc、free均發(fā)生在這個區(qū)域。本文將簡單介紹下glibc在動態(tài)內(nèi)存管理方面的機制,拋磚引玉,希望能和大家多多交流。

Linux提供了如下幾個系統(tǒng)調(diào)用,用于內(nèi)存分配:

brk()/sbrk() // 通過移動Heap堆頂指針brk,達到增加內(nèi)存目的 
mmap()/munmap() // 通過文件影射的方式,把文件映射到mmap區(qū)

這兩種方式分配的都是虛擬內(nèi)存,沒有分配物理內(nèi)存。在第一次訪問已分配的虛擬地址空間的時候,發(fā)生缺頁中斷,操作系統(tǒng)負責分配物理內(nèi)存,然后建立虛擬內(nèi)存和物理內(nèi)存之間的映射關(guān)系。

那么,既然brk、mmap提供了內(nèi)存分配的功能,直接使用brk、mmap進行內(nèi)存管理不是更簡單嗎,為什么需要glibc呢?我們知道,系統(tǒng)調(diào)用本身會產(chǎn)生軟中斷,導致程序從用戶態(tài)陷入內(nèi)核態(tài),比較消耗資源。試想,如果頻繁分配回收小塊內(nèi)存區(qū),那么將有很大的性能耗費在系統(tǒng)調(diào)用中。因此,為了減少系統(tǒng)調(diào)用帶來的性能損耗,glibc采用了內(nèi)存池的設(shè)計,增加了一個代理層,每次內(nèi)存分配,都優(yōu)先從內(nèi)存池中尋找,如果內(nèi)存池中無法提供,再向操作系統(tǒng)申請。

一切計算機的問題都可以通過加層的方式解決。

glibc的內(nèi)存分配回收策略

glibc中malloc內(nèi)存分配邏輯如下是:

圖片

malloc

  • 分配內(nèi)存 < DEFAULT_MMAP_THRESHOLD,走__brk,從內(nèi)存池獲取,失敗的話走brk系統(tǒng)調(diào)用
  • 分配內(nèi)存 > DEFAULT_MMAP_THRESHOLD,走__mmap,直接調(diào)用mmap系統(tǒng)調(diào)用

其中,DEFAULT_MMAP_THRESHOLD默認為128k,可通過mallopt進行設(shè)置。重點看下小塊內(nèi)存(size > DEFAULT_MMAP_THRESHOLD)的分配,glibc使用的內(nèi)存池如下圖示:

圖片

內(nèi)存池

內(nèi)存池保存在bins這個長128的數(shù)組中,每個元素都是一雙向個鏈表。其中:

  • bins[0]目前沒有使用
  • bins[1]的鏈表稱為unsorted_list,用于維護free釋放的chunk。
  • bins[2,63)的區(qū)間稱為small_bins,用于維護<512字節(jié)的內(nèi)存塊,其中每個元素對應(yīng)的鏈表中的chunk大小相同,均為index*8。
  • bins[64,127)稱為large_bins,用于維護>512字節(jié)的內(nèi)存塊,每個元素對應(yīng)的鏈表中的chunk大小不同,index越大,鏈表中chunk的內(nèi)存大小相差越大,例如: 下標為64的chunk大小介于[512, 512+64),下標為95的chunk大小介于[2k+1,2k+512)。同一條鏈表上的chunk,按照從小到大的順序排列。

chunk數(shù)據(jù)結(jié)構(gòu)

圖片

chunk結(jié)構(gòu)

glibc在內(nèi)存池中查找合適的chunk時,采用了最佳適應(yīng)的伙伴算法。舉例如下:

1、如果分配內(nèi)存<512字節(jié),則通過內(nèi)存大小定位到smallbins對應(yīng)的index上(floor(size/8))

  • 如果smallbins[index]為空,進入步驟3
  • 如果smallbins[index]非空,直接返回第一個chunk

2、如果分配內(nèi)存>512字節(jié),則定位到largebins對應(yīng)的index上

  • 如果largebins[index]為空,進入步驟3
  • 如果largebins[index]非空,掃描鏈表,找到第一個大小最合適的chunk,如size=12.5K,則使用chunk B,剩下的0.5k放入unsorted_list中

3、遍歷unsorted_list,查找合適size的chunk,如果找到則返回;否則,將這些chunk都歸類放到smallbins和largebins里面

4、index++從更大的鏈表中查找,直到找到合適大小的chunk為止,找到后將chunk拆分,并將剩余的加入到unsorted_list中

5、如果還沒有找到,那么使用top chunk

6、或者,內(nèi)存<128k,使用brk;內(nèi)存>128k,使用mmap獲取新內(nèi)存

top chunk 如下圖示: top chunk是堆頂?shù)腸hunk,堆頂指針brk位于top chunk的頂部。移動brk指針,即可擴充top chunk的大小。當top chunk大小超過128k(可配置)時,會觸發(fā)malloc_trim操作,調(diào)用sbrk(-size)將內(nèi)存歸還操作系統(tǒng)。

圖片

chunk分布圖

free釋放內(nèi)存時,有兩種情況:

  1. chunk和top chunk相鄰,則和top chunk合并
  2. chunk和top chunk不相鄰,則直接插入到unsorted_list中

內(nèi)存碎片

以上圖chunk分布圖為例,按照glibc的內(nèi)存分配策略,我們考慮下如下場景(假設(shè)brk其實地址是512k):

  1. malloc 40k內(nèi)存,即chunkA,brk = 512k + 40k = 552k
  2. malloc 50k內(nèi)存,即chunkB,brk = 552k + 50k = 602k
  3. malloc 60k內(nèi)存,即chunkC,brk = 602k + 60k = 662k
  4. free chunkA。

此時,由于brk = 662k,而釋放的內(nèi)存是位于[512k, 552k]之間,無法通過移動brk指針,將區(qū)域內(nèi)內(nèi)存交還操作系統(tǒng),因此,在[512k, 552k]的區(qū)域內(nèi)便形成了一個內(nèi)存空洞 ---- 內(nèi)存碎片。按照glibc的策略,free后的chunkA區(qū)域由于不和top chunk相鄰,因此,無法和top chunk 合并,應(yīng)該掛在unsorted_list鏈表上。

glibc實現(xiàn)的一些重要結(jié)構(gòu)

glibc中用于維護空閑內(nèi)存的結(jié)構(gòu)體是malloc_state,其主要定義如下:

struct malloc_state {
    mutex_t mutex; // 并發(fā)編程下鎖的競爭
    mchunkptr        top; // top chunk
    unsigned int     binmap[BINMAPSIZE]; // bitmap,加快bins中chunk判定
    mchunkptr        bins[NBINS * 2 - 2]; // bins,上文所述
    mfastbinptr      fastbinsY[NFASTBINS]; // fastbins,類似bins,維護的chunk更小(80字節(jié)的chunk鏈表)
...
}
static struct malloc_state main_arena; // 主arena

多線程下的競爭搶鎖

并發(fā)條件下,main_arena引發(fā)的競爭將會成為限制程序性能的瓶頸所在,因此glibc采用了多arena機制,線程A分配內(nèi)存時獲取main_arena鎖成功,將在main_arena所管理的內(nèi)存中分配;此時線程B獲取main_arena失敗,glibc會新建一個arena1,此次內(nèi)存分配從arena1中進行。這種策略,一定程度上解決了多線程下競爭的問題;但是隨著arena的增多,內(nèi)存碎片出現(xiàn)的可能性也變大了。例如,main_arena中有10k、20k的空閑內(nèi)存,線程B要獲取20k的空閑內(nèi)存,但是獲取main_arena鎖失敗,導致留下20k的碎片,降低了內(nèi)存使用率。

普通arena的內(nèi)部結(jié)構(gòu):

圖片

普通arena結(jié)構(gòu)

  1. 一個arena由多個Heap構(gòu)成
  2. 每個Heap通過mmap獲得,最大為1M,多個Heap間可能不相鄰
  3. Heap之間有prev指針指向前一個Heap
  4. 最上面的Heap,也有top chunk

每個Heap里面也是由chunk組成,使用和main_arena完全相同的管理方式管理空閑chunk。多個arena之間是通過鏈表連接的。如下圖:

圖片

arena鏈表

main arena和普通arena的區(qū)別 main_arena是為一個使用brk指針的arena,由于brk是堆頂指針,一個進程中只可能有一個,因此普通arena無法使用brk進行內(nèi)存分配。普通arena建立在mmap的機制上,內(nèi)存管理方式和main_arena類似,只有一點區(qū)別,普通arena只有在整個arena都空閑時,才會調(diào)用munmap把內(nèi)存還給操作系統(tǒng)。

一些特殊情況的分析

根據(jù)上文所述,glibc在調(diào)用malloc_trim時,需要滿足如下2個條件:

1. size(top chunk) > 128K
2. brk = top chunk- >base + size(top chunk)

假設(shè),brk指針上面的空間已經(jīng)被占用,無法通過移動brk指針獲得新的地址空間,此時main_arena就無法擴容了嗎?glibc的設(shè)計考慮了這樣的特殊情況,此時,glibc會換用mmap操作來獲取新空間(每次最少MMAP_AS_MORECORE_SIZE<1M>)。這樣,main_arena和普通arena一樣,由非連續(xù)的Heap塊構(gòu)成,不過這種情況下,glibc并未將這種mmap空間表示為Heap,因此,main_arena多個塊之間是沒有聯(lián)系的,這就導致了main_arena從此無法歸還給操作系統(tǒng),永遠保留在空閑內(nèi)存中了。如下圖示:

圖片

main_arena無法回收

顯而易見,此時根本不可能滿足調(diào)用malloc_trim的條件2,即:brk !== top chunk->base + size(top chunk),因為此時brk處于堆頂,而top chunk->base > brk.

#include < stdlib.h >
#include < stdio.h >
#include < string.h >
#include < unistd.h >
#include < sys/mman.h >
#include < malloc.h >

#define ARRAY_SIZE 127
char cmd[1024];

void print_info()
{
    struct mallinfo mi = mallinfo();           
    system(cmd);
    printf("theap_malloc_total=%lu heap_free_total=%lu heap_in_use=%lun
            tmmap_total=%lu mmap_count=%lun", mi.arena, mi.fordblks, mi.uordblks, mi.hblkhd, mi.hblks);
}

int main(int argc, char** argv)
{
    char** ptr_arr[ARRAY_SIZE];
    int i;
    char*  mmap_var;
    pid_t  pid;
    pid = getpid();
    sprintf(cmd, "ps aux | grep %lu | grep -v grep", pid);
    /* mmap占據(jù)堆頂后1M的地址空間 */
    mmap_var = mmap((void*)sbrk(0) + 1024*1024, 127*1024, PROT_READ | PROT_WRITE, MAP_PRIVATE | MAP_ANONYMOUS, -1, 0); 
    printf("before mallocn");
    print_info();

    /* 分配內(nèi)存,總大小超過1M,導致main_arena被拆分 */
    for( i = 0; i < ARRAY_SIZE; i++) {
        ptr_arr[i] = malloc(i * 1024);
    }   
    printf("nafter mallocn");
    print_info();
    /* 釋放所有內(nèi)存,觀察內(nèi)存使用是否改變 */
    for( i = 0; i < ARRAY_SIZE; i++) {
        free(ptr_arr[i]);
    }
    printf("nafter freen");
    print_info();
    munmap(mmap_var, 127*1024);
    return 1;
}

圖片

異常運行

作為對比,去除掉brk上面的mmap區(qū)再次運行后結(jié)果如下:

圖片

正常運行

可以看出,異常情況下(brk無法擴展),free的內(nèi)存沒有歸還操作系統(tǒng),而是留在了main_arena的unsorted_list了;而正常情況下,由于滿足執(zhí)行malloc_trim的條件,因此,free后,調(diào)用了sbrk(-size)把內(nèi)存歸還了操作系統(tǒng),main_arena內(nèi)存響應(yīng)減少。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7048

    瀏覽量

    89076
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    8

    文章

    3028

    瀏覽量

    74081
  • 程序
    +關(guān)注

    關(guān)注

    117

    文章

    3787

    瀏覽量

    81073
  • C++
    C++
    +關(guān)注

    關(guān)注

    22

    文章

    2109

    瀏覽量

    73677
  • Glibc
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    7515
收藏 人收藏

    評論

    相關(guān)推薦

    C語言知識總結(jié):動態(tài)內(nèi)存分配

    動態(tài)內(nèi)存分配就 是指在程序執(zhí)行的過程中動態(tài)地分配或者回收存儲空間的分配內(nèi)存的方法。動態(tài)
    發(fā)表于 10-24 15:52 ?861次閱讀

    C語言既然可以自動為變量分配內(nèi)存,為什么還要用動態(tài)分配內(nèi)存呢?

    不知道大家在學習C語言動態(tài)分配內(nèi)存的時候有沒有過這樣的疑問,既然系統(tǒng)可以自動幫我們分配內(nèi)存,為什么還需要我們程序員自己去分配
    發(fā)表于 12-13 11:14 ?1068次閱讀

    glibc malloc內(nèi)存分配器的實現(xiàn)原理

    內(nèi)存(Heap Memory)是一個很有意思的領(lǐng)域。你可能和我一樣,也困惑于下述問題很久了。
    的頭像 發(fā)表于 01-17 10:03 ?837次閱讀
    <b class='flag-5'>glibc</b> malloc<b class='flag-5'>內(nèi)存</b><b class='flag-5'>分配</b>器的實現(xiàn)原理

    Linux內(nèi)存系統(tǒng): Linux 內(nèi)存分配算法

    、伙伴系統(tǒng)算法——組織結(jié)構(gòu)1) 概念· 為內(nèi)核提供了一種用于分配一組連續(xù)的頁而建立的一種高效的分配策略,并有效的解決了外碎片問題· 分配內(nèi)存
    發(fā)表于 08-24 07:44

    動態(tài)內(nèi)存分配是什么意思

    所謂動態(tài)內(nèi)存分配(Dynamic Memory Allocation)就是指在程序執(zhí)行的過程中動態(tài)地分配或者回收存儲空間的分配
    發(fā)表于 12-17 08:17

    淺析cache控制器的分配策略與替換策略

    在cache的相關(guān)操作中,cache控制器需要根據(jù)需求做出許多不同的選擇。例如:分配策略是否需要將數(shù)據(jù)從主存中分配到cache中;替換策略組相聯(lián)cache中,所有的way都已經(jīng)有填充數(shù)
    發(fā)表于 06-15 16:24

    一種基于Buddy算法思想、高可靠性的內(nèi)存管理策略

    內(nèi)存管理是操作系統(tǒng)的中心任務(wù)之一,其主要任務(wù)是組織內(nèi)存以容納內(nèi)核和待執(zhí)行程序,跟蹤當前內(nèi)存的使用情況,在需要時為進程分配內(nèi)存,使用完畢后釋放
    發(fā)表于 11-30 16:34 ?1682次閱讀
    一種基于Buddy算法思想、高可靠性的<b class='flag-5'>內(nèi)存</b>管理<b class='flag-5'>策略</b>

    進程虛擬內(nèi)存布局以及進程的虛擬內(nèi)存分配釋放流程,涉及的代碼

    我們計劃通過一系列文章來介紹虛擬內(nèi)存分配/釋放,缺頁處理,內(nèi)存壓縮/回收,內(nèi)存分配器等知識,梳理
    的頭像 發(fā)表于 06-28 09:38 ?4126次閱讀

    glibc內(nèi)存管理存在的共性問題及解決方法

    glibc內(nèi)存分配原理、內(nèi)存站崗問題形成原因展開討論,并對glibc緩存大量內(nèi)存(高達幾十個 G
    的頭像 發(fā)表于 06-18 14:50 ?3281次閱讀

    什么是堆內(nèi)存?堆內(nèi)存是如何分配的?

    在一般的編譯系統(tǒng)中,堆內(nèi)存分配方向和棧內(nèi)存是相反的。當棧內(nèi)存從高地址向低地址增長的時候,堆內(nèi)存從低地址向高地址
    的頭像 發(fā)表于 07-05 17:58 ?1w次閱讀

    Glibc內(nèi)存管理之Ptmalloc2源代碼分析

    Glibc內(nèi)存管理之Ptmalloc2源代碼分析
    發(fā)表于 07-29 09:20 ?24次下載

    Linux內(nèi)存分配管理與內(nèi)存回收基本框架

    內(nèi)存對計算機系統(tǒng)來說是一項非常重要的資源,直接影響著系統(tǒng)運行的性能。最初的時候,系統(tǒng)是直接運行在物理內(nèi)存上的,這存在著很多的問題,尤其是安全問題。后來出現(xiàn)了虛擬內(nèi)存,內(nèi)核和進程都運行在虛擬內(nèi)存
    的頭像 發(fā)表于 06-01 16:02 ?2484次閱讀

    jemalloc分配機制的介紹及其優(yōu)化實踐

    C/C++通過libc做內(nèi)存分配。glibc中默認的分配機制是ptmalloc。除此之外,還有眾多的不同側(cè)重的優(yōu)化,例如tcmalloc,jemalloc。
    的頭像 發(fā)表于 05-30 09:12 ?1185次閱讀
    jemalloc<b class='flag-5'>分配</b>機制的介紹及其優(yōu)化實踐

    glibc導致的堆外內(nèi)存泄露的排查過程

    本文記錄一次glibc導致的堆外內(nèi)存泄露的排查過程。
    的頭像 發(fā)表于 09-01 09:43 ?723次閱讀
    <b class='flag-5'>glibc</b>導致的堆外<b class='flag-5'>內(nèi)存</b>泄露的排查過程

    轉(zhuǎn)載 golang內(nèi)存分配

    . 線程擁有一定的 cache, 可用于無鎖分配. 同時 Go 對于 GC 后回收內(nèi)存頁, 并不是馬上歸還給操作系統(tǒng), 而是會延遲歸還, 用于滿足未來的內(nèi)存需求. ?? ? 在 1.
    的頭像 發(fā)表于 09-05 14:12 ?272次閱讀
    轉(zhuǎn)載 golang<b class='flag-5'>內(nèi)存</b><b class='flag-5'>分配</b>