0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

百度工程師帶你探秘C++內存管理

C語言與CPP編程 ? 來源:C語言與CPP編程 ? 作者:daydreamer ? 2022-12-20 09:32 ? 次閱讀

前篇《探秘C++內存管理(理論篇)》主要介紹了Linux C++程序內存管理的理論基礎,本文作為系列文章《探秘C++內存管理》的第二篇,將會探討經典內存管理器ptmalloc如何管理C++程序的內存。借助剖析ptmalloc解決問題的著重點和設計實現(xiàn)成本的權衡,更具體的呈現(xiàn)c++內存管理面臨的問題和工程落地中的巧思。

一、概述

GEEK TALK

ptmalloc是開源GNU C Library(glibc)默認的內存管理器,當前大部分Linux服務端程序使用的是ptmalloc提供的malloc/free系列函數(shù),而它在性能上遠差于Meta的jemalloc和Google的tcmalloc。服務端程序調用ptmalloc提供的malloc/free函數(shù)申請和釋放內存,ptmalloc提供對內存的集中管理,以盡可能達到:

用戶申請和釋放內存更加高效,避免多線程申請內存并發(fā)和加鎖

尋求與操作系統(tǒng)交互過程中內存占用和malloc/free性能消耗的平衡點,降低內存碎片化,不頻繁調用系統(tǒng)調用函數(shù)

簡單概括ptmalloc的內存管理策略:

預先向操作系統(tǒng)申請并持有一塊內存供用戶malloc,同時管理已使用和空閑的內存

用戶執(zhí)行free,會將回收的內存管理起來,并執(zhí)行管理策略決定是否交還給操作系統(tǒng)

接下來,將從ptmalloc數(shù)據(jù)結構、內存分配及優(yōu)缺點介紹最經典的c++內存管理器的實現(xiàn)和使用(以32位機為例)。

二、內存管理

GEEK TALK

2.1 數(shù)據(jù)結構

為了解決多線程鎖爭奪問題,將內存分配區(qū)分為主分配區(qū)(main_area)和非主分配區(qū)(no_main_area)。同時,為了便于管理內存,對預申請的內存采用邊界標記法劃分成很多塊(chunk);ptmalloc內存分配器中,malloc_chunk是基本組織單元,用于管理不同類型的chunk,功能和大小相近的chunk串聯(lián)成鏈表,被稱為一個bin。

main_arena與non_main_arena

主分配區(qū)和非主分配區(qū)形成一個環(huán)形鏈表進行管理, 每一個分配區(qū)利用互斥鎖實現(xiàn)線程對該分配區(qū)的訪問互斥。每個進程只有一個主分配區(qū),但允許有多個非主分配區(qū),且非主分配區(qū)的數(shù)量只增加不減少。主分配區(qū)可以訪問進程的heap區(qū)域和mmap映射區(qū)域,即主分配區(qū)可以使用sbrk()和mmap()分配內存;非主分配區(qū)只能使用mmap()分配內存。

810763b4-7fff-11ed-8abf-dac502259ad0.png

對于不同arena的管理策略大致如下:

分配內存

查看該線程的私有變量中是否已經存在一個分配區(qū)并對其進行加鎖操作,如果加鎖成功,則使用該分配區(qū)分配內存;如果未找到該分區(qū)或加鎖失敗,遍歷環(huán)形鏈表中獲取一個未加鎖的分配區(qū)

如果整個環(huán)形鏈表中沒有未加鎖的分配區(qū),開辟一個新的分配區(qū),將其加入循環(huán)鏈表并加鎖,使用該分配區(qū)滿足當前線程的內存分配

釋放內存

先獲取待釋放內存塊所在的分配區(qū)的鎖,如果有其他線程正在使用該分配區(qū),等待其他線程釋放該分配區(qū)互斥鎖后,再釋放內存

主分配區(qū)和非主分配區(qū)的結構如下:

81161d78-7fff-11ed-8abf-dac502259ad0.png

其中fastbinsY和bins是對實際內存塊的管理和操作結構:

fastbinsY:用以保存fast bins

bins[NBINS * 2 - 2]:unsorted bin(1個,bin[1])、small bins(62 個,bin[2]~bin[63])、large bins(63 個,bin[64]~bin[126])的集合,一共有 126 個表項(NBINS = 128),bin[0] 和 bin[127] 沒有被使用

malloc_chunk與bins

ptmalloc統(tǒng)一管理heap和mmap映射區(qū)域中空閑的chunk,當用戶進行分配請求時,會先試圖在空閑的chunk中查找和分割,從而避免頻繁的系統(tǒng)調用,降低內存分配的開銷。為了更好的管理和查找空閑chunk,在預分配的空間的前后添加了必要的控制信息,內存管理結構malloc_chunk的成員及作用如下:

8135e2b6-7fff-11ed-8abf-dac502259ad0.png

mchunk_prev_size: 前一個空閑chunk的大小

mchunk_size: 當前chunk的大小

必要的屬性標志位:

前一個chunk在使用中(P = 1)

當前chunk是mmap映射區(qū)域分配(M = 1)或是heap區(qū)域分配(M = 0)

當前chunk屬于非主分配區(qū)(A = 0)或非主分配區(qū)(A = 1)

fd和bk: chunk塊空閑時存在,用于將空閑chunk塊加入到空閑chunk塊鏈表中統(tǒng)一管理

基于chunk的大小和使用方法,劃分出以下幾種bins:

81475190-7fff-11ed-8abf-dac502259ad0.png

fast bins

fast bins僅保存很小的堆,采用單鏈表串聯(lián),增刪chunk都發(fā)生在鏈表的頭部,進一步提高小內存的分配效率。fast bins記錄著大小以8字節(jié)遞增的bin鏈表,一般不會和其他堆塊合并。

unsorted bin

small bins和large bins的緩沖區(qū),用于加快分配的速度,chunk大小無尺寸限制,用戶釋放的堆塊,會先進入unsorted bin。分配堆塊時,會優(yōu)先檢查unsorted bin鏈表中是否存在合適的堆塊,并進行切割并返回。

small bins

保存大小 < 512B的chunk的bin被稱為small bins。small bins每個bin之間相差8個字節(jié),同一個small bin中的chunk具有相同大小,采用雙向循環(huán)鏈表串聯(lián)。

large bins

保存大小 >= 512B的chunk的bin被稱為large bins。large bins中的每一個bin分別包含了一個給定范圍內的chunk,其中的chunk按大小降序,相同大小按時間降序。

當然,并不是所有chunk都按上述的方式來組織,其他常用的chunk,如:

top chunk: 分配區(qū)的頂部空閑內存,當bins不能滿足內存分配要求的時候,會嘗試在top chunk分配。

當top chunk > 用戶請求大小,top chunk會分為兩個部分:用戶請求大小(user chunk)和剩余top chunk大小(remainder chunk)

當top chunk < 用戶所請求大小,top chunk就通過sbrk(main_arena)或mmap(non_main_arena)系統(tǒng)調用來擴容

2.2內存分配與釋放

概括內存malloc和free的流程大致如下:

內存分配malloc流程

1、獲取分配區(qū)的鎖

2、計算出需要分配的內存的chunk實際大小

3、如果chunk的大小 < max_fast,在fast bins上查找適合的chunk;如果不存在,轉到5

4、如果chunk大小 < 512B,從small bins上去查找chunk,如果存在,分配結束

5、需要分配的是一塊大的內存,或者small bins中找不到chunk:

a.遍歷fast bins,合并相鄰的chunk,并鏈接到unsorted bin中

b.遍歷unsorted bin中的chunk:

-能夠切割chunk直接分配,分配結束

-根據(jù)chunk的空間大小將其放入small bins或是large bins中,遍歷完成后,轉到6

6、需要分配的是一塊大的內存,或者small bins和unsorted bin中都找不到合適的 chunk,且fast bins和unsorted bin中所有的chunk已清除:

從large bins中查找,反向遍歷鏈表,直到找到第一個大小大于待分配的chunk進行切割,余下放入unsorted bin,分配結束

7、檢索fast bins和bins沒有找到合適的chunk,判斷top chunk大小是否滿足所需chunk的大小,從top chunk中分配

8、top chunk不能滿足需求,需要擴大top chunk:

a.主分區(qū)上,如果分配的內存 < 分配閾值(默認128KB),使用brk()分配;如果分配的內存 > 分配閾值,使用mmap分配

b.非主分區(qū)上,使用mmap來分配一塊內存

內存釋放free流程

1、獲取分配區(qū)的鎖

2、如果free的是空指針,返回

3、如果當前chunk是mmap映射區(qū)域映射的內存,調用munmap()釋放內存

4、如果chunk與top chunk相鄰,直接與top chunk合并,轉到8

5、如果chunk的大小 > max_fast,放入unsorted bin,并且檢查是否有合并:

a.沒有合并情況則free

b.有合并情況并且和top chunk相鄰,轉到8

6、如果chunk的大小 < max_fast,放入fast bin,并且檢查是否有合并:

a.fast bin并沒有改變chunk的狀態(tài),沒有合并情況則free

b.有合并情況,轉到7

7、在fast bin,如果相鄰chunk空閑,則將這兩個chunk合并,放入unsorted bin。如果合并后的大小 > 64KB,會觸發(fā)進行fast bins的合并操作,fast bins中的chunk將被遍歷合并,合并后的chunk會被放到unsorted bin中。合并后的chunk和top chunk相鄰,則會合并到top chunk中,轉到8

8.如果top chunk的大小 > mmap收縮閾值(默認為128KB),對于主分配區(qū),會試圖歸還top chunk中的一部分給操作系統(tǒng)

三、優(yōu)缺點

GEEK TALK

ptmalloc作為glibc默認的內存管理器,已經廣泛的滿足大多數(shù)大型項目的內存管理,同時它的實現(xiàn)思路也對后來的內存管理器提供了借鑒。

8162095e-7fff-11ed-8abf-dac502259ad0.png

ptmalloc的介紹暫告一段落,接下來的幾篇文章將繼續(xù)探討高性能內存管理庫的集大成者——jemalloc、tcmalloc內存管理庫。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 操作系統(tǒng)

    關注

    37

    文章

    6849

    瀏覽量

    123428
  • C++
    C++
    +關注

    關注

    22

    文章

    2112

    瀏覽量

    73705
  • 內存管理
    +關注

    關注

    0

    文章

    168

    瀏覽量

    14159

原文標題:百度工程師帶你探秘C++內存管理(ptmalloc篇)

文章出處:【微信號:C語言與CPP編程,微信公眾號:C語言與CPP編程】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    為什么嵌入式驅動開發(fā)工程師可以拿高薪?

    場景下可以提供額外的優(yōu)勢。 熟練使用C/C++進行嵌入式系統(tǒng)編程,便于理解內存管理、指針、數(shù)據(jù)結構等高級特性。 3)項目實踐: 通過動手做項目來積累經驗,這是嵌入式工作經驗積累的重要
    發(fā)表于 01-07 16:56

    百度科啟動“繁星計劃”

    近日,百度科攜手中國科協(xié)、中國科學院大學共同舉辦了史記2024·科學科100詞發(fā)布會,并在此盛會上正式啟動了“繁星計劃”。這一計劃的核心目標在于利用前沿的AI技術,包括數(shù)字人、智能體等,以及
    的頭像 發(fā)表于 12-31 10:26 ?143次閱讀

    百度正式回應進軍短劇領域

    近日,百度在線網絡技術(北京)有限公司在知識產權領域有了新的動作,據(jù)天眼查信息顯示,該公司已申請注冊“百度短劇”商標,涵蓋網站服務、科學儀器、教育娛樂等多個國際分類,目前這些商標均處于等待實質審查
    的頭像 發(fā)表于 12-17 14:19 ?197次閱讀

    百度將發(fā)布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計劃在即將舉行的百度世界大會上推出一款全新的AI智能眼鏡。這款眼鏡將內置先進的人工智能助手,并配備攝像頭,為用戶提供前所未有的智能體驗。
    的頭像 發(fā)表于 11-11 14:50 ?465次閱讀

    百度市值被低估?分析看好其長期發(fā)展?jié)摿?/a>

    近期,盡管微軟和Meta公布了超預期的財報,但市場對人工智能領域的熱情似乎有所減退。在此背景下,中概股也普遍走低,百度同樣未能幸免。然而,多位分析百度的長期發(fā)展?jié)摿Ρ硎究春茫J為其市值被低估。
    的頭像 發(fā)表于 11-05 11:16 ?617次閱讀

    百度舸AI計算平臺4.0震撼發(fā)布

    在2024年百度云智大會的璀璨舞臺上,百度智能云重磅推出了舸AI異構計算平臺的全新力作——4.0版本。此次升級,標志著百度在AI基礎設施領域邁出了堅實的一步,致力于為行業(yè)提供更為強大
    的頭像 發(fā)表于 09-26 14:46 ?491次閱讀

    百度申請文小言商標

    近日,百度在線網絡技術(北京)有限公司在知識產權領域有了新動作。據(jù)天眼查知識產權信息顯示,百度已申請多枚“文小言”商標,這些商標將涵蓋廣告銷售、網站服務、健身器材、機械設備等多個領域。
    的頭像 發(fā)表于 06-19 09:20 ?495次閱讀

    2024百度移動生態(tài)萬象大會:百度新搜索11%內容已AI生成

    2024百度移動生態(tài)萬象大會:百度新搜索11%內容已AI生成 今天2024百度移動生態(tài)萬象大會在江蘇蘇州舉辦,特別是AI搜索與百度文心一言的相關信息被市場極度關注,我們看到,在2024
    發(fā)表于 05-30 18:58 ?422次閱讀

    百度與特斯拉探討Robotaxi合作新機遇

    在特斯拉宣布計劃使用百度地圖提供的高精度地圖之后,百度與特斯拉之間的合作再度引起關注。百度自動駕駛技術部總經理徐寶強近日透露,百度正積極考慮與特斯拉在Robotaxi(共享出租車)項目
    的頭像 發(fā)表于 05-24 10:20 ?468次閱讀

    嵌入式軟件工程師和硬件工程師的區(qū)別?

    。他們之間的緊密合作對于成功開發(fā)出高效的嵌入式系統(tǒng)至關重要。 嵌入式軟件工程師和嵌入式硬件工程師在工作中有著不同的技能要求和專業(yè)知識。嵌入式軟件工程師需要具備扎實的編程基礎,熟練掌握C
    發(fā)表于 05-16 11:00

    百度智能云正式發(fā)布了《百度智能云水業(yè)大模型白皮書》

    3月28日,由E20環(huán)境平臺主辦的2024(第二十二屆)水業(yè)戰(zhàn)略論壇在北京召開。會上,百度智能云正式發(fā)布了《百度智能云水業(yè)大模型白皮書》(以下簡稱《白皮書》)。
    的頭像 發(fā)表于 03-29 09:20 ?1390次閱讀
    <b class='flag-5'>百度</b>智能云正式發(fā)布了《<b class='flag-5'>百度</b>智能云水業(yè)大模型白皮書》

    漳州市長魏東到訪百度,與百度智能云共商漳州新質生產力發(fā)展

    3月19日,漳州市市長魏東,人大常委會黨組成員、副主任蔡總平,副市長洪泰偉一行到訪百度亦莊基地,與百度副總裁石清華,百度智能云南區(qū)總經理段巍,百度智能云政務創(chuàng)新業(yè)務部總經理李琴,圍繞漳
    的頭像 發(fā)表于 03-25 11:27 ?891次閱讀

    C++簡史:C++是如何開始的

    MISRA C++:2023,MISRA? C++ 標準的下一個版本,來了!為了幫助您做好準備,我們介紹了 Perforce 首席技術支持工程師 Frank van den Beuken 博士撰寫
    的頭像 發(fā)表于 01-11 09:00 ?622次閱讀
    <b class='flag-5'>C++</b>簡史:<b class='flag-5'>C++</b>是如何開始的