0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Linux內(nèi)核內(nèi)存泄漏怎么辦?

Linux閱碼場 ? 來源:Linuxer ? 作者:Linuxer ? 2021-02-20 17:14 ? 次閱讀

什么是內(nèi)存泄漏:

程序向系統(tǒng)申請內(nèi)存,使用完不需要之后,不釋放內(nèi)存還給系統(tǒng)回收,造成申請的內(nèi)存被浪費(fèi).

發(fā)現(xiàn)系統(tǒng)中內(nèi)存使用量隨著時(shí)間的流逝,消耗的越來越多,例如下圖所示:

2146195a-71ad-11eb-8b86-12bb97331649.png

接下來的排查思路是:

1.監(jiān)控系統(tǒng)中每個(gè)用戶進(jìn)程消耗的PSS (使用pmap工具(pmap pid)).

PSS:按比例報(bào)告的物理內(nèi)存,比如進(jìn)程A占用20M物理內(nèi)存,進(jìn)程B和進(jìn)程A共享5M物理內(nèi)存,那么進(jìn)程A的PSS就是(20 - 5) + 5/2 = 17.5M

2.監(jiān)控/proc/meminfo輸出,重點(diǎn)觀察Slab使用量和slab對應(yīng)的/proc/slabinfo信息

3.參考/proc/meminfo輸出,計(jì)算系統(tǒng)中未被統(tǒng)計(jì)的內(nèi)存變化,比如內(nèi)核驅(qū)動(dòng)代碼

直接調(diào)用alloc_page()從buddy中拿走的內(nèi)存不會(huì)被單獨(dú)統(tǒng)計(jì)

以上排查思路分別對應(yīng)下圖中的1,2,3 :

21681050-71ad-11eb-8b86-12bb97331649.png

在排查的過程中發(fā)現(xiàn)系統(tǒng)非??臻e,都沒有跑任何用戶業(yè)務(wù)進(jìn)程。

其中在使用slabtop監(jiān)控slab的使用情況時(shí)發(fā)現(xiàn)size-4096 不停增長

2190c540-71ad-11eb-8b86-12bb97331649.png

通過監(jiān)控/proc/slabinfo也發(fā)現(xiàn)SReclaimable 的使用量不停增長

while true; do sleep 1 ; cat /proc/slabinfo >> /tmp/slabinfo.txt ; echo "===" >> /tmp/slabinfo.txt ; done

由此判斷很可能是內(nèi)核空間在使用size-4096 時(shí)發(fā)生了內(nèi)存泄漏.

接下來使用trace event(tracepoint)功能來監(jiān)控size-4096的使用和釋放過程,

主要用來跟蹤kmalloc()和kfree()函數(shù)對應(yīng)的trace event, 因?yàn)樗麄兊膖race event被觸發(fā)之后會(huì)打印kmalloc()和kfree()所申請和釋放的內(nèi)存地址,然后進(jìn)一步只過濾申請4096字節(jié)的情況。

#trace-cmd record -e kmalloc -f 'bytes_alloc==4096' -e kfree -T

(-T 打印堆棧)

等待幾分鐘之后…

#ctrl ^c 中斷trace-cmd

#trace-cmd report

以上步驟相當(dāng)于:

21bb5b0c-71ad-11eb-8b86-12bb97331649.png

等待幾分鐘之后…

#cp /sys/kernel/debug/tracing/trace_pipe /tmp/kmalloc-trace

從trace-cmd report的輸出結(jié)果來看,很多kmalloc 對應(yīng)的ptr值都沒有kfree與之對應(yīng)的ptr值

21e57f2c-71ad-11eb-8b86-12bb97331649.png

這就說明了cat進(jìn)程在內(nèi)核空間使用size-4096之后并沒有釋放,造成了內(nèi)存泄漏。

為了進(jìn)一步精確定位到是使用哪個(gè)內(nèi)核函數(shù)造成的問題,此時(shí)手動(dòng)觸發(fā)vmcore

#echo c > /proc/sysrq-trigger

然后使用crash工具分析vmcore:

#crash ./vmcore ./vmlinux.debug

讀出上面kmalloc申請的ptr內(nèi)存信息

22431312-71ad-11eb-8b86-12bb97331649.png

(讀取0xffff880423744000內(nèi)存開始的4096個(gè)字節(jié),并以字符形式顯示)

22576916-71ad-11eb-8b86-12bb97331649.png

發(fā)現(xiàn)從上面幾個(gè)ptr內(nèi)存中讀出的內(nèi)容都是非常相似,仔細(xì)看一下發(fā)現(xiàn)都是/proc/schedstat 的輸出內(nèi)容。

通過閱讀相關(guān)代碼發(fā)現(xiàn),當(dāng)讀出/proc/schedstat內(nèi)容之后,確實(shí)沒有釋放內(nèi)存

228f9db8-71ad-11eb-8b86-12bb97331649.png

然后發(fā)現(xiàn)kernel上游已經(jīng)有patch解決了這個(gè)問題:

commit: 8e0bcc722289

fix a leak in /proc/schedstats

原文標(biāo)題:一次解決Linux內(nèi)核內(nèi)存泄漏實(shí)戰(zhàn)全過程

文章出處:【微信公眾號(hào):Linuxer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    3

    文章

    1372

    瀏覽量

    40293
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11304

    瀏覽量

    209536

原文標(biāo)題:一次解決Linux內(nèi)核內(nèi)存泄漏實(shí)戰(zhàn)全過程

文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Linux下如何管理虛擬內(nèi)存 使用虛擬內(nèi)存時(shí)的常見問題

    Linux系統(tǒng)中,虛擬內(nèi)存管理是操作系統(tǒng)內(nèi)核的一個(gè)重要功能,負(fù)責(zé)管理物理內(nèi)存和磁盤上的交換空間。以下是對Linux下如何管理虛擬
    的頭像 發(fā)表于 12-04 09:19 ?399次閱讀

    linux驅(qū)動(dòng)程序如何加載進(jìn)內(nèi)核

    Linux系統(tǒng)中,驅(qū)動(dòng)程序是內(nèi)核與硬件設(shè)備之間的橋梁。它們允許內(nèi)核與硬件設(shè)備進(jìn)行通信,從而實(shí)現(xiàn)對硬件設(shè)備的控制和管理。 驅(qū)動(dòng)程序的編寫 驅(qū)動(dòng)程序的編寫是Linux驅(qū)動(dòng)開發(fā)的基礎(chǔ)。在編
    的頭像 發(fā)表于 08-30 15:02 ?474次閱讀

    Linux內(nèi)核測試技術(shù)

    Linux 內(nèi)核Linux操作系統(tǒng)的核心部分,負(fù)責(zé)管理硬件資源和提供系統(tǒng)調(diào)用接口。隨著 Linux 內(nèi)核的不斷發(fā)展和更新,其復(fù)雜性和代碼規(guī)
    的頭像 發(fā)表于 08-13 13:42 ?493次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內(nèi)核</b>測試技術(shù)

    大電流一體成型電感有噪音怎么辦

    電子發(fā)燒友網(wǎng)站提供《大電流一體成型電感有噪音怎么辦.docx》資料免費(fèi)下載
    發(fā)表于 07-30 12:30 ?0次下載

    如何檢測內(nèi)存泄漏

    檢測內(nèi)存泄漏是軟件開發(fā)過程中一項(xiàng)至關(guān)重要的任務(wù),它有助于識(shí)別和解決那些導(dǎo)致程序占用過多內(nèi)存資源,從而影響程序性能甚至導(dǎo)致程序崩潰的問題。以下將詳細(xì)闡述幾種常見的內(nèi)存
    的頭像 發(fā)表于 07-30 11:50 ?1908次閱讀

    工控主板發(fā)生故障該怎么辦?

    工控主板發(fā)生故障該怎么辦?前幾天有個(gè)客戶問了我這個(gè)問題,大部分情況下出現(xiàn)的故障并不可怕,主要是用戶粗心大意造成的。那今天小編就來講解一下工控主板一般會(huì)出現(xiàn)故障的主要原因及判斷方法:
    的頭像 發(fā)表于 04-11 18:19 ?880次閱讀

    電容負(fù)極熔斷怎么辦

    在現(xiàn)代科技發(fā)展的時(shí)代,電容器在各個(gè)領(lǐng)域都扮演著重要的角色。然而,由于各種原因,電容器的負(fù)極可能會(huì)發(fā)生熔斷的情況。那么,當(dāng)電容器的負(fù)極熔斷時(shí),我們應(yīng)該怎么辦呢?
    的頭像 發(fā)表于 04-10 14:15 ?526次閱讀
    電容負(fù)極熔斷<b class='flag-5'>怎么辦</b>

    C語言內(nèi)存泄漏問題原理

    內(nèi)存泄漏問題只有在使用堆內(nèi)存的時(shí)候才會(huì)出現(xiàn),棧內(nèi)存不存在內(nèi)存泄漏問題,因?yàn)闂?/div>
    發(fā)表于 03-19 11:38 ?528次閱讀
    C語言<b class='flag-5'>內(nèi)存</b><b class='flag-5'>泄漏</b>問題原理

    Linux內(nèi)核內(nèi)存管理之內(nèi)核非連續(xù)物理內(nèi)存分配

    的主要優(yōu)點(diǎn)是避免了外部碎片,而缺點(diǎn)是需要修改內(nèi)核頁表。顯然,非連續(xù)內(nèi)存區(qū)域的大小必須是4096的倍數(shù)。Linux使用非連續(xù)物理內(nèi)存區(qū)的場景有幾種:(1)為swap區(qū)分配數(shù)據(jù)結(jié)構(gòu);(2)
    的頭像 發(fā)表于 02-23 09:44 ?977次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內(nèi)核</b><b class='flag-5'>內(nèi)存</b>管理之<b class='flag-5'>內(nèi)核</b>非連續(xù)物理<b class='flag-5'>內(nèi)存</b>分配

    Linux內(nèi)核內(nèi)存管理之ZONE內(nèi)存分配器

    內(nèi)核中使用ZONE分配器滿足內(nèi)存分配請求。該分配器必須具有足夠的空閑頁幀,以便滿足各種內(nèi)存大小請求。
    的頭像 發(fā)表于 02-21 09:29 ?904次閱讀

    linux用gdb調(diào)試遇到函數(shù)調(diào)用怎么辦?

    linux用gdb調(diào)試遇到函數(shù)調(diào)用怎么辦? 在Linux上使用GDB調(diào)試時(shí),遇到函數(shù)調(diào)用是一個(gè)常見的情況。函數(shù)調(diào)用可能涉及到多個(gè)函數(shù)、多個(gè)文件,這就需要我們仔細(xì)審查代碼,理解函數(shù)之間的關(guān)系和參數(shù)傳遞
    的頭像 發(fā)表于 01-31 10:33 ?719次閱讀

    修復(fù)輥壓機(jī)軸承位磨損怎么辦

    電子發(fā)燒友網(wǎng)站提供《修復(fù)輥壓機(jī)軸承位磨損怎么辦.docx》資料免費(fèi)下載
    發(fā)表于 01-23 09:52 ?0次下載

    linux內(nèi)核主要由哪幾個(gè)部分組成,作用是什么

    Linux內(nèi)核主要由以下幾個(gè)部分組成: 進(jìn)程管理:Linux內(nèi)核負(fù)責(zé)管理和調(diào)度系統(tǒng)中的進(jìn)程。它通過進(jìn)程調(diào)度算法來決定哪個(gè)進(jìn)程在什么時(shí)間運(yùn)行以及如何分配系統(tǒng)資源。
    的頭像 發(fā)表于 01-22 14:34 ?2692次閱讀

    風(fēng)機(jī)軸磨損怎么辦

    電子發(fā)燒友網(wǎng)站提供《風(fēng)機(jī)軸磨損怎么辦.docx》資料免費(fèi)下載
    發(fā)表于 01-07 11:04 ?0次下載

    Linux內(nèi)核內(nèi)存管理架構(gòu)解析

    內(nèi)存管理子系統(tǒng)可能是linux內(nèi)核中最為復(fù)雜的一個(gè)子系統(tǒng),其支持的功能需求眾多,如頁面映射、頁面分配、頁面回收、頁面交換、冷熱頁面、緊急頁面、頁面碎片管理、頁面緩存、頁面統(tǒng)計(jì)等,而且對性能也有很高
    的頭像 發(fā)表于 01-04 09:24 ?667次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內(nèi)核</b><b class='flag-5'>內(nèi)存</b>管理架構(gòu)解析