0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

從原理聊JVM(一):染色標記和垃圾回收算法

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2024-08-20 15:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

JAVA簡單易用的特性,能夠讓研發(fā)人員在不了解JVM的底層運行機制的情況下依舊能夠編寫出功能完善的代碼。

但是對JVM的理解,是一個程序員普通和優(yōu)秀的分水嶺。全面地了解JVM的工作原理,能夠更好地優(yōu)化自己的代碼,并解決一些潛在的性能問題。

本文及后續(xù)文章將從原理聊起,對JVM的內存分配、GC、編譯等知識進行分析和總結。

1 JVM運行時內存劃分

1.1 運行時數(shù)據(jù)區(qū)域

wKgaombERMKAIkVjAAHROjCUdGM843.png

??

?方法區(qū)

屬于共享內存區(qū)域,存儲已被虛擬機加載的類信息、常量、靜態(tài)變量、即時編譯器編譯后的代碼等數(shù)據(jù)。運行時常量池,屬于方法區(qū)的一部分,用于存放編譯期生成的各種字面量和符號引用。

JDK1.8之前,Hotspot虛擬機對方法區(qū)的實現(xiàn)叫做永久代,1.8之后改為元空間。二者區(qū)別主要在于永久代是在JVM虛擬機中分配內存,而元空間則是在本地內存中分配的。很多類是在運行期間加載的,它們所占用的空間完全不可控,所以改為使用本地內存,避免對JVM內存的影響。根據(jù)《Java虛擬機規(guī)范》的規(guī)定,如果方法區(qū)無法滿足新的內存分配需求時,將拋出OutOfMemoryError異常。

?

線程共享,主要是存放對象實例和數(shù)組。如果在Java堆中沒有內存完成實例分配,并且堆也無法再擴展時,Java虛擬機將會拋出OutOfMemoryError異常。PS:實際上寫入時并不完全共享,JVM會為線程在堆上劃分一塊專屬的分配緩沖區(qū)來提高對象分配效率。詳見:TLAB

?虛擬機棧

線程私有,方法執(zhí)行的過程就是一個個棧幀從入棧到出棧的過程。每個方法在執(zhí)行時都會創(chuàng)建一個棧幀(Stack Frame)用于存儲局部變量表、操作數(shù)棧、動態(tài)鏈接、方法出口等信息。如果線程入棧的棧幀超過限制就會拋出StackOverFlowError,如果支持動態(tài)擴展,那么擴展時申請內存失敗則拋出OutOfMemoryError。

?本地方法棧

和虛擬機棧的功能類似,區(qū)別是作用于Native方法。

?程序計數(shù)器

線程私有,記錄著當前線程所執(zhí)行的字節(jié)碼的行號。其作用主要是多線程場景下,記錄線程中指令的執(zhí)行位置。以便被掛起的線程再次被激活時,CPU能從其掛起前執(zhí)行的位置繼續(xù)執(zhí)行。唯一一個在 Java 虛擬機規(guī)范中沒有規(guī)定任何 OutOfMemoryError 情況的區(qū)域。注意:如果線程執(zhí)行的是個java方法,那么計數(shù)器記錄虛擬機字節(jié)碼指令的地址。如果為native(底層方法),那么計數(shù)器為空。

1.2 對象的內存布局

在 HotSpot 虛擬機中,對象分為如下3塊區(qū)域:

?對象頭(Header)運行時數(shù)據(jù):哈希碼、GC分代年齡、鎖狀態(tài)標志、偏向線程ID、偏向時間戳等。類型指針:對象的類型元數(shù)據(jù)的指針,如果對象是數(shù)據(jù),還會記錄數(shù)組長度。

?對象實例數(shù)據(jù)(Instance Data)包含對象真正的內容,即其包括父類所有字段的值。

?對齊填充(Padding)對象大小必須是是8字節(jié)的整數(shù)倍,所以對象大小不滿足這個條件時,需要用對齊填充來補齊。

2 標記的方法和流程

2.1 判斷對象是否需要被回收

要分辨一個對象是否可以被回收,有兩種方式:引用計數(shù)法可達性算法。

?引用計數(shù)法就是在對象被引用時,計數(shù)加1,引用斷開時,計數(shù)減1。那么一個對象的引用計數(shù)為0時,說明這個對象可以被清除。這個算法的問題在于,如果A對象引用B的同時,B對象也引用A,即循環(huán)引用,那么雖然雙方的引用計數(shù)都不為0,但如果僅僅被對方引用實際上沒有存在的價值,應該被GC掉。

?可達性算法通過引用計數(shù)法的缺陷可以看出,從被引用一方去判定其是否應該被清理過于片面,所以我們可以通過相反的方向去定位對象的存活價值:一個存活對象引用的所有對象都是不應該被清除的(Java中軟引用或弱引用在GC時有不同判定表現(xiàn),不在此深究)。這些查找起點被稱為GC Root。

2.2 哪些對象可以作為GC Root呢?

1.JAVA虛擬機棧中的本地變量引用對象

2.方法區(qū)中靜態(tài)變量引用的對象

3.方法區(qū)中常量引用的對象

4.本地方法棧中JNI引用的對象

2.3 快速找到GC Root - OopMap

棧與寄存器都是無狀態(tài)的,保守式垃圾收集會直接線性掃描棧,再判斷每一串數(shù)字是不是引用,而HotSpot采用準確式垃圾收集方式,所有對象都存放在OopMap(Ordinary Object Pointer)中,當GC發(fā)生時,直接從這個map中尋找GC Root。

將GC Root存放到OopMap有兩個觸發(fā)時間點:

1.類加載完成后,HotSpot就會把對象內什么偏移量上是什么類型的數(shù)據(jù)計算出來。

2.即時編譯過程中,也會在特定的位置記錄下棧里和寄存器里哪些位置是引用。

2.4 更新OopMap的時機 - 安全點

導致OopMap更新的指令非常多,所以HotSpot只在特定位置進行記錄更新,這些位置叫做安全點。安全點位置的選取的標準是:“是否具有讓程序長時間執(zhí)行”。比如方法調用、循環(huán)跳轉、異常跳出等等。

2.5 可達性分析過程

三色標記法

?白色:表示垃圾回收過程中,尚未被垃圾收集器訪問過的對象,在可達性分析開始階段,所有對象都是白色的,即不可達。

?黑色:被垃圾收集器訪問過的對象,且這個對象所有的引用均掃描過。黑色的對象是安全存活的,如果其他對象被訪問時發(fā)現(xiàn)其引用了黑色對象,該黑色對象也不會再被掃描。

?灰色:被垃圾收集器訪問過的對象,但這個對象至少有一個引用的對象沒有被掃描過。那么標記階段就是從GC Root的開始,沿著其引用鏈將每一個對象從白色標記為灰色最后標記為黑色的過程。

標記過程中不一致問題

由于這個階段是層層遞進的標記,所以過程中難免出現(xiàn)不一致的情況導致原本是黑色的對象被標記為白色,比如,當前掃描到B對象了,C對象尚未被訪問時,標記情況如下:

wKgZombERMOAO-txAAAsjteoOf8539.png

那么如果這時A對象取消了對B對象的引用,而GC Root增加了對C對象的引用,GC Root作為黑色標記不會再次被掃描,那么C對象在標記階段結束后仍然會保持白色,就會被清除掉。

wKgaombERMOAFsbkAAA5d9WuaBM141.png

解決方式

?增量更新

當黑色對象增加了對白色對象的引用時,將其從黑色改為灰色,等并發(fā)標記階段結束后,從GC Root開始順著對象圖再將灰色對象重新掃描一次,這個掃描過程會STW,不會再次產生不一致問題。CMS就采用了這種方式。

?原始快照(SATB)

當灰色對象刪除了白色對象的引用時,將其記錄在線程獨占的SATB Queue中,讓其在標記階段結束后被再次掃描。 G1、Shenandoah采用了這種方式。

示例

我們通過一個例子來展示兩種處理方式的不同,比如正常標記到對象A時,將其標記為灰色:

wKgZombERMSAGd95AAApxOmPhtU488.png

此時,用戶線程發(fā)生如下行為:

1.GC Root直接引用了C

2.A取消了引用B

理論上,C仍然是可達對象,不應被清除,而B不可達,應當被清除。

wKgZombERMWAfE91AAA2q4bUlHw904.png

增量更新會記錄行為1,將GC Root標記為灰色,B不能訪問到被標記為可以回收

wKgaombERMmASFT9AAA17Jd0In4144.png

等到重新標記階段再次訪問灰色的GC Root,順序將GC Root和C標記為黑色:

wKgZombERMyAAn8fAAA2XWh-BpE186.png

而原始快照會記錄行為2,將發(fā)生引用變化的對象全部記錄下來,等到重新標記階段再次訪問這些灰色,將其標記為黑色并順著對象圖掃描。

wKgZombERM2AMeh_AABeptJlui4287.png

那么最終B作為浮動垃圾就被保存下來了,只能等到下一次GC時才能被回收。

3 分代模型

3.1 分代假說

弱分代假說(WeakGenerationalHypothesis):絕大多數(shù)對象都是朝生夕滅的。 強分代假說(StrongGenerationalHypothesis):熬過越多次垃圾收集過程的對象就越難以消亡。 跨代引用假說(IntergenerationalReferenceHypothesis):跨代引用相對于同代引用來說僅占極少數(shù)。

上述假說是根據(jù)實際經驗得來的,由此垃圾收集器通常分為“年輕代”和“年老代”:

?年輕代用來存放不斷生成且生命周期短暫的對象,收集動作相對高頻

?年老代用來存放經歷多次GC仍然存活的對象,收集動作相對低頻

3.2 空間分配擔保

如果在GC后新生代存貨對象過多,Survivor無法容納,那么將會把這些對象直接送入年老代,這就叫年老代進行了“分配擔?!?。 為了保證年老代能夠足夠空間容納這些直接晉升的對象,在發(fā)生Minor GC之前,虛擬機必須先檢查年老代最大可用的連續(xù)空間,如果大于新生代所有對象總空間或者歷次晉升的平均大小,就會進行MinorGC,否則將進行FullGC以同時清理年老代。

3.3 記憶集和卡表

記憶集是一種用于記錄從非收集區(qū)域指向收集區(qū)域的指針集合的抽象數(shù)據(jù)結構。

記憶集的作用

新生代發(fā)生垃圾收集時(Minor GC),如果想確定這個新生代對象是否被年老代的對象引用,則需要掃描整個年老代,成本非常高。

如果我們能知道哪一部分年老代可能存在對新生代的引用,就可以降低掃描范圍。

所以我們可以在新生代建立一個全局數(shù)據(jù)結構叫“記憶集(Remembered Set)”,這個結構把年老代分為若干個小塊,標記了哪些小塊內存中存在引用了新生代對象的情況,等到Minor GC時,只掃描這部分存在跨代引用的內存塊即可。雖然在對象變化時增加了維護記憶集的成本,但相比垃圾收集時掃描整個年老代來說是值得的。

JVM通常在對象增加引用前設置寫屏障判斷是否發(fā)生跨代引用,如果有跨代情況,則更新記憶集。

卡表

實現(xiàn)記憶集時,可以有不同精度的粒度:可以指向內存地址,也可以指向某個對象,或者指向某一塊內存區(qū)域。精度越低,維護成本越低。指向某一塊內存區(qū)域的實現(xiàn)方式就是“卡表”??ū硗ǔ>褪且粋€byte數(shù)組,數(shù)組中每一個元素代表某一塊內存,其值是1或者0:當發(fā)生跨代引用時,就表示該元素“dirty”了,那么將將其設置為1,否則就是0。

wKgaombERM6AEETyAABsrdTtdOc939.png

4 垃圾回收算法

4.1 標記-清除(Mark-Sweep)

GC分為兩個階段,標記和清除。首先標記所有可回收的對象,在標記完成后統(tǒng)一回收所有被標記的對象。

缺點是清除后會產生不連續(xù)的內存碎片。碎片過多會導致以后程序運行時需要分配較大對象時,無法找到足夠的連續(xù)內存,而不得已再次觸發(fā)GC。

wKgZombERM-ATf12AAFWomdafMs003.png

4.2 標記-復制(Mark-Copy)

將內存按容量劃分為兩塊,每次只使用其中一塊。當這一塊內存用完了,就將存活的對象復制到另一塊上,然后再把已使用的內存空間一次清理掉。

這樣使得每次都是對半個內存區(qū)回收,也不用考慮內存碎片問題,簡單高效。

wKgaombERNCASAhcAAFW9rWl_iY234.png

缺點需要兩倍的內存空間。

一種優(yōu)化方式是使用eden和survivior區(qū),具體步驟如下:

eden和survivior區(qū)默認內存空間占比為8:1:1,同一時間只使用eden區(qū)和其中一個survivior區(qū)。標記完成后,將存活對象復制到另一個未使用的survivior區(qū)(部分年齡過大的對象將升級到年老代)。

這種做法,相比普通的兩塊空間的標記復制算法來說,只有10%的內存空間浪費,而這樣做的原因是:大部分情況下,一次young gc后剩余的存活對象非常少。

wKgaombERNWAT6NeAABnHaX5duM018.png

4.3 標記-整理(Mark-Compact)

標記-整理也分為兩個階段,首先標記可回收的對象,再將存活的對象都向一端移動,然后清理掉邊界以外的內存。

wKgaombERNiAMnmqAAJ6Rs95j3c612.png

此方法避免標記-清除算法的碎片問題,同時也避免了復制算法的空間問題。 一般年輕代中執(zhí)行GC后,會有少量的對象存活,就會選用復制算法,只要付出少量的存活對象復制成本就可以完成收集。

而年老代中因為對象存活率高,用標記復制算法時數(shù)據(jù)復制效率較低,且空間浪費較大。所以需要使用標記-清除或者標記-整理算法來進行回收。

所以通??梢韵仁褂脴擞浨宄惴?,當碎片率高時,再使用標記整理算法。

5 最后

本篇介紹了JVM中垃圾回收器相關的基礎知識,后續(xù)會深入介紹CMS、G1、ZGC等不同垃圾收集器的運作流程和原理,歡迎關注。

?

系列文章:

從原理聊JVM(一):染色標記和垃圾回收算法

從原理聊JVM(二):從串行收集器到分區(qū)收集開創(chuàng)者G1

從原理聊JVM(三):詳解現(xiàn)代垃圾回收器Shenandoah和ZGC

從原理聊JVM(四):JVM中的方法調用原理

從原理聊JVM(五):JVM中的編譯過程和優(yōu)化手段?

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4702

    瀏覽量

    95019
  • 內存
    +關注

    關注

    8

    文章

    3115

    瀏覽量

    75093
  • JVM
    JVM
    +關注

    關注

    0

    文章

    160

    瀏覽量

    12553
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    生活垃圾焚燒發(fā)電廠數(shù)據(jù)采集可視化管理系統(tǒng)

    生活垃圾焚燒發(fā)電是通過對燃燒熱值較高的垃圾進行高溫焚燒,使得在高溫焚燒中產生的熱能轉化為高溫蒸汽,進而推動汽輪機并帶動發(fā)電機發(fā)電,是種污染較小、效益較高的污染治理方式。但同時焚燒發(fā)電也會帶來廢水
    的頭像 發(fā)表于 06-04 17:13 ?154次閱讀

    智能可回收箱:引領垃圾分類新潮流,推動城市環(huán)保與資源循環(huán)利用發(fā)展

    回收箱是種專門設計用于收集和存放可循環(huán)利用廢棄物的容器,常見的可回收物包括但不限于紙類、塑料、玻璃、金屬和廢棄電子產品等。這類箱子通常出現(xiàn)在公共場所如居民社區(qū)、學校、寫字樓、酒店、購物中心等地
    的頭像 發(fā)表于 05-27 10:11 ?241次閱讀
    智能可<b class='flag-5'>回收</b>箱:引領<b class='flag-5'>垃圾</b>分類新潮流,推動城市環(huán)保與資源循環(huán)利用發(fā)展

    垃圾回收破碎機遠程監(jiān)控物聯(lián)網(wǎng)系統(tǒng)方案

    垃圾回收處理行業(yè)中,破碎機是種專門用于將廢棄物料(如生活垃圾、工業(yè)廢料、建筑垃圾、電子垃圾
    的頭像 發(fā)表于 05-19 14:25 ?102次閱讀
    <b class='flag-5'>垃圾</b><b class='flag-5'>回收</b>破碎機遠程監(jiān)控物聯(lián)網(wǎng)系統(tǒng)方案

    如何眼定位SQL的代碼來源:款SQL染色標記的簡易MyBatis插件

    作者:京東物流 郭忠強 導語 本文分析了后端研發(fā)和運維在日常工作中所面臨的線上SQL定位排查痛點,基于姓名貼的靈感,設計和開發(fā)了款SQL染色標記的MyBatis插件。該插件輕量高效,對業(yè)務代碼無
    的頭像 發(fā)表于 03-05 11:36 ?380次閱讀
    如何<b class='flag-5'>一</b>眼定位SQL的代碼來源:<b class='flag-5'>一</b>款SQL<b class='flag-5'>染色</b><b class='flag-5'>標記</b>的簡易MyBatis插件

    物聯(lián)網(wǎng)+垃圾桶滿溢檢測器回收系統(tǒng)解決方案

    、方案背景 今年垃圾分類正式進入大眾視野,不僅成為普通百姓最關心的話題,也再次將垃圾分類行業(yè)推向市場焦點。由此可見,隨著垃圾分類制度的進
    的頭像 發(fā)表于 01-02 15:58 ?878次閱讀
    物聯(lián)網(wǎng)+<b class='flag-5'>垃圾</b>桶滿溢檢測器<b class='flag-5'>回收</b>系統(tǒng)解決方案

    智能垃圾投放站遠程監(jiān)控智慧運維系統(tǒng)方案

    隨著環(huán)保意識的提高和政策的推動,垃圾分類已成為全球發(fā)展的重要主題。我國持續(xù)推進垃圾分類和回收等相關產業(yè)的發(fā)展,鼓勵居民和企業(yè)進行垃圾分類和回收
    的頭像 發(fā)表于 12-31 15:47 ?364次閱讀

    垃圾短信?手機自動識別垃圾短信邏輯的分析

    作者:京東科技 賈玉龍 1 背景 隨著智能手機的普及和移動互聯(lián)網(wǎng)的發(fā)展,短信作為種傳統(tǒng)的通訊方式,仍然保持著其獨特的地位。然而,隨著垃圾短信的泛濫,手機自動識別垃圾短信的技術也在不斷進步。對于提供
    的頭像 發(fā)表于 12-16 10:19 ?886次閱讀

    ?ISP算法及架構分析介紹

    ),結果上看就是將RAW數(shù)據(jù)轉換成壓縮后的RGB(般)數(shù)據(jù),供后續(xù)CPU使用(識別、壓縮等)。 市面上很少有直接介紹ISP的書籍或者資料,今天我們主要是
    的頭像 發(fā)表于 11-26 10:05 ?1684次閱讀
    ?ISP<b class='flag-5'>算法</b>及架構分析介紹

    【「算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+介紹基礎硬件算法模塊

    基本算法就是組成大廈的磚石。忽視基本算其電路設計而談論復雜算法電路,無異于伐根以求木茂,塞源而欲流長,特別是對于架構工作的線設計師來說,這種想法更是有害無益。
    發(fā)表于 11-21 17:05

    【「算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+本介紹基礎硬件算法模塊實現(xiàn)的好書

    看下本書內容簡介,然后再瀏覽下各個章節(jié)的內容。 從簡介來看,本書也是關注最基礎,最常用的那部分算法的電路實現(xiàn),比較貼合工程實踐,適合無基礎或者有定基礎的線工程人員閱讀。內容選擇是貼合實踐
    發(fā)表于 11-20 13:42

    JVM xmx, xms等內存相關參數(shù)合理性設置

    作者:京東零售 劉樂 上篇文章說到JVM垃圾回收算法的兩個優(yōu)化標的:吞吐量和停頓時長,并提到這兩個優(yōu)化目標是有沖突的。那么有沒有可能提高吞
    的頭像 發(fā)表于 10-10 14:42 ?1239次閱讀

    名單公布!【書籍評測活動NO.46】算法到電路 | 數(shù)字芯片算法的電路實現(xiàn)

    :elecfans123)領取書籍進行評測,如在5個工作日內未聯(lián)系,視為放棄本次試用評測資格! 《算法到電路——數(shù)字芯片算法的電路實現(xiàn)》 是本深入解讀基礎
    發(fā)表于 10-09 13:43

    智能回收箱的功能和使用步驟介紹

    智能回收箱是現(xiàn)代城市環(huán)保與資源循環(huán)利用領域的項創(chuàng)新技術,它通過集成各種智能化功能,提高了垃圾回收的效率和準確性,促進了垃圾分類與減量。隨著
    的頭像 發(fā)表于 09-23 14:34 ?2257次閱讀
    智能<b class='flag-5'>回收</b>箱的功能和使用步驟介紹

    聊聊JVM如何優(yōu)化

    首先應該明確的是JVM調優(yōu)不是常規(guī)手段,JVM的存在本身就是為了減輕開發(fā)對于內存管理的負擔,當出現(xiàn)性能問題的時候第時間考慮的是代碼邏輯與設計方案,以及是否達到依賴中間件的瓶頸,最后才是針對J
    的頭像 發(fā)表于 08-05 17:49 ?736次閱讀
    聊聊<b class='flag-5'>JVM</b>如何優(yōu)化

    基于PYNQ的智能垃圾分類系統(tǒng)

    的問題,減輕社會和居民的壓力,如果可以實現(xiàn)可回收垃圾二次分類,對生活垃圾自主分類就顯得尤為重要。于此,我們決定設計這樣個作品—智能識別自動投遞分類
    發(fā)表于 07-09 18:44

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品