0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

.NET8為什么要引入Non-GC Heap這種機制呢?

OSC開源社區(qū) ? 來源:江湖評談 ? 2023-11-28 10:38 ? 次閱讀

前言

.NET8里面JIT引入了一個新的機制,叫做Non-GC Heap。JIT可以確保相關(guān)對象分配在Non-GC Heap上,該堆像其名稱一樣,不受GC管理。JIT需要保證這個對象沒有被GC引用,并且在這個對象的生命周期內(nèi)一直是根對象(不會被GC消滅的對象)的狀態(tài)。

概述

為什么要引入這種機制?先來看一段代碼:

public static string GetPrefix() => "https://";
static void Main(string[] args)
{
  GetPrefix ();
}

這里的GetPrefix函數(shù)返回的是一個常量字符串值,它的ASM如下:

mov  rax,185CAC02068h
mov  rax,qword ptr [rax]

兩個mov指令,第一個是對象指針的指針,第二個是對象的指針。雖然是簡單的兩個指令,但是背后的邏輯卻較為復(fù)雜,基本如下:
一個字符串常量值,.NET7里面JIT也會給這個字符串常量值復(fù)制到一個堆分配到字符串對象中,返回的是對象的二級指針。因為是堆對象,可能會被GC移動,每次都需要獲取新的地址,頻繁增加負擔(dān)。

這里的問題在哪兒呢?一個字符串常量值需要這么多的步驟操作嗎?開銷是否太大,我們是否可以簡化它呢?有一個常規(guī)的很容易想到的方法,就是把這個字符串常量值的地址給它固定起來,每次需要用到這個常量值,就直接去這個固定地址讀取,這樣行不行呢?GC堆很明顯不能硬編碼固定。

當(dāng)然可以,做法就是把這個字符串常量值放到POH(固定對象堆)上,不讓GC移動。這樣是減少了GC回收的時候移動的開銷,但是并沒有從根本上解決問題,因為固定對象同樣受到GC的管控,上面的步驟除了不能移動一樣不少,并且POH不會進行根對象的處理,可能會導(dǎo)致它們被回收,地址指向了其它的數(shù)據(jù),進而錯誤。

特點

要徹底的解決這個問題,本篇的主角:Non-GC Heap出場了。它有三個特點:

1.JIT要保證這個對象沒有被GC引用

2.這個對象在生命周期內(nèi)一直是根對象

3.它不能是可卸載上下文的一部分

你可以認為GC堆包括:小對象堆(SOH-小于85000字節(jié)的對象),大對象堆(LOH-大于85000字節(jié)的對象),固定對象堆(POH)

而No-GC Heap超脫于GC Heap之外的FOH(凍結(jié)堆)。

JIT現(xiàn)在可以避免在生成的代碼中訪問該對象時的間接尋址,而是直接硬編碼對象的地址

GetPrefix函數(shù)的ASM在.NET8 Non-GC Heap里面如下:

mov  rax,26180000218h
C3   ret

26180000218h為對象地址,一個mov直接返回??此浦缓喕艘粋€mov,但是實際上它這種硬編碼固定模式地址,簡化的是整個字符串常量值的原理,也就是把字符串常量值分配到FOH里面,而不是GC堆里。性能極大的提升自不必多說。以下測量13倍的性能提升。

Method Job Mean Ratio
GetPrefix .NET 7 1.3450 ns
GetPrefix.NET80.0729ns

其它Non-GC Heap的操作

:使用typeof(T)生成的RuntimeType對象

public Type GetTestsType() => typeof(Tests);

二:空數(shù)組分配到Non-GC Heap上,使Array.Empty()更加高效

public string[] Test() => Array.Empty();

它倆在.NET8里面都類似于如下ASM,一個mov直接返回:

mov rax,1A0814EAEA8
ret

三:靜態(tài)值類型字段關(guān)聯(lián)的堆對象,不包含任何GC引用的字段

public partial class Tests
{
    private static readonly ConfigurationData s_config = ConfigurationData.ReadData();
    public TimeSpan GetRefreshInterval() => s_config.RefreshInterval;
    private struct ConfigurationData
    {
        public static ConfigurationData ReadData() => new ConfigurationData
        {
            Index = 0x12345,
            Id = Guid.NewGuid(),
            IsEnabled = true,
            RefreshInterval = TimeSpan.FromSeconds(100)
        };
        public int Index;
        public Guid Id;
        public bool IsEnabled;
        public TimeSpan RefreshInterval;
    }
}

RefreshInterval .NET7如下:

mov       rax,13D84001F78
mov       rax,[rax]
mov       rax,[rax+20]
ret

RefreshInterval .NET8如下:

mov       rax,20D9853AE48
mov       rax,[rax]
ret

四:代之間的GC引用判斷

代碼:

public class Tests
{
    public void Write()
    {
        string dst = "old";
        Write(ref dst, "new");
    }


    [MethodImpl(MethodImplOptions.NoInlining)]
    private static void Write(ref string dst, string s) => dst = s;
}

Write在.NET7和.NET8上生成如下:

callCORINFO_HELP_CHECKED_ASSIGN_REF
nop
ret

CORINFO_HELP_CHECKED_ASSIGN_REF是一個JIT幫助程序函數(shù),其中包含所謂的“GC write barrier (GC寫屏障)”,一個小代碼片段,用于讓GC跟蹤正在寫入的引用,因為它可能需要知道,例如,因為正在分配的對象可能是gen0,而目標(biāo)可能是gen2。

微調(diào)下這個代碼:

public class Tests
{
    public void Write()
    {
        string dst = "old";
        Write(ref dst);
    }


    [MethodImpl(MethodImplOptions.NoInlining)]
    private static void Write(ref string dst) => dst = "new";
}

實現(xiàn)的功能都是一樣的,只不過dst直接賦值了常量字符串,記得上面常量字符串的分配是在Non-GC Heap嗎?.NET7里面還是需要幫助函數(shù):

mov       rdx,1FF0E4014A0
movrdx,[rdx]
callCORINFO_HELP_CHECKED_ASSIGN_REF
nop
ret

然.NET8里面則是

mov       rax,1B3814EAEC8
mov       [rcx],rax
ret

因為.NET8意識到常量字符串是在Non-GC Heap,不需要GC跟蹤判斷在那個代碼,類似于card_table那種。所以優(yōu)化掉了CORINFO_HELP_CHECKED_ASSIGN_REF






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • MOV
    MOV
    +關(guān)注

    關(guān)注

    0

    文章

    64

    瀏覽量

    13987
  • ASM
    ASM
    +關(guān)注

    關(guān)注

    1

    文章

    69

    瀏覽量

    19389
  • 字符串
    +關(guān)注

    關(guān)注

    1

    文章

    589

    瀏覽量

    21168
  • SOH
    SOH
    +關(guān)注

    關(guān)注

    0

    文章

    19

    瀏覽量

    3840

原文標(biāo)題:.NET8極致性能優(yōu)化Non-GC Heap

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦
    熱點推薦

    LabVIEW .net調(diào)用GC

    LabVIEW.net調(diào)用GC靜態(tài)類
    發(fā)表于 06-08 15:11

    shell原理和問答機制引入推薦

    1.16.ARM裸機第十六部分-shell原理和問答機制引入 互聯(lián)網(wǎng)課程品牌...
    發(fā)表于 12-23 06:12

    為何ARMv8-a架構(gòu)引入EL3

    ARMv8-a架構(gòu)是由哪些部分組成的?為何ARMv8-a架構(gòu)引入EL3?
    發(fā)表于 03-02 09:12

    RT_USING_HEAP該怎樣去理解

    heap management function,換句話說,RTT提供了heap的dynamic管理機制。同時在thread 退出時放置到defunct的list,然后再切出current
    發(fā)表于 04-06 18:17

    Oracle數(shù)據(jù)庫網(wǎng)絡(luò)安全訪問機制

    本文主要分析了Oracle 客戶端通過Net8 訪問數(shù)據(jù)庫服務(wù)器過程,闡述了Oracle 數(shù)據(jù)庫的網(wǎng)絡(luò)訪問機制以及Net8 在實現(xiàn)Oracle 數(shù)據(jù)庫的服務(wù)器和客戶端之間安全的數(shù)據(jù)通信中的重要作用。
    發(fā)表于 08-29 10:20 ?20次下載

    GC6113_GC6103調(diào)試指南

    GC6113&GC6103調(diào)試指南 ,常用功能機8萬攝像頭
    發(fā)表于 01-22 14:13 ?0次下載

    PCIe總線的通信機制

    那么為什么分為Non-Posted和Posted兩種類型?對于Memory Writes來說,對效率要求較高,因此采用了Posted的方式。但是這并不意味著Posted類型的操作不需要Completer進行應(yīng)答,只是此時Co
    的頭像 發(fā)表于 04-24 09:41 ?1.2w次閱讀
    PCIe總線的通信<b class='flag-5'>機制</b>

    深度解析Asp.Net2.0中的Callback機制

    深度解析Asp.Net2.0中的Callback機制(ups電源技術(shù)維修)-該文檔為深度解析Asp.Net2.0中的Callback機制講解文檔,是一份還算不錯的參考文檔,感興趣的可以
    發(fā)表于 09-27 16:28 ?1次下載
    深度解析Asp.<b class='flag-5'>Net</b>2.0中的Callback<b class='flag-5'>機制</b>

    heap_1內(nèi)存分配方法

    heap_1 內(nèi)存分配方法 動 態(tài) 內(nèi) 存 分 配 需 一 個 內(nèi) 存 堆 , FreeRTOS 中 的 內(nèi) 存 堆 為 ucHeap[] , 大 小 為
    的頭像 發(fā)表于 07-30 10:33 ?880次閱讀

    FreeRTOS heap_3內(nèi)存分配方法

    提供一個內(nèi)存堆,編譯器庫提供 malloc()和 free()函數(shù)。比如使用 STM32 的話可以通過修改啟動文件中的 Heap_Size 來修改內(nèi)存堆的大小,如圖所示。 2、具有不確定性 3、可能會增加代碼量。 注意,在 heap
    的頭像 發(fā)表于 07-30 10:40 ?1007次閱讀
    FreeRTOS <b class='flag-5'>heap</b>_3內(nèi)存分配方法

    如何解決引入注冊機制問題

    耦合狀態(tài),失去了一個.c 一個 .h的意義。 如何解決這種問題 ????引入注冊機制。為了方便說明注冊機制,舉一個例子:手機在使用相機這個功能時,有一個操作:將拍攝的照片發(fā)送出去。以程
    的頭像 發(fā)表于 08-16 09:17 ?905次閱讀

    .NET8為原生AOT改進 Linux上原生AOT應(yīng)用程序大小最多減少50%

    .NET 7 首次引入了以原生 AOT (Native AOT)?發(fā)布應(yīng)用程序的選項?;诖颂匦裕_發(fā)者使用原生 AOT 發(fā)布應(yīng)用程序可以創(chuàng)建一個完全獨立 (self-contained) 的版本
    的頭像 發(fā)表于 11-14 11:53 ?1742次閱讀
    .<b class='flag-5'>NET8</b>為原生AOT改進 Linux上原生AOT應(yīng)用程序大小最多減少50%

    zookeeper引入什么機制

    Zookeeper是一個開源的分布式協(xié)調(diào)服務(wù),被廣泛應(yīng)用于構(gòu)建分布式系統(tǒng)和大規(guī)模集群的管理。作為一個分布式協(xié)調(diào)服務(wù),Zookeeper引入了一系列機制來提供可靠的協(xié)調(diào)和一致性服務(wù)。在這篇文章中,我們
    的頭像 發(fā)表于 12-03 16:38 ?1055次閱讀

    .NET8極致性能優(yōu)化AOT

    .NET8對于性能的優(yōu)化是方方面面的,所以AOT預(yù)編譯機器碼也是不例外的。本篇來看下對于AOT的優(yōu)化。
    的頭像 發(fā)表于 12-06 10:16 ?1227次閱讀

    OPCUA產(chǎn)品情報:.NET SDK最新版本公布,系列產(chǎn)品穩(wěn)步更新中!

    近期,Unified Automation公司推出了.NET based OPC UA SDK v4.0.0這一產(chǎn)品。該版本除了例行的Bug修復(fù)外,還進行了部分函數(shù)API的修改與功能的擴展,新添了對使用MQTT/JSON傳輸?shù)腜ubSub模塊和.NET8的支持。
    的頭像 發(fā)表于 03-14 10:00 ?1254次閱讀
    OPCUA產(chǎn)品情報:.<b class='flag-5'>NET</b> SDK最新版本公布,系列產(chǎn)品穩(wěn)步更新中!

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品