0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于InnoDB的內存結構及原理詳解

jf_f8pIz0xS ? 來源:SH的全棧筆記 ? 作者:SH的全棧筆記 ? 2021-04-16 16:15 ? 次閱讀

之前寫過一篇文章「簡單了解InnoDB原理」,現(xiàn)在回過頭看,其實里面只是把緩沖池(Buffer Pool),重做日志緩沖(Redo Log Buffer)、插入緩沖(Insert Buffer)和自適應哈希索引Adaptive Hash Index)等概念簡單的介紹了一下。

除此之外還聊了一下MySQL和InnoDB的日志,和兩次寫,總的來說算是一個入門級別的介紹,這篇文章就來詳細介紹一下InnoDB的內存結構。

InnoDB內存結構

其大致結構如下圖。

InnoDB內存的兩個主要區(qū)域分別為Buffer Pool和Log Buffer,此處的Log Buffer目前是用于緩存Redo Log。而Buffer Pool則是MySQL或者說InnoDB中,十分重要、核心的一部分,位于主存。這也是為什么其訪問數(shù)據的效率高,你可以暫時把它理解成Redis那樣的內存數(shù)據庫,因為我們更新和新增當然它不是,只是這樣會更加方便我們理解。

Buffer Pool

通常來說,宿主機80%的內存都應該分配給Buffer Pool,因為Buffer Pool越大,其能緩存的數(shù)據就更多,更多的操作都會發(fā)生在內存,從而達到提升效率的目的。

由于其存儲的數(shù)據類型和數(shù)據量非常多,Buffer Pool存儲的時候一定會按照某些結構去存儲,并且做了某些處理。否則獲取的時候除了遍歷所有數(shù)據之外,沒有其他的捷徑,這樣的低效率操作肯定是無法支撐MySQL的高性能的。

因此,Buffer Pool被分成了很多頁,這在之前的文章中也有講過,這里不再贅述。每頁可以存放很多數(shù)據,剛剛也提到了,InnoDB一定是對數(shù)據做了某些操作。

InnoDB使用了鏈表來組織頁和頁中存儲的數(shù)據,頁與頁之間形成了雙向鏈表,這樣可以方便的從當前頁跳到下一頁,同時使用LRU(Least Recently Used)算法去淘汰那些不經常使用的數(shù)據。

同時,每頁中的數(shù)據也通過單向鏈表進行鏈接。因為這些數(shù)據是分散到Buffer Pool中的,單向鏈表將這些分散的內存給連接了起來。

Log Buffer

Log Buffer用來存儲那些即將被刷入到磁盤文件中的日志,例如Redo Log,該區(qū)域也是InnoDB內存的重要組成部分。Log Buffer的默認值為16M,如果我們需要進行調整的話,可以通過配置參數(shù)innodb_log_buffer_size來進行調整。

當Log Buffer如果較大,就可以存儲更多的Redo Log,這樣一來在事務提交之前我們就不需要將Redo Log刷入磁盤,只需要丟到Log Buffer中去即可。因此較大的Log Buffer就可以更好的支持較大的事務運行;同理,如果有事務會大量的更新、插入或者刪除行,那么適當?shù)脑龃驦og Buffer的大小,也可以有效的減少部分磁盤I/O操作。

至于Log Buffer中的數(shù)據刷入到磁盤的頻率,則可以通過參數(shù)innodb_flush_log_at_trx_commit來決定。

Buffer Pool的LRU算法

了解完了InnoDB的內存結構之后,我們來仔細看看Buffer Pool的LRU算法是如何實現(xiàn)將最近沒有使用過的數(shù)據給過期的。

原生LRU

首先明確一點,此處的LRU算法和我們傳統(tǒng)的LRU算法有一定的區(qū)別。為什么呢?因為實際生產環(huán)境中會存在全表掃描的情況,如果數(shù)據量較大,可能會將Buffer Pool中存下來的熱點數(shù)據給全部替換出去,而這樣就會導致該段時間MySQL性能斷崖式下跌。

對于這種情況,MySQL有一個專用名詞叫緩沖池污染。所以MySQL對LRU算法做了優(yōu)化。

優(yōu)化后的LRU

優(yōu)化之后的鏈表被分成了兩個部分,分別是 New Sublist 和 Old Sublist,其分別占用了 Buffer Pool 的3/4和1/4。

鏈表的前3/4,也就是 New Sublist 存放的是訪問較為頻繁的頁,而后1/4也就是 Old Sublist 則是反問的不那么頻繁的頁。Old Sublist中的數(shù)據,會在后續(xù)Buffer Pool剩余空間不足、或者有新的頁加入時被移除掉。

了解了鏈表的整體構造和組成之后,我們就以新頁被加入到鏈表為起點,把整體流程走一遍。首先,一個新頁被放入到Buffer Pool之后,會被插入到鏈表中 New Sublist 和 Old Sublist 相交的位置,該位置叫MidPoint。

該鏈表存儲的數(shù)據來源有兩部分,分別是:

MySQL的預讀線程預先加載的數(shù)據

用戶的操作,例如Query查詢

默認情況下,由用戶操作影響而進入到Buffer Pool中的數(shù)據,會被立即放到鏈表的最前端,也就是 New Sublist 的 Head 部分。但如果是MySQL啟動時預加載的數(shù)據,則會放入MidPoint中,如果這部分數(shù)據被用戶訪問過之后,才會放到鏈表的最前端。

這樣一來,雖然這些頁數(shù)據在鏈表中了,但是由于沒有被訪問過,就會被移動到后1/4的 Old Sublist中去,直到被清理掉。

優(yōu)化Buffer Pool的配置

在實際的生產環(huán)境中,我們可以通過變更某些設置,來提升Buffer Pool運行的性能。

例如,我們可以分配盡量多的內存給Buffer Pool,如此就可以緩存更多的數(shù)據在內存中

當前有足夠的內存時,就可以搞多個Buffer Pool實例,減少并發(fā)操作所帶來的數(shù)據競爭

當我們可以預測到即將到來的大量請求時,我們可以手動的執(zhí)行這部分數(shù)據的預讀請求

我們還可以控制Buffer Pool刷數(shù)據到磁盤的頻率,以根據當前MySQL的負載動態(tài)調整

那我們怎么知道當前運行的 MySQL 中 Buffer Pool 的狀態(tài)呢?我們可以通過命令show engine innodb status來查看。這個命令是看 InnoDB 整體的狀態(tài)的, Buffer Pool 相關的監(jiān)控指標包含在了其中,在Buffer Pool And Memory模塊中。

樣例如下。

---------------------- BUFFER POOL AND MEMORY ---------------------- Total large memory allocated 137428992 Dictionary memory allocated 972752 Buffer pool size 8191 Free buffers 4596 Database pages 3585 Old database pages 1303 Modified db pages 0 Pending reads 0 Pending writes: LRU 0, flush list 0, single page 0 Pages made young 1171, not young 0 0.00 youngs/s, 0.00 non-youngs/s Pages read 655, created 7139, written 173255 0.00 reads/s, 0.00 creates/s, 0.00 writes/s No buffer pool page gets since the last printout Pages read ahead 0.00/s, evicted without access 0.00/s, Random read ahead 0.00/s LRU len: 3585, unzip_LRU len: 0 I/O sum[0]:cur[0], unzip sum[0]:cur[0]

解釋一些關鍵的指標所代表的含義:

Total memory allocated:分配給 Buffer Pool 的總內存

Dictionary memory allocated:分配給 InnoDB 數(shù)據字典的總內存

Buffer pool size:分配給 Buffer Pool 中頁的內存大小

Free buffers:分配給 Buffer Pool 中 Free List 的內存大小

Database pages:分配給 LRU 鏈表的內存大小

Old database pages:分配給 LRU 子鏈表的內存大小

Modified db pages:當前Buffer Pook中被更新的頁的數(shù)量

Pending reads:當前等待讀入 Buffer Pool 的頁的數(shù)量

Pending writes LRU:當前在 LRU 鏈表中等待被刷入磁盤的臟頁數(shù)量

都是些很常規(guī)的配置項,你可能會比較好奇什么是 Free List。

Free List 中存放的都是未被使用的頁。因為MySQL啟動的時候,InnoDB 會預先申請一部分頁。如果當前頁還未被使用,就會被保存在 Free List 中。

知道了 Free List,那么你也應該知道 Flush List,里面保存的是所有的臟頁,都是被更改后需要刷入到磁盤的。

自適應哈希索引

自適應哈希索引(Adaptive Hash Index)是配合Buffer Pool工作的一個功能。自適應哈希索引使得MySQL的性能更加接近于內存服務器。

如果要啟用自適應哈希索引,可以通過更改配置innodb_adaptive_hash_index來開啟。如果不想啟用,也可以在啟動的時候,通過命令行參數(shù)--skip-innodb-adaptive-hash-index來關閉。

自適應哈希索引是根據索引Key的前綴來構建的,InnoDB 有自己的監(jiān)控索引的機制,當其檢測到為當前某個索引頁建立哈希索引能夠提升效率時,就會創(chuàng)建對應的哈希索引。如果某張表數(shù)據量很少,其數(shù)據全部都在Buffer Pool中,那么此時自適應哈希索引就會變成我們所熟悉的指針這樣一個角色。

當然,創(chuàng)建、維護自適應哈希索引是會帶來一定的開銷的,但是比起其帶來的性能上的提升,這點開銷可以直接忽略不計。但是,是否要開啟自適應哈希索引還是需要看具體的業(yè)務情況的,例如當我們的業(yè)務特征是有大量的并發(fā)Join查詢,此時訪問自適應哈希索引被產生競爭。并且如果業(yè)務還使用了LIKE或者%等通配符,根本就不會用到哈希索引,那么此時自適應哈希索引反而變成了系統(tǒng)的負擔。

所以,為了盡可能的減少并發(fā)情況下帶來的競爭,InnoDB對自適應哈希索引進行了分區(qū),每個索引都被綁定到了一個特定的分區(qū),而每個分區(qū)都由單獨的鎖進行保護。其實通俗點理解,就是降低了鎖的粒度。分區(qū)的數(shù)量我們可以通過配置innodb_adaptive_hash_index_parts來改變,其可配置的區(qū)間范圍為[8, 512]。

Change Buffer

聊完了 Buffer Pool 中索引相關,剩下的就是 Change Buffer 了。Change Buffer是一塊比較特殊的區(qū)域,其作用是用于存儲那些當前不在 Buffer Pool 中的但是又被修改過的二級索引。

用流程來描述一下就是,當我們更新了非聚簇索引(二級索引)的數(shù)據時,此時應該是直接將其在Buffer Pool中的對應數(shù)據更新了即可,但是不湊巧的是,當前二級索引不在 Buffer Pool 中,此時將其從磁盤拉取到 Buffer Pool 中的話,并不是最優(yōu)的解,因為該二級索引可能之后根本就不會被用到,那么剛剛昂貴的磁盤I/O操作就白費了。

所以,我們需要這么一個地方,來暫存對這些二級索引所做的改動。當被緩存的二級索引頁被其他的請求加載到了Buffer Pool 中之后,就會將 Change Buffer 中緩存的數(shù)據合并到 Buffer Pool 中去。

當然,Change Buffer也不是沒有缺點。當 Change Buffer 中有很多的數(shù)據時,全部合并到Buffer Pool可能會花上幾個小時的時間,并且在合并的期間,磁盤的I/O操作會比較頻繁,從而導致部分的CPU資源被占用。

那你可能會問,難道只有被緩存的頁加載到了 Buffer Pool 才會觸發(fā)合并操作嗎?那要是它一直沒有被加載進來,Change Buffer 不就被撐爆了?很顯然,InnoDB在設計的時候考慮到了這個點。除了對應的頁加載,提交事務、服務停機、服務重啟都會觸發(fā)合并。
編輯:lyn

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 內存
    +關注

    關注

    8

    文章

    3025

    瀏覽量

    74060
  • MySQL
    +關注

    關注

    1

    文章

    811

    瀏覽量

    26580
  • 索引
    +關注

    關注

    0

    文章

    59

    瀏覽量

    10469
收藏 人收藏

    評論

    相關推薦

    DDR5內存的工作原理詳解 DDR5和DDR4的主要區(qū)別

    DDR5內存的工作原理詳解 1. DDR5內存簡介 DDR5(Double Data Rate 5)是第五代雙倍數(shù)據速率同步動態(tài)隨機存取存儲器(SDRAM)。它是DDR4的后續(xù)產品,提供更高
    的頭像 發(fā)表于 11-22 15:38 ?1031次閱讀

    DDR內存的工作原理與結構

    電子設備的內存技術。以下是對DDR內存的工作原理與結構的介紹: 一、工作原理 時鐘同步 :DDR內存是同步的,這意味著數(shù)據傳輸與系統(tǒng)時鐘同步。時鐘信號用于協(xié)調
    的頭像 發(fā)表于 11-20 14:32 ?467次閱讀

    Windows管理內存的三種主要方式

    Windows操作系統(tǒng)提供了多種方式來管理內存,以確保系統(tǒng)資源的有效利用和性能的優(yōu)化。以下是關于Windows管理內存的三種主要方式的詳細闡述,包括堆內存管理、虛擬
    的頭像 發(fā)表于 10-12 17:09 ?800次閱讀

    邏輯內存和物理內存的區(qū)別

    邏輯內存和物理內存是計算機系統(tǒng)中兩個重要的概念,它們在計算機的運行和數(shù)據處理中起著至關重要的作用。 1. 物理內存(Physical Memory) 物理內存,也稱為RAM(Rando
    的頭像 發(fā)表于 09-27 15:38 ?697次閱讀

    如何使用反射內存交換機

    反射內存交換機是一種用于實現(xiàn)高速數(shù)據共享和通信的關鍵設備,以下是關于如何使用反射內存交換機的詳細介紹:一、前期準備?在開始使用反射內存交換機之前,需要進行以下準備工作:?1.了解系統(tǒng)需
    發(fā)表于 09-14 09:23 ?0次下載

    內存緩沖區(qū)和內存的關系

    內存緩沖區(qū)和內存之間的關系是計算機體系結構中一個至關重要的方面,它們共同協(xié)作以提高數(shù)據處理的效率和系統(tǒng)的整體性能。
    的頭像 發(fā)表于 09-10 14:38 ?585次閱讀

    內存管理的硬件結構

    常見的內存分配函數(shù)有malloc,mmap等,但大家有沒有想過,這些函數(shù)在內核中是怎么實現(xiàn)的?換句話說,Linux內核的內存管理是怎么實現(xiàn)的?
    的頭像 發(fā)表于 09-04 14:28 ?320次閱讀
    <b class='flag-5'>內存</b>管理的硬件<b class='flag-5'>結構</b>

    堆棧和內存的基本知識

    本文主要聊聊關于堆棧的內容。包括堆棧和內存的基本知識。常見和堆棧相關的 bug,如棧溢出,內存泄漏,堆內存分配失敗等。后面介紹軟件中堆棧統(tǒng)計的重要性,以及如何使用工具工具軟件中堆棧使用
    的頭像 發(fā)表于 08-29 14:10 ?471次閱讀
    堆棧和<b class='flag-5'>內存</b>的基本知識

    華納云:InnoDB 具有哪四大特性

    InnoDB 是 MySQL 數(shù)據庫中的一種存儲引擎,它具有許多特性,但通常被認為有以下幾個主要特點: 行級鎖定:InnoDB 支持行級鎖定,這意味著它在處理并發(fā)事務時,只鎖定那些需要修改的行,而
    的頭像 發(fā)表于 08-14 16:02 ?309次閱讀

    你是否真的了解結構體占用了多少字節(jié)?

    結構體成員所占內存空間大小一般情況下,如果想知道結構體成員的內存占用情況需要:1、先用結構體在內存
    的頭像 發(fā)表于 06-04 08:04 ?467次閱讀
    你是否真的了解<b class='flag-5'>結構</b>體占用了多少字節(jié)?

    寄存器和內存的區(qū)別

    在計算機體系結構中,寄存器和內存是兩個至關重要的組成部分。它們各自承擔著不同的角色,共同確保計算機系統(tǒng)的正常運行。本文將對寄存器和內存進行詳細的介紹,包括它們的定義、功能以及二者之間的主要區(qū)別。
    的頭像 發(fā)表于 05-12 17:11 ?2305次閱讀

    集成芯片原理圖詳解

    集成芯片的原理圖詳解涉及多個方面,包括芯片的結構、功能模塊、信號傳輸以及內部電路連接等。
    的頭像 發(fā)表于 03-19 16:36 ?1922次閱讀

    數(shù)組和鏈表在內存中的區(qū)別 數(shù)組和鏈表的優(yōu)缺點

    數(shù)組和鏈表在內存中的區(qū)別 數(shù)組和鏈表的優(yōu)缺點? 數(shù)組和鏈表是常見的數(shù)據結構,用于組織和存儲數(shù)據。它們在內存中的存儲方式以及優(yōu)缺點方面存在一些顯著的差異。本文將詳細探討這些差異以及它們的優(yōu)缺點。 1.
    的頭像 發(fā)表于 02-21 11:30 ?1044次閱讀

    經典 C 語言編程,結構體和聯(lián)合體如何共用?

    結構結構體占用的內存大小,首先和編譯器的系統(tǒng)位數(shù)有關系,類似于CPU是 64 bits 還是 32 bits 的情形;其次,結構體需要考慮字節(jié)對齊的問題。 實際上占用的
    的頭像 發(fā)表于 01-11 18:24 ?1378次閱讀
    經典 C 語言編程,<b class='flag-5'>結構</b>體和聯(lián)合體如何共用?

    FreeRTOS內存機制詳解

    FreeRTOS是一種實時操作系統(tǒng),它提供了多種內存分配方式,包括動態(tài)內存分配和靜態(tài)內存分配。
    的頭像 發(fā)表于 12-31 16:49 ?2707次閱讀
    FreeRTOS<b class='flag-5'>內存</b>機制<b class='flag-5'>詳解</b>