0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

對 B+ 樹與索引在 MySQL 中的認識

數(shù)據(jù)分析與開發(fā) ? 來源:博客園 ? 作者:AnnsShadoW ? 2021-11-08 11:11 ? 次閱讀

概述

本質:數(shù)據(jù)庫維護某種數(shù)據(jù)結構以某種方式引用(指向)數(shù)據(jù)

索引取舍原則:索引的結構組織要盡量減少查找過程中磁盤I/O的存取次數(shù)

B樹

滿足的條件

d為大于1的一個正整數(shù),稱為B-Tree的度

h為一個正整數(shù),稱為B-Tree的高度

每個非葉子節(jié)點由n-1個key和n個指針組成,其中d《=n《=2d

每個葉子節(jié)點最少包含一個key和兩個指針,最多包含2d-1個key和2d個指針,葉節(jié)點的指針均為null

所有葉節(jié)點具有相同的深度,等于樹高h

key和指針互相間隔,節(jié)點兩端是指針

一個節(jié)點中的key從左到右非遞減排列

所有節(jié)點組成樹結構

每個指針要么為null,要么指向另外一個節(jié)點

一個度為d的B-Tree,設其索引N個key,則其樹高h的上限為logd((N+1)/2),檢索一個key查找節(jié)點的個數(shù)的漸進復雜度為logd(N)

更新后的操作

插入刪除新的數(shù)據(jù)記錄會破壞B-Tree的性質,因此在插入刪除時,需要對樹進行一個分裂、合并、轉移等操作以保持B-Tree性質

B+樹

bb7b4ebc-3fc2-11ec-9195-dac502259ad0.jpg

每個節(jié)點的指針上限為2d而不是2d+1

內節(jié)點不存儲data,只存儲key

葉子節(jié)點不存儲指針

在經典B+樹的基礎上,增加了順序訪問指針--》提高區(qū)間訪問的性能

為什么使用B/B+樹?

主存讀取

當系統(tǒng)需要讀取主存時,則將地址信號放到地址總線上傳給主存

主存讀到地址信號后,解析信號并定位到指定存儲單元,然后將此存儲單元數(shù)據(jù)放到數(shù)據(jù)總線上,供其它部件讀取

主存存取的時間僅與存取次數(shù)呈線性關系,因為不存在機械操作,兩次存取的數(shù)據(jù)的“距離”不會對時間有任何影響

磁盤存取原理

磁盤轉動,每個磁頭不動,負責讀取內容

不過已經有了多磁頭獨立技術

局部性原理

磁盤預讀:長度一般以頁的整數(shù)倍為單位

MyISAM索引實現(xiàn)

使用B+樹作為索引結構,data存放數(shù)據(jù)記錄的地址

索引文件與數(shù)據(jù)文件分離

主索引和輔助索引(Secondary key)在結構上沒有任何區(qū)別,只是主索引要求key是唯一的,而輔助索引的key可以重復

非聚集:MyISAM中索引檢索的算法為首先按照B+Tree搜索算法搜索索引,如果指定的Key存在,則取出其data域的值,然后以data域的值為地址,讀取相應數(shù)據(jù)記錄

.MYI文件的組成

整個索引文件的基本信息state

各索引的限制信息base

各索引的定義信息keydef

各索引記錄的概要信息recinfo

讀取索引的流程

query請求,直接讀取key cache中的cache block,有就返回

沒有就到.MYI文件中以file block方式讀取數(shù)據(jù)

再以相同的格式存取key cache

再將key cache中的數(shù)據(jù)返回

InnoDB索引實現(xiàn)

也是使用B+樹

第一個與MyISAM的不同點

第一個重大區(qū)別是InnoDB的數(shù)據(jù)文件本身就是索引文件,表數(shù)據(jù)文件本身就是按B+Tree組織的一個索引結構

InnoDB的數(shù)據(jù)文件本身要按主鍵聚集

所以InnoDB要求表必須有主鍵(MyISAM可以沒有)

沒有顯式指定,自動選擇唯一標識列

不存在的話,生成6個字節(jié)長整型的隱含字段

第二個與MyISAM的不同點

InnoDB的輔助索引data域存儲相應記錄主鍵的值而不是地址

換句話說,InnoDB的所有輔助索引都引用主鍵作為data域

輔助索引搜索需要檢索兩遍索引:首先檢索輔助索引獲得主鍵,然后用主鍵到主索引中檢索獲得記錄

得出的優(yōu)化點

不建議使用過長的字段作為主鍵,因為所有輔助索引都引用主索引,過長的主索引會令輔助索引變得過大

用非單調的字段作為主鍵在InnoDB中也不好,因為InnoDB數(shù)據(jù)文件本身是一顆B+Tree,非單調的主鍵會造成在插入新記錄時數(shù)據(jù)文件為了維持B+Tree的特性而頻繁的分裂調整,十分低效,而使用自增字段作為主鍵就很不錯了

聚簇索引鍵被更新造成的成本除了索引數(shù)據(jù)可能會移動,相關的所有記錄數(shù)據(jù)也要移動

索引使用策略及優(yōu)化

全列匹配

按照索引中所有列進行精確匹配(這里精確匹配指“=”或“IN”匹配)時,索引可以被用到

理論上索引對順序是敏感的,但是由于MySQL的查詢優(yōu)化器會自動調整where子句的條件順序以使用適合的索引

最左前綴匹配

當查詢條件精確匹配索引的左邊連續(xù)一個或幾個列時,索引可以被用到

查詢條件用到了索引中列的精確匹配,但是中間某個條件未提供

只能用到索引中,從中間斷開前的列

應對

可以增加輔助索引

當中間條件選項較少時,用隔離列的方式,使用IN包含

看情況,比較建立

查詢條件沒有指定索引第一列

不滿足使用索引的條件

匹配某列的前綴字符串

可以使用索引

如果通配符%不出現(xiàn)在開頭,則可以用到索引,但根據(jù)具體情況不同可能只會用其中一個前綴

范圍查詢

范圍列可以用到索引(必須是最左前綴),但是范圍列后面的列無法用到索引

同時,索引最多用于一個范圍列,因此如果查詢條件中有兩個范圍列則無法全用到索引

僅用explain可能無法區(qū)分范圍索引和多值匹配

查詢條件中含有函數(shù)/表達式

一般不使用哦

手工算好再代入

索引選擇性與前綴索引

MyISAM與InnoDB基數(shù)統(tǒng)計方式

MyisAM索引的基數(shù)值(Cardinality,show index 命令可以看見)是精確的,InnoDB則是估計值

MyisAM統(tǒng)計信息是保存磁盤中,在alter表或Analyze table操作更新此信息

而InnoDB則是在表第一次打開的時候估計值保存在緩存區(qū)內

不建議建立索引的情況

表記錄比較少

索引的選擇性低:不重復的索引值(也叫基數(shù),Cardinality)與表記錄數(shù)(#T)的比值

前綴索引

用列的前綴代替整個列作為索引key,當前綴長度合適時,可以做到既使得前綴索引的選擇性接近全列索引,同時因為索引key變短而減少了索引文件的大小和維護開銷

缺點

不能用于ORDER BY和GROUP BY操作

也不能用于Covering index(即當索引本身包含查詢所需全部數(shù)據(jù)時,不再訪問數(shù)據(jù)文件本身)

InnoDB主鍵選擇與插入優(yōu)化

如果沒有特別的需要,請永遠使用一個與業(yè)務無關的自增字段作為主鍵

InnoDB使用聚集索引,數(shù)據(jù)記錄本身被存于主索引(一顆B+Tree)的葉子節(jié)點上

這就要求同一個葉子節(jié)點內(大小為一個內存頁或磁盤頁)的各條數(shù)據(jù)記錄按主鍵順序存放,因此每當有一條新的記錄插入時,MySQL會根據(jù)其主鍵將其插入適當?shù)墓?jié)點和位置,如果頁面達到裝載因子(InnoDB默認為15/16),則開辟一個新的頁(節(jié)點)

如果使用非自增主鍵,每次插入近似隨機,容易引起數(shù)據(jù)的移動,重新讀目標頁面,碎片也多了,雖然也可以用OPTIMIZE TABLE重建優(yōu)化,但麻煩啊

參考資料

圖片來源網絡

《高性能MySQL》

作者:AnnsShadoW

https://www.cnblogs.com/annsshadow/p/5355090.html

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 磁盤
    +關注

    關注

    1

    文章

    379

    瀏覽量

    25212
  • 數(shù)據(jù)庫

    關注

    7

    文章

    3816

    瀏覽量

    64457
  • MySQL
    +關注

    關注

    1

    文章

    816

    瀏覽量

    26609

原文標題:對 B+ 樹與索引在 MySQL 中的認識

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    云服務器 Flexus X 實例 MySQL 應用加速測試

    ? 小結論 ? 概要 探索華為云強大的云服務生態(tài)時,我深入體驗了 EulerOS 鏡像對 MySQL 應用的顯著加速效果。不僅簡化了部署流程,更在性能上實現(xiàn)了質的飛躍。恰逢華為云 828 B2B
    的頭像 發(fā)表于 12-24 12:19 ?164次閱讀
    云服務器 Flexus X 實例 <b class='flag-5'>MySQL</b> 應用加速測試

    阿里國際推出全球首個B2B AI搜索引擎Accio

    近日,歐洲科技峰會Web Summit上,阿里國際正式推出了全球首個B2B領域的AI搜索引擎——Accio。這一創(chuàng)新產品面向全球商家開放,標志著阿里國際正式入局當前備受矚目的AI Search賽道。
    的頭像 發(fā)表于 11-15 16:53 ?710次閱讀

    MySQL編碼機制原理

    MyQL 編解碼機制介紹 問題解答 讀者問題簡介 為敘述方便,以下的「我」指代讀者 我們知道 Java 是通過 ?JDBC 來訪問數(shù)據(jù)庫的,以訪問 MySQL 為例,需要配置以下 url 才能訪問
    的頭像 發(fā)表于 11-09 11:01 ?251次閱讀

    MATLAB的矩陣索引

    對矩陣進行索引是從矩陣中選擇或修改部分元素的一種方式。MATLAB 有幾種索引樣式,它們不僅功能強大、靈活,而且可讀性強、表現(xiàn)力強。矩陣是 MATLAB 用來組織和分析數(shù)據(jù)的一個核心組件,索引是以可理解的方式有效操作矩陣的關鍵。
    的頭像 發(fā)表于 09-05 09:28 ?479次閱讀
    MATLAB<b class='flag-5'>中</b>的矩陣<b class='flag-5'>索引</b>

    人工智能大模型公司卓世科技完成億元B+輪融資

    近日,國內領先的人工智能大模型解決方案提供商卓世科技宣布成功完成億元級B+輪融資,此輪融資由業(yè)界知名投資機構同創(chuàng)偉業(yè)領投,同時吸引了青島國資平臺青島海發(fā)及啟迪之星等重量級機構的跟投,彰顯了資本市場對卓世科技人工智能領域創(chuàng)新實力及未來發(fā)展前景的高度認可。
    的頭像 發(fā)表于 08-13 17:50 ?643次閱讀

    壹沓科技完成B+輪融資,加速大供應鏈超自動化進程

    近日,全球領先的數(shù)字員工機器人公司——壹沓科技宣布成功完成B+輪融資,此輪融資由鼎暉VGC(創(chuàng)新與成長基金)領投,新尚資本跟投,彰顯了資本市場對壹沓科技大供應鏈領域超自動化解決方案的高度認可與信心。
    的頭像 發(fā)表于 08-09 18:13 ?1341次閱讀

    MySQL知識點匯總

    大家好,這部分被稱為DQL部分,是每個學習MySQL必須要學會的部分,下面就讓我來介紹MySQL的其他部分。
    的頭像 發(fā)表于 08-05 15:27 ?411次閱讀
    <b class='flag-5'>MySQL</b>知識點匯總

    地芯科技完成近億元B+輪融,加速高端模擬射頻芯片發(fā)展

    近日,國內領先的高端模擬射頻芯片研發(fā)企業(yè)——地芯科技,宣布成功完成近億元的B+輪融資。本輪融資由鴻富資產、九智資本及鴻鵠致遠投資共同注資,標志著地芯科技資本市場上的強勁勢頭和廣泛認可。
    的頭像 發(fā)表于 08-01 17:15 ?734次閱讀

    一文了解MySQL索引機制

    的呢?一起靜下心來,耐心看完這篇文章吧,干貨不啰嗦,相信你一定會有所收獲。 一、索引模型 模型也就是數(shù)據(jù)結構,常見的三種模型分別是哈希表、有序數(shù)組和搜索。 了解MySQL的朋友已經知道,現(xiàn)在
    的頭像 發(fā)表于 07-25 14:05 ?300次閱讀
    一文了解<b class='flag-5'>MySQL</b><b class='flag-5'>索引</b>機制

    步進電機A+ A-有波形輸出,B+ B-沒有波形是什么原因?

    ,B+B-沒有,會是什么原因。 A+ ---》AOUT1 A- ---》AOUT2 B+ ---》BOUT1 B- ---》BOUT1
    發(fā)表于 04-18 07:30

    labview 創(chuàng)建mysql 表時 設置時間 怎么mysql是格式是date 而不是datetime?

    選擇 時間日期 但是mysql是date而不是datetime類型 ,除了sql語句創(chuàng)建表 ,怎么能實現(xiàn)創(chuàng)建表數(shù)據(jù)為datetime類型
    發(fā)表于 02-04 09:46

    查詢SQLmysql內部是如何執(zhí)行?

    我們知道mySQL客戶端,輸入一條查詢SQL,然后看到返回查詢的結果。這條查詢語句 MySQL 內部到底是如何執(zhí)行的呢?本文跟大家探討一下哈,我們先來看下
    的頭像 發(fā)表于 01-22 14:53 ?581次閱讀
    查詢SQL<b class='flag-5'>在</b><b class='flag-5'>mysql</b>內部是如何執(zhí)行?

    瓦特曼AI視覺企業(yè)先后完成數(shù)億元B輪和B+輪融資

    2023年12月,北京瓦特曼智能科技有限公司(以下簡稱“瓦特曼”或“WATTMAN“)先后完成數(shù)億元B輪和B+輪融資,由中國移動旗下北京移數(shù)字新經濟產業(yè)基金、國投證券相繼領投。
    的頭像 發(fā)表于 01-13 14:21 ?1689次閱讀

    MySQL密碼忘記了怎么辦?MySQL密碼快速重置方法步驟命令示例!

    是重置MySQL密碼的詳細步驟和示例命令。 開始重置MySQL密碼之前,請確保你具備管理員或超級用戶的權限。此外,請注意,重置密碼之前,將會中斷所有正在運行的
    的頭像 發(fā)表于 01-12 16:06 ?767次閱讀

    光舵微納完成由國投創(chuàng)合投資的近億元B+輪股權融資

    據(jù)麥姆斯咨詢報道,近日,蘇州光舵微納科技股份有限公司(簡稱:光舵微納)完成由國投創(chuàng)合投資的近億元B+輪股權融資。
    的頭像 發(fā)表于 01-05 11:20 ?787次閱讀