你是否對(duì) MySQL 數(shù)據(jù)庫(kù)中的事務(wù)已經(jīng)有所了解?看下面這張圖,按照 1~6 的順序依次執(zhí)行,在RR隔離級(jí)別下,事務(wù) A 和事務(wù) B 各自輸出的 num 值是多少嗎?
我們預(yù)先創(chuàng)建好這樣一張表并初始化一條數(shù)據(jù):
CREATETABLE`test1`( `id`int(11)NOTNULLAUTO_INCREMENTCOMMENT'主鍵Id', `num`int(11)NULLCOMMENT'數(shù)量', PRIMARYKEY(`id`) )ENGINE=InnoDB; insertintotest1(id,num)values(1,1);
然后開始按上圖的順序執(zhí)行各個(gè)事務(wù),這需要我們打開3個(gè)操作窗口來(lái)分別執(zhí)行 A、B、C 三個(gè)事務(wù):
事務(wù) A:
事務(wù) B:
事務(wù) C:
按照上圖的執(zhí)行順序執(zhí)行 commit,其中事務(wù) C 是自動(dòng)提交事務(wù)的,不需要我們顯示的 commit,事務(wù) A、B 的輸出結(jié)果如下:
事務(wù)A:num=1 事務(wù)B:num=3
為什么是這樣輸出?
它的背后其實(shí)是:MVCC(多版本并發(fā)控制)、consistent read(一致性讀)、locking reads(鎖定讀)等 MySQL 數(shù)據(jù)庫(kù)底層知識(shí)。
1、MVCC
MySQL 數(shù)據(jù)庫(kù)官網(wǎng)文檔是這樣來(lái)描述 MVCC 的:
多版本控制: 指的是一種提高并發(fā)的技術(shù)。最早的數(shù)據(jù)庫(kù)系統(tǒng),只有讀讀之間可以并發(fā),讀寫,寫讀,寫寫都要阻塞。引入多版本之后,只有寫寫之間相互阻塞,其他三種操作都可以并行,這樣大幅度提高了 InnoDB 的并發(fā)度。在內(nèi)部實(shí)現(xiàn)中,與 Postgres 在數(shù)據(jù)行上實(shí)現(xiàn)多版本不同,InnoDB 是在 undolog 中實(shí)現(xiàn)的,通過 undolog 可以找回?cái)?shù)據(jù)的歷史版本。
找回的數(shù)據(jù)歷史版本可以提供給用戶讀(按照隔離級(jí)別的定義,有些讀請(qǐng)求只能看到比較老的數(shù)據(jù)版本),也可以在回滾的時(shí)候覆蓋數(shù)據(jù)頁(yè)上的數(shù)據(jù)。在 InnoDB 內(nèi)部中,會(huì)記錄一個(gè)全局的活躍讀寫事務(wù)數(shù)組,其主要用來(lái)判斷事務(wù)的可見性。
目前來(lái)看 MVCC 的實(shí)現(xiàn)依賴于:
隱藏字段(DB_TRX_ID、DB_ROLL_PTR)
回滾日志(undo log)
一致性讀(consistent read)
你也可以這樣去理解 MVCC:一個(gè)事務(wù)對(duì)數(shù)據(jù)進(jìn)行更新操作時(shí)候,先把舊的數(shù)據(jù)放到一個(gè)單獨(dú)的地方(回滾段),其他事務(wù)讀取數(shù)據(jù)時(shí)候,根據(jù) DB_TRX_ID、DB_ROLL_PTR 計(jì)算出 undo log 鏈中當(dāng)前版本的數(shù)據(jù)。
2、一致性讀(consistent read)
繼續(xù)看官方文檔對(duì) consistent read 的描述:
直譯:
一個(gè)讀操作使用基于某個(gè)時(shí)刻的快照信息來(lái)顯示查詢結(jié)果,而不考慮同時(shí)運(yùn)行的其他事務(wù)所執(zhí)行的更改。如果查詢到的數(shù)據(jù)被其他事務(wù)所更改,則根據(jù) undo log 中的內(nèi)容來(lái)重建原始數(shù)據(jù)。這種技術(shù)避免了一些通過強(qiáng)制事務(wù)等待其他事務(wù)完成而降低并發(fā)性的鎖定問題。
在 RR 級(jí)別下,首次讀操作被執(zhí)行時(shí)候創(chuàng)建一致性讀視圖 ReadView,事務(wù)的后續(xù)讀都基于該視圖的數(shù)據(jù);
在 RC 級(jí)別下,每一次讀操作都會(huì)創(chuàng)建一個(gè)最新的 ReadView,因此每次 select 讀都可以獲取到當(dāng)前已提交事務(wù)的最新數(shù)據(jù)。
“一致性讀”是 InnoDB 引擎在 RC 和 RR 隔離級(jí)別下處理 select 語(yǔ)句的默認(rèn)模式。因?yàn)橐粋€(gè)“一致性讀”是不需要對(duì)它訪問的表設(shè)置任何的鎖,當(dāng)對(duì)表執(zhí)行“一致性讀”時(shí)候,其他會(huì)話可以自由的修改這些表。
另外:
讀未提交(read uncommitted)、串行化(serializable)是不需要依賴 MVCC 的,讀未提交直接每次都讀取當(dāng)前數(shù)據(jù)的最新值即可。而 serializable 是直接采用加鎖的操作讓所有的事務(wù)都串行化執(zhí)行,犧牲了并發(fā)能力。
一致性讀的實(shí)現(xiàn)方式:
每個(gè)事務(wù)啟動(dòng)的瞬間,都會(huì)構(gòu)建一個(gè)數(shù)組(m_ids),用來(lái)記錄目前所有“活躍事務(wù)”(事務(wù)啟動(dòng)了,但是還沒提交)的 ID;
數(shù)組中的最小事務(wù) ID 為低水位;
數(shù)組中的最大事務(wù) ID + 1 為高水位;
數(shù)據(jù)版本可見性規(guī)則:當(dāng)前數(shù)據(jù)某個(gè)版本是否可見,取決于當(dāng)前數(shù)據(jù)的 DB_TRX_ID 以及這個(gè)一致性視圖數(shù)組中記錄的事務(wù) ID 做對(duì)比來(lái)判斷:低水位以前的數(shù)據(jù)版本可見,高水位以后的數(shù)據(jù)版本不可見,低水位和高水位之間得查看當(dāng)前數(shù)據(jù)版本的 DB_TRX_ID 是否存在數(shù)組中,若存在意味著事務(wù)未提交,不可見,若不存在意味著事務(wù)已提交,可見。
那按照一致性讀的理解,事務(wù)B已經(jīng)創(chuàng)建了自己的快照數(shù)據(jù)了,它的輸出應(yīng)該是 num = 2 呀,為什么會(huì)是 num=3?
可是如果不是 num=3,那么已經(jīng)提交的事務(wù) C 的操作不就丟失了嗎?(產(chǎn)生丟失更新問題)
這里又涉及到一個(gè)知識(shí)點(diǎn):
更新數(shù)據(jù)都是先讀后寫的,而這個(gè)讀,只能讀當(dāng)前的值,稱為“當(dāng)前讀”(current read)。
3、當(dāng)前讀(current reads)
也叫做鎖定讀(locking reads)
InnoDB 引擎支持兩種方式的鎖定讀以提供額外的安全性(MySQL 5.7 版本):
#讀鎖(S鎖,共享鎖) SELECT...LOCKINSHAREMODE; #寫鎖(X鎖,排他鎖) SELECT...FORUPDATE;
鎖定讀會(huì)在被讀取的數(shù)據(jù)上加一把共享鎖,其他事務(wù)可以讀取記錄,但是不可以修改記錄,直到當(dāng)前事務(wù)提交。
鎖定讀驗(yàn)證:
為什么要有鎖定讀?
如果你在一個(gè)事務(wù)中先查詢了一個(gè)數(shù)據(jù),然后插入或者更新相關(guān)的數(shù)據(jù),這個(gè)時(shí)候來(lái)了一個(gè)事務(wù)B同時(shí)更新或者刪除你要查詢的記錄,就會(huì)出現(xiàn)幻讀問題了。
這也是為什么 MVCC 不能完全解決幻讀的問題,而是需要 MVCC + 行鎖 + 間隙鎖(next-key lock)的方式。
4、事務(wù) A、B、C 的執(zhí)行流程
繼續(xù)看開頭的第一張圖:
starttransactionwithconsistentsnapshot;
這條 SQL 語(yǔ)句可以立即啟動(dòng)事務(wù),創(chuàng)建當(dāng)前事務(wù)的一致性讀快照。效果等同于 start transaction 然后馬上執(zhí)行 select 語(yǔ)句。
我們接下來(lái)看看文章開頭的三個(gè)事務(wù)對(duì)數(shù)據(jù)行的修改流程,按照步驟 1~6 的操作如下:
如果大家細(xì)致的查看上圖的三個(gè)事務(wù)的穿插執(zhí)行流程,可以發(fā)現(xiàn),A、B、C 三個(gè)事務(wù)無(wú)論是 commit 還是 rollback,都是可以最終得到正確的數(shù)據(jù)。
這就是 InnoDB 引擎下的多版本并發(fā)控制(MVCC)的實(shí)現(xiàn)原理。
總結(jié)以下幾個(gè)關(guān)鍵點(diǎn):
每一個(gè)事務(wù)都會(huì)創(chuàng)建一個(gè)數(shù)據(jù)快照,快照創(chuàng)建的時(shí)機(jī)根據(jù)隔離級(jí)別的不同有所區(qū)別;
每一個(gè)事務(wù)都會(huì)生成一個(gè)全局唯一的 DB_TRX_ID,用于標(biāo)記當(dāng)前版本;
DB_ROLL_PTR 是回滾指針的意思,結(jié)合 DB_TRX_ID 來(lái)最終確定我要拿到的數(shù)據(jù);
DB_TRX_ID、DB_ROLL_PTR、undo log 這三個(gè)值來(lái)控制數(shù)據(jù)的版本;
update、delete 操作都是先讀后寫,這個(gè)讀屬于鎖定讀(當(dāng)前讀)。
審核編輯:劉清
-
TRX
+關(guān)注
關(guān)注
0文章
3瀏覽量
9217 -
MySQL
+關(guān)注
關(guān)注
1文章
811瀏覽量
26580 -
MYSQL數(shù)據(jù)庫(kù)
+關(guān)注
關(guān)注
0文章
96瀏覽量
9392 -
MVCC
+關(guān)注
關(guān)注
0文章
13瀏覽量
1470
原文標(biāo)題:MySQL 底層之 MVCC、回滾段、一致性讀、鎖定讀
文章出處:【微信號(hào):芋道源碼,微信公眾號(hào):芋道源碼】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論