左圖為最簡單的高速緩存的配置,數(shù)據(jù)的讀取和存儲都經(jīng)過高速緩存,CPU核心與高速緩存有一條特殊的快速通道;主存與高速緩存都連在系統(tǒng)總線上(BUS)這條總線還用于其他組件的通信
在高速緩存出現(xiàn)后不久,系統(tǒng)變得越來越復(fù)雜,高速緩存與主存之間的速度差異被拉大,直到加入了另一級緩存,新加入的這級緩存比第一緩存更大,并且更慢,而且經(jīng)濟上不合適,所以有了二級緩存,甚至是三級緩存
1.為什么需要CPU cache?
CPU的頻率太快了,快到主存跟不上,這樣在處理器時鐘周期內(nèi),CPU常常需要等待主存,浪費資源。 所以cache的出現(xiàn),是為了緩解CPU和內(nèi)存之間速度的不匹配問題(結(jié)構(gòu):cpu->cache->memory)。
2.CPU cache 存在的原理?
局部性原理:CPU 訪問存儲器時,無論是存取指令還是存取數(shù)據(jù),所訪問的存取單元都趨于聚集在一個較小的連續(xù)區(qū)域中。
時間局部性:如果某個數(shù)據(jù)被訪問,那么在不久的將來他很可能被再次訪問。
空間局部性:如果某個數(shù)據(jù)被訪問,那么與他相鄰的數(shù)據(jù)很快也可能被訪問。
3.緩存一致性(MESI)
MESI協(xié)議中cache line數(shù)據(jù)狀態(tài)有4種,引起數(shù)據(jù)狀態(tài)轉(zhuǎn)換的CPU cache操作也有4種,因此要理解MESI協(xié)議,就要將這16種狀態(tài)轉(zhuǎn)換的情況討論清楚。
初始場景:在最初的時候,所有的CPU中都沒有數(shù)據(jù),其中一個CPU發(fā)生讀操作,此時發(fā)生RR(數(shù)據(jù)從主內(nèi)存中讀取到當(dāng)前CPU的cache),狀態(tài)為E(獨占,只有當(dāng)前CPU有數(shù)據(jù),并且和主存一致)。此時,如果有其他CPU也讀取主存數(shù)據(jù),則狀態(tài)修改為S(共享,多個CPU之間擁有相同數(shù)據(jù),并且和主存保持一致),如果其中一個CPU發(fā)生數(shù)據(jù)修改,那么該CPU中數(shù)據(jù)狀態(tài)修改為M(擁有最新數(shù)據(jù),和主存不一致,但是以當(dāng)前CPU中的數(shù)據(jù)為準(zhǔn)),并通知其他擁有該數(shù)據(jù)的CPU數(shù)據(jù)失效,其他CPU中的cache line狀態(tài)修改為I(失效,和主存中的數(shù)據(jù)被認(rèn)為不一致,數(shù)據(jù)不可用應(yīng)該重新獲?。?/p>
modify
場景:當(dāng)前CPU中數(shù)據(jù)狀態(tài)是modify,表示當(dāng)前CPU中擁有最新數(shù)據(jù),雖然主存中的數(shù)據(jù)和當(dāng)前CPU中的數(shù)據(jù)不一致,但是以當(dāng)前CPU中的數(shù)據(jù)為準(zhǔn);
LR:此時如果發(fā)生local read,即當(dāng)前CPU讀數(shù)據(jù),直接從cache中獲取數(shù)據(jù),擁有最新數(shù)據(jù),因此狀態(tài)不變;
LW:直接修改本地cache數(shù)據(jù),修改后也是當(dāng)前CPU擁有最新數(shù)據(jù),因此狀態(tài)不變;
RR:因為本地內(nèi)存中有最新數(shù)據(jù),因此當(dāng)前CPU不會發(fā)生RR和RW,當(dāng)本地cache控制器監(jiān)聽到總線上有RR發(fā)生的時,必然是其他CPU發(fā)生了讀主存的操作,此時為了保證一致性, 當(dāng)前CPU應(yīng)該將數(shù)據(jù)寫回主存,而隨后的RR將會使得其他CPU和當(dāng)前CPU擁有共同的數(shù)據(jù),因此狀態(tài)修改為S;
RW(將當(dāng)前CPU緩存中的數(shù)據(jù)寫入到主內(nèi)存里面):同RR,當(dāng)cache控制器監(jiān)聽到總線發(fā)生RW,當(dāng)前CPU會將數(shù)據(jù)寫回主存,因為隨后的RW將會導(dǎo)致主存的數(shù)據(jù)修改,因此狀態(tài)修改成I;
exclusive
場景:當(dāng)前CPU中的數(shù)據(jù)狀態(tài)是exclusive,表示當(dāng)前CPU獨占數(shù)據(jù)(其他CPU沒有數(shù)據(jù)),并且和主存的數(shù)據(jù)一致;
LR:從本地cache中直接獲取數(shù)據(jù),狀態(tài)不變;
LW:修改本地cache中的數(shù)據(jù),狀態(tài)修改成M(因為其他CPU中并沒有該數(shù)據(jù),因此不存在共享問題,不需要通知其他CPU修改cache line的狀態(tài)為I);
RR:因為本地cache中有最新數(shù)據(jù),因此當(dāng)前CPU cache操作不會發(fā)生RR和RW,當(dāng)cache控制器監(jiān)聽到總線上發(fā)生RR的時候,必然是其他CPU發(fā)生了讀取主存的操作,而RR操作不會導(dǎo)致數(shù)據(jù)修改,因此兩個CPU中的數(shù)據(jù)和主存中的數(shù)據(jù)一致,此時cache line狀態(tài)修改為S;
RW:同RR,當(dāng)cache控制器監(jiān)聽到總線發(fā)生RW,發(fā)生其他CPU將最新數(shù)據(jù)寫回到主存,此時為了保證緩存一致性,當(dāng)前CPU的數(shù)據(jù)狀態(tài)修改為I;
shared
場景:當(dāng)前CPU中的數(shù)據(jù)狀態(tài)是shared,表示當(dāng)前CPU和其他CPU共享數(shù)據(jù),且數(shù)據(jù)在多個CPU之間一致、多個CPU之間的數(shù)據(jù)和主存一致;
LR:直接從cache中讀取數(shù)據(jù),狀態(tài)不變;
LW:發(fā)生本地寫,并不會將數(shù)據(jù)立即寫回主存,而是在稍后的一個時間再寫回主存,因此為了保證緩存一致性,當(dāng)前CPU的cache line狀態(tài)修改為M,并通知其他擁有該數(shù)據(jù)的CPU該數(shù)據(jù)失效,其他CPU將cache line狀態(tài)修改為I;
RR:狀態(tài)不變,因為多個CPU中的數(shù)據(jù)和主存一致;
RW:當(dāng)監(jiān)聽到總線發(fā)生了RW,意味著其他CPU發(fā)生了寫主存操作,此時本地cache中的數(shù)據(jù)既不是最新數(shù)據(jù),和主存也不再一致,因此當(dāng)前CPU的cache line狀態(tài)修改為I;
invalid
場景:當(dāng)前CPU中的數(shù)據(jù)狀態(tài)是invalid,表示當(dāng)前CPU中是臟數(shù)據(jù),不可用,其他CPU可能有數(shù)據(jù)、也可能沒有數(shù)據(jù);
LR:因為當(dāng)前CPU的cache line數(shù)據(jù)不可用,因此會發(fā)生RR操作,此時的情形如下。
A. 如果其他CPU中無數(shù)據(jù)則狀態(tài)修改為E;
B. 如果其他CPU中有數(shù)據(jù)且狀態(tài)為S或E則狀態(tài)修改為S;
C. 如果其他CPU中有數(shù)據(jù)且狀態(tài)為M,那么其他CPU首先發(fā)生RW將M狀態(tài)的數(shù)據(jù)寫回主存并修改狀態(tài)為S,隨后當(dāng)前CPU讀取主存數(shù)據(jù),也將狀態(tài)修改為S;
LW:因為當(dāng)前CPU的cache line數(shù)據(jù)無效,因此發(fā)生LW會直接操作本地cache,此時的情形如下。
A. 如果其他CPU中無數(shù)據(jù),則將本地cache line的狀態(tài)修改為M;
B. 如果其他CPU中有數(shù)據(jù)且狀態(tài)為S或E,則修改本地cache,通知其他CPU將數(shù)據(jù)修改為I,當(dāng)前CPU中的cache line狀態(tài)修改為M;
C. 如果其他CPU中有數(shù)據(jù)且狀態(tài)為M,則其他CPU首先將數(shù)據(jù)寫回主存,并將狀態(tài)修改為I,當(dāng)前CPU中的cache line狀態(tài)修改為M;
RR:監(jiān)聽到總線發(fā)生RR操作,表示有其他CPU讀取內(nèi)存,和本地cache無關(guān),狀態(tài)不變;
RW:監(jiān)聽到總線發(fā)生RW操作,表示有其他CPU寫主存,和本地cache無關(guān),狀態(tài)不變;
總結(jié)
MESI協(xié)議為了保證多個CPU cache中共享數(shù)據(jù)的一致性,定義了cache line的四種狀態(tài),而CPU對cache的4種操作可能會產(chǎn)生不一致狀態(tài),因此cache控制器監(jiān)聽到本地操作和遠(yuǎn)程操作的時候, 需要對地址一致的cache line狀態(tài)做出一定的修改,從而保證數(shù)據(jù)在多個cache之間流轉(zhuǎn)的一致性。
-
cpu
+關(guān)注
關(guān)注
68文章
10863瀏覽量
211763 -
緩存
+關(guān)注
關(guān)注
1文章
240瀏覽量
26678
發(fā)布評論請先 登錄
相關(guān)推薦
評論