国产成人在线电影a区,亚洲成a人片在线观看你懂的,国产传媒无码一区

CPU運行效率高不高，一定程度取決于緩存，這里就給大家分享一下CPU緩存相關(guān)的內(nèi)容。

CPU高速緩存（Cache Memory）

CPU為何要有高速緩存

CPU在摩爾定律的指導(dǎo)下以每18個月翻一番的速度在發(fā)展，然而內(nèi)存和硬盤的發(fā)展速度遠(yuǎn)遠(yuǎn)不及CPU。這就造成了高性能能的內(nèi)存和硬盤價格及其昂貴。然而CPU的高度運算需要高速的數(shù)據(jù)。為了解決這個問題，CPU廠商在CPU中內(nèi)置了少量的高速緩存以解決IO速度和CPU運算速度之間的不匹配問題。在CPU訪問存儲設(shè)備時，無論是存取數(shù)據(jù)抑或存取指令，都趨于聚集在一片連續(xù)的區(qū)域中，這就被稱為局部性原理。

時間局部性（Temporal Locality）：如果一個信息項正在被訪問，那么在近期它很可能還會被再次訪問。

比如循環(huán)、遞歸、方法的反復(fù)調(diào)用等。

空間局部性（Spatial Locality）：如果一個存儲器的位置被引用，那么將來他附近的位置也會被引用。

比如順序執(zhí)行的代碼、連續(xù)創(chuàng)建的兩個對象、數(shù)組等。

帶有高速緩存的CPU執(zhí)行計算的流程

程序以及數(shù)據(jù)被加載到主內(nèi)存

指令和數(shù)據(jù)被加載到CPU的高速緩存

CPU執(zhí)行指令，把結(jié)果寫到高速緩存

高速緩存中的數(shù)據(jù)寫回主內(nèi)存

目前流行的多級緩存結(jié)構(gòu)

由于CPU的運算速度超越了1級緩存的數(shù)據(jù)IO能力，CPU廠商又引入了多級的緩存結(jié)構(gòu)。

多級緩存結(jié)構(gòu)

多核CPU多級緩存一致性協(xié)議MESI

多核CPU的情況下有多個一級緩存，如何保證緩存內(nèi)部數(shù)據(jù)的一致,不讓系統(tǒng)數(shù)據(jù)混亂。這里就引出了一個一致性的協(xié)議MESI。

MESI協(xié)議緩存狀態(tài)

MESI 是指4中狀態(tài)的首字母。每個Cache line有4個狀態(tài)，可用2個bit表示，它們分別是：

緩存行（Cache line）:緩存存儲數(shù)據(jù)的單元。

狀態(tài) 描述監(jiān)聽任務(wù)


M 修改 (Modified)	該Cache line有效，數(shù)據(jù)被修改了，和內(nèi)存中的數(shù)據(jù)不一致，數(shù)據(jù)只存在于本Cache中。	緩存行必須時刻監(jiān)聽所有試圖讀該緩存行相對就主存的操作，這種操作必須在緩存將該緩存行寫回主存并將狀態(tài)變成S（共享）狀態(tài)之前被延遲執(zhí)行。
E 獨享、互斥 (Exclusive)	該Cache line有效，數(shù)據(jù)和內(nèi)存中的數(shù)據(jù)一致，數(shù)據(jù)只存在于本Cache中。	緩存行也必須監(jiān)聽其它緩存讀主存中該緩存行的操作，一旦有這種操作，該緩存行需要變成S（共享）狀態(tài)。
S 共享 (Shared)	該Cache line有效，數(shù)據(jù)和內(nèi)存中的數(shù)據(jù)一致，數(shù)據(jù)存在于很多Cache中。	緩存行也必須監(jiān)聽其它緩存使該緩存行無效或者獨享該緩存行的請求，并將該緩存行變成無效（Invalid）。
I 無效 (Invalid)	該Cache line無效。	無

注意： 對于M和E狀態(tài)而言總是精確的，他們在和該緩存行的真正狀態(tài)是一致的，而S狀態(tài)可能是非一致的。如果一個緩存將處于S狀態(tài)的緩存行作廢了，而另一個緩存實際上可能已經(jīng)獨享了該緩存行，但是該緩存卻不會將該緩存行升遷為E狀態(tài)，這是因為其它緩存不會廣播他們作廢掉該緩存行的通知，同樣由于緩存并沒有保存該緩存行的copy的數(shù)量，因此（即使有這種通知）也沒有辦法確定自己是否已經(jīng)獨享了該緩存行。從上面的意義看來E狀態(tài)是一種投機性的優(yōu)化：如果一個CPU想修改一個處于S狀態(tài)的緩存行，總線事務(wù)需要將所有該緩存行的copy變成invalid狀態(tài)，而修改E狀態(tài)的緩存不需要使用總線事務(wù)。

MESI狀態(tài)轉(zhuǎn)換

理解該圖的前置說明： 1.觸發(fā)事件觸發(fā)事件描述


本地讀?。↙ocal read）	本地cache讀取本地cache數(shù)據(jù)
本地寫入（Local write）	本地cache寫入本地cache數(shù)據(jù)
遠(yuǎn)端讀?。≧emote read）	其他cache讀取本地cache數(shù)據(jù)
遠(yuǎn)端寫入（Remote write）	其他cache寫入本地cache數(shù)據(jù)

2.cache分類：前提：所有的cache共同緩存了主內(nèi)存中的某一條數(shù)據(jù)。本地cache:指當(dāng)前cpu的cache。觸發(fā)cache:觸發(fā)讀寫事件的cache。其他cache:指既除了以上兩種之外的cache。注意：本地的事件觸發(fā) 本地cache和觸發(fā)cache為相同。上圖的切換解釋：狀態(tài) 觸發(fā)本地讀取觸發(fā)本地寫入觸發(fā)遠(yuǎn)端讀取觸發(fā)遠(yuǎn)端寫入


M狀態(tài)（修改）	本地cache:M 觸發(fā)cache:M 其他cache:I	本地cache:M 觸發(fā)cache:M 其他cache:I	本地cache:M→E→S 觸發(fā)cache:I→S 其他cache:I→S 同步主內(nèi)存后修改為E獨享,同步觸發(fā)、其他cache后本地、觸發(fā)、其他cache修改為S共享	本地cache:M→E→S→I 觸發(fā)cache:I→S→E→M 其他cache:I→S→I 同步和讀取一樣,同步完成后觸發(fā)cache改為M，本地、其他cache改為I
E狀態(tài)（獨享）	本地cache:E 觸發(fā)cache:E 其他cache:I	本地cache:E→M 觸發(fā)cache:E→M 其他cache:I 本地cache變更為M,其他cache狀態(tài)應(yīng)當(dāng)是I（無效）	本地cache:E→S 觸發(fā)cache:I→S 其他cache:I→S 當(dāng)其他cache要讀取該數(shù)據(jù)時，其他、觸發(fā)、本地cache都被設(shè)置為S(共享)	本地cache:E→S→I 觸發(fā)cache:I→S→E→M 其他cache:I→S→I 當(dāng)觸發(fā)cache修改本地cache獨享數(shù)據(jù)時時，將本地、觸發(fā)、其他cache修改為S共享.然后觸發(fā)cache修改為獨享，其他、本地cache修改為I（無效），觸發(fā)cache再修改為M
S狀態(tài)(共享)	本地cache:S 觸發(fā)cache:S 其他cache:S	本地cache:S→E→M 觸發(fā)cache:S→E→M 其他cache:S→I 當(dāng)本地cache修改時，將本地cache修改為E,其他cache修改為I,然后再將本地cache為M狀態(tài)	本地cache:S 觸發(fā)cache:S 其他cache:S	本地cache:S→I 觸發(fā)cache：S→E→M 其他cache:S→I 當(dāng)觸發(fā)cache要修改本地共享數(shù)據(jù)時，觸發(fā)cache修改為E（獨享）,本地、其他cache修改為I（無效）,觸發(fā)cache再次修改為M(修改)
I狀態(tài)（無效）	本地cache:I→S或者I→E 觸發(fā)cache:I→S或者I →E 其他cache:E、M、I→S、I 本地、觸發(fā)cache將從I無效修改為S共享或者E獨享，其他cache將從E、M、I 變?yōu)镾或者I	本地cache:I→S→E→M 觸發(fā)cache:I→S→E→M 其他cache:M、E、S→S→I	既然是本cache是I，其他cache操作與它無關(guān)	既然是本cache是I，其他cache操作與它無關(guān)

下圖示意了，當(dāng)一個cache line的調(diào)整的狀態(tài)的時候，另外一個cache line 需要調(diào)整的狀態(tài)。 M E S I


M	×	×	×	√
E	×	×	×	√
S	×	×	√	√
I	√	√	√	√

舉個栗子來說：假設(shè)cache 1 中有一個變量x = 0的cache line 處于S狀態(tài)(共享)。那么其他擁有x變量的cache 2、cache 3等x的cache line調(diào)整為S狀態(tài)（共享）或者調(diào)整為 I 狀態(tài)（無效）。

多核緩存協(xié)同操作

假設(shè)有三個CPU A、B、C，對應(yīng)三個緩存分別是cache a、b、 c。在主內(nèi)存中定義了x的引用值為0。

單核讀取

那么執(zhí)行流程是： CPU A發(fā)出了一條指令，從主內(nèi)存中讀取x。從主內(nèi)存通過bus讀取到緩存中（遠(yuǎn)端讀取Remote read）,這是該Cache line修改為E狀態(tài)（獨享）.

雙核讀取

那么執(zhí)行流程是： CPU A發(fā)出了一條指令，從主內(nèi)存中讀取x。 CPU A從主內(nèi)存通過bus讀取到 cache a中并將該cache line 設(shè)置為E狀態(tài)。 CPU B發(fā)出了一條指令，從主內(nèi)存中讀取x。 CPU B試圖從主內(nèi)存中讀取x時，CPU A檢測到了地址沖突。這時CPU A對相關(guān)數(shù)據(jù)做出響應(yīng)。此時x 存儲于cache a和cache b中，x在chche a和cache b中都被設(shè)置為S狀態(tài)(共享)。

修改數(shù)據(jù)

那么執(zhí)行流程是： CPU A 計算完成后發(fā)指令需要修改x. CPU A 將x設(shè)置為M狀態(tài)（修改）并通知緩存了x的CPU B, CPU B將本地cache b中的x設(shè)置為I狀態(tài)(無效) CPU A 對x進行賦值。

同步數(shù)據(jù)

那么執(zhí)行流程是： CPU B 發(fā)出了要讀取x的指令。 CPU B 通知CPU A,CPU A將修改后的數(shù)據(jù)同步到主內(nèi)存時cache a 修改為E（獨享） CPU A同步CPU B的x,將cache a和同步后cache b中的x設(shè)置為S狀態(tài)（共享）。

MESI優(yōu)化和他們引入的問題

緩存的一致性消息傳遞是要時間的，這就使其切換時會產(chǎn)生延遲。當(dāng)一個緩存被切換狀態(tài)時其他緩存收到消息完成各自的切換并且發(fā)出回應(yīng)消息這么一長串的時間中CPU都會等待所有緩存響應(yīng)完成?？赡艹霈F(xiàn)的阻塞都會導(dǎo)致各種各樣的性能問題和穩(wěn)定性問題。

CPU切換狀態(tài)阻塞解決-存儲緩存（Store Bufferes）

比如你需要修改本地緩存中的一條信息，那么你必須將I（無效）狀態(tài)通知到其他擁有該緩存數(shù)據(jù)的CPU緩存中，并且等待確認(rèn)。等待確認(rèn)的過程會阻塞處理器，這會降低處理器的性能。應(yīng)為這個等待遠(yuǎn)遠(yuǎn)比一個指令的執(zhí)行時間長的多。

Store Bufferes

為了避免這種CPU運算能力的浪費，Store Bufferes被引入使用。處理器把它想要寫入到主存的值寫到緩存，然后繼續(xù)去處理其他事情。當(dāng)所有失效確認(rèn)（Invalidate Acknowledge）都接收到時，數(shù)據(jù)才會最終被提交。這么做有兩個風(fēng)險

Store Bufferes的風(fēng)險

第一、就是處理器會嘗試從存儲緩存（Store buffer）中讀取值，但它還沒有進行提交。這個的解決方案稱為Store Forwarding，它使得加載的時候，如果存儲緩存中存在，則進行返回。第二、保存什么時候會完成，這個并沒有任何保證。

value = 3； void exeToCPUA(){ value = 10; isFinsh = true; } void exeToCPUB(){ if(isFinsh){ //value一定等于10？！ assert value == 10; } } 試想一下開始執(zhí)行時，CPU A保存著finished在E(獨享)狀態(tài)，而value并沒有保存在它的緩存中。（例如，Invalid）。在這種情況下，value會比finished更遲地拋棄存儲緩存。完全有可能CPU B讀取finished的值為true，而value的值不等于10。 即isFinsh的賦值在value賦值之前。 這種在可識別的行為中發(fā)生的變化稱為重排序（reordings）。注意，這不意味著你的指令的位置被惡意（或者好意）地更改。它只是意味著其他的CPU會讀到跟程序中寫入的順序不一樣的結(jié)果。順便提一下NIO的設(shè)計和Store Bufferes的設(shè)計是非常相像的。

硬件內(nèi)存模型

執(zhí)行失效也不是一個簡單的操作，它需要處理器去處理。另外，存儲緩存（Store Buffers）并不是無窮大的，所以處理器有時需要等待失效確認(rèn)的返回。這兩個操作都會使得性能大幅降低。為了應(yīng)付這種情況，引入了失效隊列。它們的約定如下：

對于所有的收到的Invalidate請求，Invalidate Acknowlege消息必須立刻發(fā)送

Invalidate并不真正執(zhí)行，而是被放在一個特殊的隊列中，在方便的時候才會去執(zhí)行。

處理器不會發(fā)送任何消息給所處理的緩存條目，直到它處理Invalidate。

即便是這樣處理器已然不知道什么時候優(yōu)化是允許的，而什么時候并不允許。干脆處理器將這個任務(wù)丟給了寫代碼的人。這就是內(nèi)存屏障（Memory Barriers）。

寫屏障 Store Memory Barrier(a.k.a. ST, SMB, smp_wmb)是一條告訴處理器在執(zhí)行這之后的指令之前，應(yīng)用所有已經(jīng)在存儲緩存（store buffer）中的保存的指令。

讀屏障Load Memory Barrier (a.k.a. LD, RMB, smp_rmb)是一條告訴處理器在執(zhí)行任何的加載前，先應(yīng)用所有已經(jīng)在失效隊列中的失效操作的指令。

void executedOnCpu0() {
    value = 10;
    //在更新數(shù)據(jù)之前必須將所有存儲緩存（store buffer）中的指令執(zhí)行完畢。
    storeMemoryBarrier();
    finished = true;
}
void executedOnCpu1() {
    while(!finished);
    //在讀取之前將所有失效隊列中關(guān)于該數(shù)據(jù)的指令執(zhí)行完畢。
    loadMemoryBarrier();
    assert value == 10;
}

現(xiàn)在確實安全了。完美無暇！

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

cpu

cpu

+關(guān)注

關(guān)注
68

文章
10863

瀏覽量
211782
存儲

存儲

+關(guān)注

關(guān)注
13

文章
4314

瀏覽量
85851
內(nèi)存

內(nèi)存

+關(guān)注

關(guān)注
8

文章
3025

瀏覽量
74056
緩存

緩存

+關(guān)注

關(guān)注
1

文章
240

瀏覽量
26679

原文標(biāo)題：CPU緩存一致性協(xié)議

文章出處：【微信號：strongerHuang，微信公眾號：strongerHuang】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

如何解決數(shù)據(jù)庫與緩存一致性

緩存一致性 每次逢年過節(jié)的時候搶票非常艱難，放票的時候那么多人同時去搶票，如果所有人查詢、購票等都去訪問數(shù)據(jù)庫，那數(shù)據(jù)庫的壓力得有多大，這時候很多都會引入緩存，把車票信息放入緩存，這

發(fā)表于 09-25 15:25 ?1113次閱讀

如何解決數(shù)據(jù)庫與<b class='flag-5'>緩存</b><b class='flag-5'>一致性</b>

小編科普CPU緩存一致性協(xié)議MESI

什么是緩存一致性協(xié)議MESI？MESI協(xié)議中的狀態(tài)有哪幾種？MESI協(xié)議中的狀態(tài)是如何相互轉(zhuǎn)換的？

發(fā)表于 06-17 10:00

請教大神在Arm AMBA協(xié)議集中，什么叫緩存一致性？

請教大神在Arm AMBA協(xié)議集中，什么叫緩存一致性？

發(fā)表于 09-29 14:51

改進的基于目錄的Cache一致性協(xié)議

介紹幾種典型目錄一致性協(xié)議并分析它們的優(yōu)缺點。在綜合全映射目錄和有限目錄優(yōu)點的基礎(chǔ)上，通過在存儲器層上增加一個存儲器高速緩存(Cache)層的方式，提出并討論

發(fā)表于 04-02 09:05 ?32次下載

CMP中Cache一致性協(xié)議的驗證

CMP是處理器體系結(jié)構(gòu)發(fā)展的一個重要方向，其中Cache一致性問題的驗證是CMP設(shè)計中的一項重要課題?；贛ESI一致性協(xié)議，本文建立了CM

發(fā)表于 07-20 14:18 ?38次下載

RFID協(xié)議一致性測試系統(tǒng)設(shè)計（二）

　　軟件無線電這一關(guān)鍵技術(shù)的應(yīng)用，使得RFID協(xié)議一致性測試系統(tǒng)能夠突破傳統(tǒng)儀器受專有硬件限制的局限性，在標(biāo)準(zhǔn)化、模塊化、層次化的體系結(jié)構(gòu)上滿足一致性測試的需求。RFID

發(fā)表于 03-28 17:37 ?1446次閱讀

RFID<b class='flag-5'>協(xié)議</b><b class='flag-5'>一致性</b>測試系統(tǒng)設(shè)計（二）

RFID協(xié)議一致性測試系統(tǒng)設(shè)計（三）

　　在具體實現(xiàn)了RFID協(xié)議一致性測試系統(tǒng)之后，我們將可以應(yīng)用于對RFID單元的實際測試之中，本節(jié)以EPC UHF Class 1 Gen 2（也被稱為ISO 18000-6 Type C）標(biāo)準(zhǔn)的協(xié)議

發(fā)表于 03-28 17:37 ?1296次閱讀

RFID<b class='flag-5'>協(xié)議</b><b class='flag-5'>一致性</b>測試系統(tǒng)設(shè)計（三）

加速器一致性接口

提供異步緩存一致性直接訪問PS的入口。處理器可以標(biāo)記ACP上的傳輸為一致性或非一致性。PL端的AXI主機通過ARUSERS[1:0]指示是否為一致性

發(fā)表于 11-17 15:04 ?3676次閱讀

Cache一致性協(xié)議優(yōu)化研究

問題的由來.總結(jié)了多核時代高速緩存一致性協(xié)議設(shè)計的關(guān)鍵問題,綜述了近年來學(xué)術(shù)界對一致性的研究.從程序訪存行為模式、目錄組織結(jié)構(gòu)、一致性粒度、

發(fā)表于 12-30 15:04 ?0次下載

自主駕駛系統(tǒng)將使用緩存一致性互連IP和非一致性互連IP

下一代ASIL B（D）自主駕駛系統(tǒng)將使用符合ISO 26262標(biāo)準(zhǔn)的緩存一致性互連IP和非一致性互連IP來實現(xiàn)。美國加利福尼亞州坎貝爾2019年4月26日消息—Arteris IP

發(fā)表于 05-09 17:13 ?3227次閱讀

管理基于Cortex?-M7的MCU的高速緩存一致性

本文檔概述了不同場景下的高速緩存一致性問題，并就如何管理或避免高速緩存一致性問題提供了一些方法建議。

發(fā)表于 04-01 10:12 ?5次下載

介紹下cpu緩存一致性（MESI協(xié)議）

之前介紹了java并發(fā)包的cas原理和java內(nèi)存模型，這篇我們介紹下cpu緩存一致性原理，可以幫助我們更好的理解cas的底層原理。

發(fā)表于 06-09 16:01 ?4675次閱讀

如何保證緩存一致性

“ 本文的參考文章是2022年HOT 34上Intel Rob Blakenship關(guān)于CXL緩存一致性的一篇介紹?！?/div>
發(fā)表于 10-19 17:42 ?1113次閱讀

Redis緩存與Mysql如何保證一致性？

基本流程就是客戶端A請求,先去刪除緩存，然后將數(shù)據(jù)寫入數(shù)據(jù)庫，此時客戶端B查詢先去查詢緩存，緩存沒有返回，去查數(shù)據(jù)庫，此時還沒有完成主從同步，拿到是從庫的舊數(shù)據(jù)，然后將舊數(shù)據(jù)進行緩存，

發(fā)表于 12-02 14:23 ?928次閱讀

異構(gòu)計算下緩存一致性的重要性

在眾多回復(fù)中，李博杰同學(xué)的回答被認(rèn)為質(zhì)量最高。他首先將緩存一致性分為兩個主要場景：一是主機內(nèi)CPU與設(shè)備間的一致性；二是跨主機的

發(fā)表于 10-24 17:00 ?547次閱讀