0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

硬件內(nèi)存模型的詳細(xì)介紹

茶棚小二a ? 來(lái)源:茶棚小二 ? 作者:茶棚小二 ? 2021-09-08 14:29 ? 次閱讀

簡(jiǎn)介: 童話之終局

很久以前,當(dāng)每個(gè)人都寫(xiě)單線程程序的時(shí)候,讓程序運(yùn)行得更快最有效的方法之一是坐下來(lái)袖手旁觀。下一代硬件和編譯器的優(yōu)化結(jié)果可以讓程序像以前一樣運(yùn)行,只是速度會(huì)更快。在這個(gè)童話般的年代,有一個(gè)判斷優(yōu)化是否有效的簡(jiǎn)單測(cè)試方法:如果程序員不能區(qū)分合法程序的未優(yōu)化執(zhí)行結(jié)果和優(yōu)化執(zhí)行的結(jié)果之間的區(qū)別(除了速度的區(qū)別),那么這個(gè)優(yōu)化就是有效的。也就是說(shuō),有效的優(yōu)化不會(huì)改變有效程序的行為。

幾年前, 某個(gè)悲傷的日子,硬件工程師發(fā)現(xiàn)讓單個(gè)處理器越來(lái)越快的魔法失效了。不過(guò),他們發(fā)現(xiàn)了一個(gè)新的魔法,可以讓他們創(chuàng)造出擁有越來(lái)越多處理器的計(jì)算機(jī),操作系統(tǒng)使用線程抽象模型向程序員展示了這種硬件并行能力。這種新的魔法——多處理器以操作系統(tǒng)線程的形式提供并行能力——對(duì)硬件工程師來(lái)說(shuō)效果更好,但它給編程語(yǔ)言設(shè)計(jì)者、編譯器作者和程序員帶來(lái)了嚴(yán)重的問(wèn)題。

許多在單線程程序中不可見(jiàn)(因此有效)的硬件和編譯器優(yōu)化會(huì)在多線程程序中產(chǎn)生明顯的結(jié)果變化。如果有效的優(yōu)化沒(méi)有改變有效程序的行為,那么這些優(yōu)化應(yīng)該被認(rèn)為是無(wú)效的?;蛘攥F(xiàn)有程序必須被聲明為無(wú)效的。到底是哪一個(gè),怎么判斷?

這里有一個(gè)類似C語(yǔ)言的簡(jiǎn)單示例程序。在這個(gè)程序和我們將要考慮的所有程序中,所有變量最初都設(shè)置為零。

1

2

3

// Thread 1 // Thread 2

x = 1; while(done == 0) { /* loop */ }

done = 1; print(x);

如果線程1和線程2都運(yùn)行在自己專用處理器上,都運(yùn)行到完成,這個(gè)程序能打印 0 嗎?

看情況(It depends)。這取決于硬件,也取決于編譯器。在x86多處理器上, 如果逐行翻譯成匯編的程序執(zhí)行的話總是會(huì)打印1。但是在ARM或POWER多處理器上,如果逐行翻譯成匯編的程序可以打印0。此外,無(wú)論底層硬件是什么,標(biāo)準(zhǔn)編譯器優(yōu)化都可能使該程序打印0或進(jìn)入無(wú)限循環(huán)。

“看情況”(It depends)并不是一個(gè)圓滿的結(jié)局。程序員需要一個(gè)明確的答案來(lái)判斷一個(gè)程序是否在新的硬件和新的編譯器上能夠正確運(yùn)行。硬件設(shè)計(jì)人員和編譯器開(kāi)發(fā)人員也需要一個(gè)明確的答案,說(shuō)明在執(zhí)行給定的程序時(shí),硬件和編譯后的代碼可以有多精確。因?yàn)檫@里的主要問(wèn)題是對(duì)存儲(chǔ)在內(nèi)存中數(shù)據(jù)更改的可見(jiàn)性和一致性,所以這個(gè)契約被稱為內(nèi)存一致性模型(memory consistency model)或僅僅是內(nèi)存模型(memory model)。

最初,內(nèi)存模型的目標(biāo)是定義程序員編寫(xiě)匯編代碼時(shí)硬件提供的保證。在該定義下,是不包含編譯器的內(nèi)容的。25年前,人們開(kāi)始嘗試寫(xiě)內(nèi)存模型 ,用來(lái)定義高級(jí)編程語(yǔ)言(如JavaC++)對(duì)用該語(yǔ)言編寫(xiě)代碼的程序員提供的保證。在模型中包含編譯器會(huì)使得定義一個(gè)合理模型的工作更加復(fù)雜。

這是關(guān)于硬件內(nèi)存模型和編程語(yǔ)言內(nèi)存模型的兩篇文章中的第一篇。我寫(xiě)這些文章的目的是先介紹一下背景,以便討論我們可能想要對(duì)Go的內(nèi)存模型進(jìn)行的改變。但是,要了解Go當(dāng)前狀況,我們可能想去哪里,首先我們必須了解其他硬件內(nèi)存模型和語(yǔ)言內(nèi)存模型的現(xiàn)狀,以及他們采取的道路。

還是那句話,這篇文章講的是硬件。假設(shè)我們正在為多處理器計(jì)算機(jī)編寫(xiě)匯編語(yǔ)言。程序員為了寫(xiě)出正確的程序,需要從計(jì)算機(jī)硬件上得到什么保證?四十多年來(lái),計(jì)算機(jī)科學(xué)家一直在尋找這個(gè)問(wèn)題的好答案。

順序一致性

Leslie Lamport 1979年的論文《How to Make a Multiprocessor Computer That Correctly Executes Multiprocess Programs》引入了順序一致性的概念:

The customary approach to designing and proving the correctness of multiprocess algorithms for such a computer assumes that the following condition is satisfied: the result of any execution is the same as if the operations of all the processors were executed in some sequential order, and the operations of each individual processor appear in this sequence in the order specified by its program. A multiprocessor satisfying this condition will be called sequentially consistent.

為這種計(jì)算機(jī)設(shè)計(jì)和證明多處理算法正確性的通常方法假定滿足下列條件:任何執(zhí)行的結(jié)果都是相同的,就好像所有處理器的操作都是按某種順序執(zhí)行的,每個(gè)處理器的操作都是按程序指定的順序出現(xiàn)的。滿足這一條件的多處理器系統(tǒng)將被稱為順序一致的。

今天,我們不僅討論計(jì)算機(jī)硬件,還討論保證順序一致性的編程語(yǔ)言,當(dāng)程序的唯一可能執(zhí)行對(duì)應(yīng)于某種線程操作交替成順序執(zhí)行時(shí)。順序一致性通常被認(rèn)為是理想的模型,是程序員最自然的工作模式。它允許您假設(shè)程序按照它們?cè)陧?yè)面上出現(xiàn)的順序執(zhí)行,并且單個(gè)線程的執(zhí)行只是以某種順序交替(interleaving),而不是以其他方式排列。

人們可能會(huì)有理由質(zhì)疑順序一致性是否應(yīng)該是理想的模型,但這超出了本文的范圍。我只注意到,考慮到所有可能的線程交替(interleaving)依然存在,就像在1979年一樣,即使過(guò)了四十幾年,Leslie Lamport的“設(shè)計(jì)和證明多處理算法正確性的慣用方法”,依然沒(méi)有什么能取代它。

之前我問(wèn)這個(gè)程序能不能打印0:

1

2

3

// Thread 1 // Thread 2

x = 1; while(done == 0) { /* loop */ }

done = 1; print(x);

為了讓程序更容易分析,讓我們?nèi)サ粞h(huán)和打印,并詢問(wèn)讀取共享變量的可能結(jié)果:

1

2

3

4

5

6

Litmus Test: Message Passing

Can this program see r1 = 1, r2 = 0?

// Thread 1 // Thread 2

x = 1 r1 = y

y = 1 r2 = x

我們假設(shè)每個(gè)例子都是所有共享變量最初都被設(shè)置為零。因?yàn)槲覀冊(cè)噲D確定硬件允許做什么,我們假設(shè)每個(gè)線程都在自己的專用處理器上執(zhí)行,并且沒(méi)有編譯器來(lái)對(duì)線程中發(fā)生的事情進(jìn)行重新排序:列表中的指令就是處理器執(zhí)行的指令。rN這個(gè)名字表示一個(gè)線程本地寄存器,而不是一個(gè)共享變量,我們會(huì)問(wèn)一個(gè)線程本地寄存器的值在執(zhí)行結(jié)束時(shí)是否存在某種可能。

這種關(guān)于樣本程序執(zhí)行結(jié)果的問(wèn)題被稱為litmus test。因?yàn)樗挥袃蓚€(gè)答案——這個(gè)結(jié)果可能還是不可能?——litmus test為我們提供了一種區(qū)分內(nèi)存模型的清晰方法:如果一個(gè)模型支持特定的執(zhí)行,而另一個(gè)不支持,那么這兩個(gè)模型顯然是不同的。不幸的是,正如我們將在后面看到的,一個(gè)特定的模型對(duì)一個(gè)特定的litmus test給出的答案往往令人驚訝。

If the execution of this litmus test is sequentially consistent, there are only six possible interleavings:

如果該litmus test的執(zhí)行順序一致,則只有六種可能的交替:

因?yàn)闆](méi)有交替執(zhí)行的結(jié)果會(huì)產(chǎn)生r1 = 1, r2 = 0,所以這個(gè)結(jié)果是不允許的。也就是說(shuō),在順序執(zhí)行的硬件上,litmus test執(zhí)行結(jié)果出現(xiàn)r1 = 1, r2 = 0是不可能的。

順序一致性的一個(gè)很好的思維模型是想象所有處理器直接連接到同一個(gè)共享內(nèi)存,它可以一次處理一個(gè)線程的讀或?qū)懻?qǐng)求。 不涉及緩存,因此每次處理器需要讀取或?qū)懭雰?nèi)存時(shí),該請(qǐng)求都會(huì)轉(zhuǎn)到共享內(nèi)存。 一次使用一次的共享內(nèi)存對(duì)所有內(nèi)存訪問(wèn)的執(zhí)行施加了順序順序:順序一致性。

(本文中三個(gè)內(nèi)存模型圖摘自 Maranget et al. “A Tutorial Introduction to the ARM and POWER Relaxed Memory Models.”)

上圖是順序一致機(jī)器的模型,而不是構(gòu)建機(jī)器的唯一方法。 實(shí)際上,可以使用多個(gè)共享內(nèi)存模塊和緩存來(lái)構(gòu)建順序一致的機(jī)器來(lái)幫助預(yù)測(cè)內(nèi)存獲取的結(jié)果,但順序一致意味著機(jī)器的行為必須與該模型并無(wú)二致。 如果我們只是想了解順序一致執(zhí)行意味著什么,我們可以忽略所有這些可能的實(shí)現(xiàn)復(fù)雜性并只考慮這個(gè)模型。

不幸的是,對(duì)于我們程序員,放棄嚴(yán)格的順序一致性可以讓硬件更快地執(zhí)行程序,所以所有現(xiàn)代硬件在各方面都會(huì)偏離了順序一致性。準(zhǔn)確定義具體的硬件偏離是相當(dāng)困難的。本文以當(dāng)今廣泛使用的硬件中的兩種內(nèi)存模型為例:x86ARM和POWER處理器系列。

x86 Total Store Order (x86-TSO)

現(xiàn)代x86系統(tǒng)的內(nèi)存模型對(duì)應(yīng)于以下硬件圖:

所有處理器仍然連接到一個(gè)共享內(nèi)存,但是每個(gè)處理器都將對(duì)該內(nèi)存的寫(xiě)入(write)放入到本地寫(xiě)入隊(duì)列中。處理器繼續(xù)執(zhí)行新指令,同時(shí)寫(xiě)操作(write)會(huì)更新到這個(gè)共享內(nèi)存。一個(gè)處理器上的內(nèi)存讀取在查詢主內(nèi)存之前會(huì)查詢本地寫(xiě)隊(duì)列,但它看不到其他處理器上的寫(xiě)隊(duì)列。其效果就是當(dāng)前處理器比其他處理器會(huì)先看到自己的寫(xiě)操作。但是——這一點(diǎn)非常重要——所有處理器都保證寫(xiě)入(存儲(chǔ)store)到共享內(nèi)存的(總)順序,所以給這個(gè)模型起了個(gè)名字:總存儲(chǔ)有序,或TSO。當(dāng)一個(gè)寫(xiě)操作到達(dá)共享內(nèi)存時(shí),任何處理器上的任何未來(lái)讀操作都將看到它并使用該值(直到它被以后的寫(xiě)操作覆蓋,或者可能被另一個(gè)處理器的緩沖寫(xiě)操作覆蓋)。

寫(xiě)隊(duì)列是一個(gè)標(biāo)準(zhǔn)的先進(jìn)先出隊(duì)列:內(nèi)存寫(xiě)操作以與處理器執(zhí)行相同的順序應(yīng)用于共享內(nèi)存。因?yàn)閷?xiě)入順序由寫(xiě)入隊(duì)列保留,并且由于其他處理器會(huì)立即看到對(duì)共享內(nèi)存的寫(xiě)入,所以我們之前考慮的通過(guò)litmus test的消息與之前具有相同的結(jié)果:r1 = 1,r2 = 0仍然是不可

Litmus Test: Message Passing

Can this program see r1 = 1, r2 = 0?

// Thread 1 // Thread 2

x = 1 r1 = y

y = 1 r2 = x

On sequentially consistent hardware: no.

On x86 (or other TSO): no.

寫(xiě)隊(duì)列保證線程1在y之前將x寫(xiě)入內(nèi)存,關(guān)于內(nèi)存寫(xiě)入順序(總存儲(chǔ)有序)的系統(tǒng)級(jí)協(xié)議保證線程2在讀y的新值之前讀x的新值。因此,r1 = yr2 = x看不到新的x之前不可能看到新的y。存儲(chǔ)順序至關(guān)重要:線程1在寫(xiě)入y之前先寫(xiě)入x,因此線程2在看到x的寫(xiě)入之前不可能看到y(tǒng)的寫(xiě)入。

在這種情況下,順序一致性和TSO模型是一致的,但是他們?cè)谄渌鹟itmus test的結(jié)果上并不一致。例如,這是區(qū)分兩種型號(hào)的常用示例:

1

2

3

4

5

6

7

8

Litmus Test: Write Queue (also called Store Buffer)

Can this program see r1 = 0, r2 = 0?

// Thread 1 // Thread 2

x = 1 y = 1

r1 = y r2 = x

On sequentially consistent hardware: no.

On x86 (or other TSO): yes!

在任何順序一致的執(zhí)行中,x = 1y = 1必須首先發(fā)生,然后另一個(gè)線程中的讀取必須能夠觀察到它(此賦值事件),因此r1 = 0,r2 = 0是不可能的。但是在一個(gè)TSO系統(tǒng)中,線程1和線程2可能會(huì)將它們的寫(xiě)操作排隊(duì),然后在任何一個(gè)寫(xiě)操作進(jìn)入內(nèi)存之前從內(nèi)存中讀取,這樣兩個(gè)讀操作都會(huì)看到零。

這個(gè)例子看起來(lái)可能是人為制造的,但是使用兩個(gè)同步變量確實(shí)發(fā)生在眾所周知的同步算法中,例如德克爾算法或彼得森算法,以及特定的方案。如果一個(gè)線程沒(méi)有看到另一個(gè)線程的所有寫(xiě)操作,線程就可能會(huì)中斷。

為了修復(fù)同步算法,我們需要依賴于更強(qiáng)的內(nèi)存排序,非順序一致的硬件提供了稱為內(nèi)存屏障(或柵欄)的顯式指令,可用于控制排序。我們可以添加一個(gè)內(nèi)存屏障,以確保每個(gè)線程在開(kāi)始讀取之前都會(huì)刷新其先前對(duì)內(nèi)存的寫(xiě)入:

1

2

3

4

// Thread 1 // Thread 2

x = 1 y = 1

barrier barrier

r1 = y r2 = x

加上正確的障礙,r1 = 0,r2 = 0也是不可能的,德克爾或彼得森的算法就可以正常工作了。內(nèi)存屏障有很多種;具體細(xì)節(jié)因系統(tǒng)而異,不在本文討論范圍之內(nèi)。關(guān)鍵是內(nèi)存屏障的存在給了程序員或語(yǔ)言實(shí)現(xiàn)者一種在程序的關(guān)鍵時(shí)刻強(qiáng)制順序一致行為的方法。

最后一個(gè)例子,說(shuō)明為什么這種模式被稱為總存儲(chǔ)有序。在該模型中,讀路徑上有本地寫(xiě)隊(duì)列,但沒(méi)有緩存。一旦一個(gè)寫(xiě)操作到達(dá)主存儲(chǔ)器,所有處理器不僅都認(rèn)同該值存在,而且還認(rèn)同它相對(duì)于來(lái)自其他處理器的寫(xiě)操作的先后順序??紤]一下這個(gè)litmus test:

1

2

3

4

5

6

7

8

9

Litmus Test: Independent Reads of Independent Writes (IRIW)

Can this program see r1 = 1, r2 = 0, r3 = 1, r4 = 0?

(Can Threads 3 and 4 see x and y change in different orders?)

// Thread 1 // Thread 2 // Thread 3 // Thread 4

x = 1 y = 1 r1 = x r3 = y

r2 = y r4 = x

On sequentially consistent hardware: no.

On x86 (or other TSO): no.

如果線程3看到x先于y變化,那么線程4能看到y(tǒng)先于x變化嗎?對(duì)于x86和其他TSO機(jī)器,答案是否定的:對(duì)主內(nèi)存的所有存儲(chǔ)(寫(xiě)入)都有一個(gè)總順序,所有處理器都認(rèn)同這個(gè)順序,只是每個(gè)處理器在到達(dá)主內(nèi)存之前都先知道自己的寫(xiě)入而已。

x86-TSO 之路

x86-TSO模型看起來(lái)相當(dāng)整潔,但是這條道路充滿了路障和錯(cuò)誤的彎道。在20世紀(jì)90年代,第一批x86多處理器可用的手冊(cè)幾乎沒(méi)有提到硬件提供的內(nèi)存模型。

作為問(wèn)題困擾的一個(gè)例子,Plan 9 是第一個(gè)在x86上運(yùn)行的真正多處理器操作系統(tǒng)(沒(méi)有全局內(nèi)核鎖)。1997年,在移植到多處理器 奔騰Pro的過(guò)程中,開(kāi)發(fā)人員被寫(xiě)隊(duì)列l(wèi)itmus test的不期望的行為所困擾。一小段同步代碼假設(shè)r1 = 0,r2 = 0是不可能的,但它確實(shí)發(fā)生了。更糟糕的是,英特爾手冊(cè)對(duì)內(nèi)存模型的細(xì)節(jié)模糊不清。

針對(duì)郵件列表中提出的“使用鎖最好保守一點(diǎn),不要相信硬件設(shè)計(jì)師會(huì)做我們期望的事情”的建議,Plan 9的一名開(kāi)發(fā)人員很好地解釋了這個(gè)問(wèn)題:

我當(dāng)然同意。我們會(huì)在多處理器中遇到更寬松的順序(relaxed ordering )。問(wèn)題是,硬件設(shè)計(jì)者認(rèn)為什么是保守的?在臨界區(qū)的開(kāi)頭和結(jié)尾強(qiáng)制互鎖對(duì)我來(lái)說(shuō)似乎相當(dāng)保守,但我顯然不夠富有想象力。奔騰Pro的手冊(cè)在描述緩存和怎么使它們保持一致時(shí)非常詳細(xì),但似乎不在乎說(shuō)任何關(guān)于執(zhí)行或read順序的細(xì)節(jié)。事實(shí)是,我們無(wú)法知道自己是否足夠保守。

在討論過(guò)程中,英特爾的一名架構(gòu)師對(duì)內(nèi)存模型做了非正式的解釋,指出理論上,即使是多處理器486和奔騰系統(tǒng)也可能產(chǎn)生r1 = 0,r2 = 0的結(jié)果,并且奔騰Pro只是具有更大的流水線和寫(xiě)隊(duì)列,所以會(huì)更頻繁地暴露了這種行為。

這位英特爾架構(gòu)師還寫(xiě)道:

Loosely speaking, this means the ordering of events originating from any one processor in the system, as observed by other processors, is always the same. However, different observers are allowed to disagree on the interleaving of events from two or more processors.
Future Intel processors will implement the same memory ordering model.

粗略地說(shuō),這意味著從系統(tǒng)中任何一個(gè)處理器產(chǎn)生的事件的順序,正如其他處理器所觀察到的,總是相同的。然而,允許不同的觀察者對(duì)來(lái)自兩個(gè)或更多處理器的事件的交替有不同的觀察結(jié)果。
未來(lái)的英特爾處理器將采用相同的內(nèi)存順序模式。

聲稱“允許不同的觀察者對(duì)來(lái)自兩個(gè)或更多處理器的事件的交替有不同的觀察結(jié)果”是在說(shuō),IRIW litmus test的答案在x86上可以回答“是”,盡管在前面的部分我們看到x86回答“否”。這怎么可能呢?

答案似乎是,英特爾處理器實(shí)際上從未對(duì)這一litmus test做出“是”的回答,但當(dāng)時(shí)英特爾架構(gòu)人員不愿意為未來(lái)的處理器做出任何保證。體系結(jié)構(gòu)手冊(cè)中存在的少量文本幾乎沒(méi)有任何保證,使得很難針對(duì)它們進(jìn)行編程。

Plan 9的討論不是一個(gè)孤立的事件。從11月下旬開(kāi)始,Linux內(nèi)核開(kāi)發(fā)人員在他們的郵件列表上討論了100多條消息。

在接下來(lái)的十年里,越來(lái)越多的人遇到了這些困難,為此,英特爾的一組架構(gòu)師承擔(dān)了為當(dāng)前和未來(lái)的處理器寫(xiě)下有用的處理器行為保證的任務(wù)。第一個(gè)結(jié)果是2007年8月出版的Intel 64 Architecture Memory Ordering White Paper,旨在為“軟件作者提供對(duì)不同順序的內(nèi)存訪問(wèn)指令可能產(chǎn)生的結(jié)果的清晰理解”。同年晚些時(shí)候,AMD在AMD64 Architecture Programmer's Manual revision 3.14中發(fā)布了類似的描述。這些描述基于一個(gè)被稱為“總鎖序+因果一致性”(TLO+CC)的模型,故意弱于TSO。在公開(kāi)訪談中,英特爾架構(gòu)師表示,TLO+CC“像要求的那樣強(qiáng)大,但并不足夠強(qiáng)大。”特別是,該模型保留了x86處理器在IRIW litmus test中回答“是”的權(quán)利。不幸的是,內(nèi)存屏障的定義不夠強(qiáng)大,不足以重建順序一致的內(nèi)存語(yǔ)義,即使每個(gè)指令之后都有一個(gè)屏障。更糟糕的是,研究人員觀察到實(shí)際的英特爾x86硬件違反了TLO+CC模型。例如:

1

2

3

4

5

6

7

8

9

10

11

Litmus Test: n6 (Paul Loewenstein)

Can this program end with r1 = 1, r2 = 0, x = 1?

// Thread 1 // Thread 2

x = 1 y = 1

r1 = x x = 2

r2 = y

On sequentially consistent hardware: no.

On x86 TLO+CC model (2007): no.

On actual x86 hardware: yes!

On x86 TSO model: yes! (Example from x86-TSO paper.)

2008年晚些時(shí)候?qū)τ⑻貭柡虯MD規(guī)范的修訂保證了IRIW case的“不”,并加強(qiáng)了內(nèi)存屏障,但仍允許不可預(yù)期的行為,這些行為似乎不會(huì)出現(xiàn)在任何合理的硬件上。例如:

1

2

3

4

5

6

7

8

9

10

Litmus Test: n5

Can this program end with r1 = 2, r2 = 1?

// Thread 1 // Thread 2

x = 1 x = 2

r1 = x r2 = x

On sequentially consistent hardware: no.

On x86 specification (2008): yes!

On actual x86 hardware: no.

On x86 TSO model: no. (Example from x86-TSO paper.)

為了解決這些問(wèn)題,歐文斯等人在早期SPARCv8 TSO模型的基礎(chǔ)上提出了x86-TSO模型提案。當(dāng)時(shí),他們聲稱“據(jù)我們所知,x86-TSO是可靠的,足夠強(qiáng)大,可以在上面編程,并且大致符合供應(yīng)商的意圖?!皫讉€(gè)月后,英特爾和AMD發(fā)布了廣泛采用這一模式的的新手冊(cè)。

似乎所有英特爾處理器從一開(kāi)始就實(shí)現(xiàn)了x86-TSO,盡管英特爾花了十年時(shí)間才決定致力于此?;叵肫饋?lái),很明顯,英特爾和AMD的設(shè)計(jì)師們正在努力解決如何編寫(xiě)一個(gè)能夠?yàn)槲磥?lái)處理器優(yōu)化留出空間的內(nèi)存模型,同時(shí)仍然為編譯器作者和匯編語(yǔ)言程序設(shè)計(jì)者提供有用的保證?!坝卸鄰?qiáng)就有多強(qiáng),但沒(méi)有多強(qiáng)”是一個(gè)艱難的平衡動(dòng)作。

ARM/POWER Relaxed Memory Model

現(xiàn)在讓我們來(lái)看看一個(gè)更寬松的內(nèi)存模型,在ARM和POWER處理器上找到的那個(gè)。在實(shí)現(xiàn)層面上,這兩個(gè)系統(tǒng)在許多方面有所不同,但保證內(nèi)存一致性的模型大致相似,比x86-TSO甚至x86-TLO+CC稍弱。

ARM和POWER系統(tǒng)的概念模型是,每個(gè)處理器從其自己的完整內(nèi)存副本中讀取和向其寫(xiě)入,每個(gè)寫(xiě)入獨(dú)立地傳播到其他處理器,隨著寫(xiě)入的傳播,允許重新排序。

這里沒(méi)有總存儲(chǔ)順序。雖然沒(méi)有描述,但是每個(gè)處理器都被允許推遲讀取(read),直到它等到它需要結(jié)果:讀取(read)可以被延遲到稍后的寫(xiě)入(write)之后。在這個(gè)寬松的(relaxed)模型中,我們迄今為止所看到的每一個(gè)litmus test的答案都是“yes,這真的可能發(fā)生。”

對(duì)于通過(guò)litmus test的原始消息,單個(gè)處理器對(duì)寫(xiě)入的重新排序意味著線程1的寫(xiě)入可能不會(huì)被其他線程以相同的順序觀察到:

1

2

3

4

5

6

7

8

9

Litmus Test: Message Passing

Can this program see r1 = 1, r2 = 0?

// Thread 1 // Thread 2

x = 1 r1 = y

y = 1 r2 = x

On sequentially consistent hardware: no.

On x86 (or other TSO): no.

On ARM/POWER: yes!

在ARM/POWER模型中,我們可以想象線程1和線程2都有各自獨(dú)立的內(nèi)存副本,寫(xiě)操作以任何順序在內(nèi)存之間傳播。如果線程1的內(nèi)存在發(fā)送x的更新(update)之前向線程2發(fā)送y的更新,并且如果線程2在這兩次更新之間執(zhí)行,它將確實(shí)看到結(jié)果r1 = 1,r2 = 0

該結(jié)果表明,ARM/POWER內(nèi)存模型比TSO更弱:對(duì)硬件的要求更低。ARM/POWER模型仍然承認(rèn)TSO所做的各種重組:

1

2

3

4

5

6

7

8

9

Litmus Test: Store Buffering

Can this program see r1 = 0, r2 = 0?

// Thread 1 // Thread 2

x = 1 y = 1

r1 = y r2 = x

On sequentially consistent hardware: no.

On x86 (or other TSO): yes!

On ARM/POWER: yes!

在ARM/POWER上,對(duì)x和y的寫(xiě)入(write)可能會(huì)寫(xiě)入本地存儲(chǔ)器,但當(dāng)讀取發(fā)生在相反的線程上時(shí),寫(xiě)入可能尚未傳播開(kāi)來(lái)。

下面是一個(gè)litmus test,它展示了x86擁有總存儲(chǔ)順序意味著什么:

1

2

3

4

5

6

7

8

9

10

Litmus Test: Independent Reads of Independent Writes (IRIW)

Can this program see r1 = 1, r2 = 0, r3 = 1, r4 = 0?

(Can Threads 3 and 4 see x and y change in different orders?)

// Thread 1 // Thread 2 // Thread 3 // Thread 4

x = 1 y = 1 r1 = x r3 = y

r2 = y r4 = x

On sequentially consistent hardware: no.

On x86 (or other TSO): no.

On ARM/POWER: yes!

在ARM/POWER上,不同的線程可能以不同的順序觀察到不同的寫(xiě)操作。它們不能保證對(duì)到達(dá)主內(nèi)存的總寫(xiě)入順序達(dá)成一致的觀察效果,因此線程3可以在y變化之前之前看到x的變化,而線程4可以在x變化之前看到y(tǒng)的變化。

作為另一個(gè)例子,ARM/POWER系統(tǒng)具有內(nèi)存讀取(負(fù)載 load)的可見(jiàn)緩沖或重新排序,如下面litmus test所示:

1

2

3

4

5

6

7

8

9

10

Litmus Test: Load Buffering

Can this program see r1 = 1, r2 = 1?

(Can each thread's read happen after the other thread's write?)

// Thread 1 // Thread 2

r1 = x r2 = y

y = 1 x = 1

On sequentially consistent hardware: no.

On x86 (or other TSO): no.

On ARM/POWER: yes!

任何順序一致的交替必須從線程1的r1 = x或線程2的r2 = y開(kāi)始,該讀取必須看到一個(gè)0,使得結(jié)果r1 = 1,r2 = 1不可能。然而,在ARM/POWER存儲(chǔ)器模型中,處理器被允許延遲讀取,直到指令流中稍后的寫(xiě)入之后,因此y = 1和x = 1在兩次讀取之前執(zhí)行。

盡管ARM和POWER內(nèi)存模型都允許這一結(jié)果,但Maranget等人(2012年)報(bào)告說(shuō),只能在ARM系統(tǒng)上憑經(jīng)驗(yàn)重現(xiàn),而不能在POWER上復(fù)制。在這里,模型和真實(shí)度之間的差異開(kāi)始發(fā)揮作用,就像我們?cè)跈z查英特爾x86時(shí)一樣:硬件實(shí)現(xiàn)比技術(shù)保證更強(qiáng)大的模型會(huì)鼓勵(lì)對(duì)更強(qiáng)的行為的依賴,這意味著未來(lái)更弱的硬件將破壞程序,無(wú)論是否有效。

像TSO系統(tǒng)上一樣,ARM和POWER也有內(nèi)存屏障,我們可以在上面的例子中插入這些內(nèi)存屏障,以強(qiáng)制順序一致的行為。但顯而易見(jiàn)的問(wèn)題是,沒(méi)有內(nèi)存屏障的ARM/POWER是否完全排除了任何行為。任何litmus test的答案是否都是“no,那不可能發(fā)生?” 當(dāng)我們專注于一個(gè)單一的內(nèi)存位置時(shí),它可以。

這里有一個(gè)litmus test,它可以測(cè)試即使在ARM和POWER上也不會(huì)發(fā)生的事情:

1

2

3

4

5

6

7

8

9

10

Litmus Test: Coherence

Can this program see r1 = 1, r2 = 2, r3 = 2, r4 = 1?

(Can Thread 3 see x = 1 before x = 2 while Thread 4 sees the reverse?)

// Thread 1 // Thread 2 // Thread 3 // Thread 4

x = 1 x = 2 r1 = x r3 = x

r2 = x r4 = x

On sequentially consistent hardware: no.

On x86 (or other TSO): no.

On ARM/POWER: no.

這個(gè)litmus test與前一個(gè)測(cè)試類似,但是現(xiàn)在兩個(gè)線程都在寫(xiě)入單個(gè)變量x,而不是兩個(gè)不同的變量x和y。線程1和2將沖突的值1和2都寫(xiě)入x,而線程3和線程4都讀取x兩次。如果線程3看到x = 1被x = 2覆蓋,那么線程4能看到相反的情況嗎?

答案是no的,即使在ARM/POWER上也是如此:系統(tǒng)中的線程必須就寫(xiě)入單個(gè)內(nèi)存位置的總順序達(dá)成一致。也就是說(shuō),線程必須同意哪些寫(xiě)入會(huì)覆蓋其他寫(xiě)入。這個(gè)性質(zhì)叫做相干性。如果沒(méi)有一致性屬性,處理器要么不同意內(nèi)存的最終結(jié)果,要么報(bào)告內(nèi)存位置從一個(gè)值翻轉(zhuǎn)到另一個(gè)值,然后又回到第一個(gè)值。編寫(xiě)這樣一個(gè)系統(tǒng)是非常困難的。

我故意忽略了ARM和POWER弱內(nèi)存模型中的許多微妙之處。更多詳細(xì)信息,請(qǐng)參閱彼得·蘇厄爾關(guān)于該主題的論文。有兩個(gè)要點(diǎn)要記住。首先,這里有令人難以置信的微妙之處,這是由有非常持久力、非常聰明的人進(jìn)行了十多年學(xué)術(shù)研究的主題。我自己并不聲稱完全理解。這不是我們應(yīng)該希望向普通程序設(shè)計(jì)人員解釋的事情,也不是我們?cè)谡{(diào)試普通程序時(shí)希望能夠堅(jiān)持的事情。第二,允許和觀察到的結(jié)果之間的差距造成了不幸的未來(lái)驚喜。如果當(dāng)前的硬件沒(méi)有展現(xiàn)出所有允許的行為——尤其是當(dāng)首先很難推理出什么是允許的時(shí)候!—那么不可避免地會(huì)編寫(xiě)一些程序,這些程序會(huì)偶然地依賴于實(shí)際硬件的更受限制的行為。如果一個(gè)新的芯片在行為上受到的限制更少,那么硬件內(nèi)存模型在技術(shù)上允許破壞程序的新行為——也就是說(shuō),這個(gè)錯(cuò)誤在技術(shù)上是你的錯(cuò)——這一事實(shí)并不能給你帶來(lái)什么安慰。這不是寫(xiě)程序的方法。

弱排序和無(wú)數(shù)據(jù)競(jìng)爭(zhēng)的順序一致性

到目前為止,我希望您確信硬件細(xì)節(jié)是復(fù)雜而微妙的,而不是您每次編寫(xiě)程序時(shí)都想解決的問(wèn)題。 相反,它有助于識(shí)別“如果你遵循這些簡(jiǎn)單的規(guī)則,你的程序只會(huì)產(chǎn)生結(jié)果,就像通過(guò)一些順序一致的執(zhí)行的那樣?!?(我們?nèi)栽谡務(wù)撚布晕覀內(nèi)栽谡務(wù)摻惶妾?dú)立的匯編指令。)

Sarita Adve and Mark Hill proposed exactly this approach in their 1990 paper “Weak Ordering – A New Definition”. They defined “weakly ordered” as follows.

Sarita Adve和Mark Hill在他們1990年的論文“Weak Ordering – A New Definition”中正是提出了這種方法。他們把“弱有序”定義為如下。

Let a synchronization model be a set of constraints on memory accesses that specify how and when synchronization needs to be done.

同步模型是對(duì)內(nèi)存訪問(wèn)的一組約束,這些約束指定了何時(shí)以及如何進(jìn)行同步。

硬件相對(duì)于同步模型是弱有序的,當(dāng)且僅當(dāng)它在順序上與遵守同步模型的所有軟件一致時(shí)。

雖然他們的論文是關(guān)于捕捉當(dāng)時(shí)的硬件設(shè)計(jì)(不是x86、ARM和POWER),但將討論提升到特定設(shè)計(jì)之上的想法使論文與今天的討論依然相關(guān)。

我之前說(shuō)過(guò)“有效的優(yōu)化不會(huì)改變有效程序的行為?!边@些規(guī)則定義了什么是有效的手段,然后任何硬件優(yōu)化都必須讓這些程序像在順序一致的機(jī)器上一樣工作。當(dāng)然,有趣的細(xì)節(jié)是規(guī)則本身,定義程序有效的約束。

Adve和Hill提出了一種同步模型,他們稱之為無(wú)數(shù)據(jù)競(jìng)爭(zhēng)(data-race-free,DRF)。該模型假設(shè)硬件具有獨(dú)立于普通內(nèi)存讀寫(xiě)的內(nèi)存同步操作。普通的內(nèi)存讀寫(xiě)可以在同步操作之間重新排序,但不能在跨它們移動(dòng)。(也就是說(shuō),同步操作也可用來(lái)做重新排序的內(nèi)存屏障。)如果對(duì)于所有理想化的順序一致的執(zhí)行,從不同線程對(duì)同一位置的任何兩個(gè)普通存儲(chǔ)器訪問(wèn)要么都是讀取,要么通過(guò)同步操作強(qiáng)制一個(gè)在另一個(gè)之前發(fā)生而分開(kāi)執(zhí)行,則程序被稱為無(wú)數(shù)據(jù)競(jìng)爭(zhēng)的。
我們來(lái)看一些例子,摘自Adve和Hill的論文(為了演示而重新繪制)。這里有一個(gè)線程執(zhí)行變量x的寫(xiě)操作,然后讀取同一個(gè)變量。


垂直箭頭標(biāo)記了單個(gè)線程內(nèi)的執(zhí)行順序:先寫(xiě)后讀。這個(gè)程序沒(méi)有競(jìng)爭(zhēng),因?yàn)橐磺卸荚谝粋€(gè)線程中。

相比之下,在這個(gè)雙線程程序中有一個(gè)競(jìng)爭(zhēng):

這里線程2在不與線程1協(xié)調(diào)的情況下寫(xiě)入x。線程2的寫(xiě)入與線程1的寫(xiě)入和讀取競(jìng)爭(zhēng)。如果線程2讀x而不是寫(xiě)x,程序在線程1寫(xiě)和線程2讀之間只有一個(gè)競(jìng)爭(zhēng)。每個(gè)競(jìng)爭(zhēng)至少涉及一次寫(xiě)入:兩次不協(xié)調(diào)的讀取不會(huì)相互競(jìng)爭(zhēng)。

為了避免競(jìng)爭(zhēng),我們必須添加同步操作,這將在共享一個(gè)同步變量的不同線程上的操作之間強(qiáng)制一個(gè)特定的順序。如果同步S(a)(在變量a上同步,用虛線箭頭標(biāo)記)迫使線程2的寫(xiě)操作在線程1完成后發(fā)生,則競(jìng)爭(zhēng)被消除-

現(xiàn)在線程2的寫(xiě)操作不能與線程1的操作同時(shí)發(fā)生。

如果線程2只是讀取,我們只需要與線程1的寫(xiě)入同步。兩次讀取仍然可以同時(shí)進(jìn)行:

線程可以按同步順序排序,甚至可以使用中間線程。這個(gè)程序沒(méi)有競(jìng)爭(zhēng):

另一方面,同步變量的使用本身并不能消除競(jìng)爭(zhēng):錯(cuò)誤地使用它們是可能的。下面這個(gè)程序有一個(gè)競(jìng)爭(zhēng):

線程2的讀取與其他線程中的寫(xiě)入完全同步——這肯定發(fā)生在兩者之后——但是這兩個(gè)寫(xiě)入本身并不同步。這個(gè)程序并不是data-race-free。

Adve和Hill將弱排序描述為“軟件和硬件之間的契約”,具體來(lái)說(shuō),如果軟件避免了數(shù)據(jù)競(jìng)爭(zhēng),那么硬件就好像是順序一致的,這比我們?cè)谇懊娌糠盅芯康哪P透菀淄评?。但是硬件如何滿足它的契約呢?

Adve和Hill給出了硬件“遵循DRF弱排序”的證明,這意味著它執(zhí)行無(wú)數(shù)據(jù)競(jìng)爭(zhēng)的程序,就好像是按照順序一致的順序一樣,只要它滿足一組特定的最低要求。我不打算詳談細(xì)節(jié),但重點(diǎn)是在Adve和Hill的論文發(fā)表后,硬件設(shè)計(jì)師們有了一份由理論支持的手冊(cè):做這些事情,你就可以斷言你的硬件將與data-race-free程序順序一致。事實(shí)上,假設(shè)同步操作的適當(dāng)實(shí)現(xiàn),大多數(shù)寬松的硬件確實(shí)是這樣做的,并且一直在繼續(xù)這樣做。Adve和Hill最初關(guān)注的是VAX,但x86、ARM和POWER肯定也能滿足這些限制。這種系統(tǒng)保證無(wú)數(shù)據(jù)競(jìng)爭(zhēng)程序的順序一致性的觀點(diǎn)通常被縮寫(xiě)為DRF-SC。

DRF-SC標(biāo)志著硬件內(nèi)存模型的一個(gè)轉(zhuǎn)折點(diǎn),為硬件設(shè)計(jì)者和軟件作者提供了一個(gè)清晰的策略,至少是那些用匯編語(yǔ)言編寫(xiě)軟件的人。正如我們將在下一篇文章中看到的,高級(jí)編程語(yǔ)言的內(nèi)存模型問(wèn)題沒(méi)有一個(gè)整潔的答案。

本文轉(zhuǎn)自:https://colobu.com/2021/06/30/hwmm/

審核編輯:符乾江

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    8

    文章

    3025

    瀏覽量

    74060
  • 硬件
    +關(guān)注

    關(guān)注

    11

    文章

    3328

    瀏覽量

    66228
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    拋棄8GB內(nèi)存,端側(cè)AI大模型加速內(nèi)存升級(jí)

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)端側(cè)AI大模型的到來(lái)在存儲(chǔ)市場(chǎng)產(chǎn)生了最直接的反應(yīng)。年初在我們對(duì)旗艦智能手機(jī)的存儲(chǔ)容量統(tǒng)計(jì)中,16GB內(nèi)存+512GB存儲(chǔ)成為幾乎所有旗艦機(jī)型都提供的選擇。畢竟AI大模型
    的頭像 發(fā)表于 11-03 00:02 ?4335次閱讀
    拋棄8GB<b class='flag-5'>內(nèi)存</b>,端側(cè)AI大<b class='flag-5'>模型</b>加速<b class='flag-5'>內(nèi)存</b>升級(jí)

    【「大模型啟示錄」閱讀體驗(yàn)】對(duì)大模型更深入的認(rèn)知

    ,大模型的世界遠(yuǎn)比我想象的要復(fù)雜和深刻。 書(shū)中不僅詳細(xì)介紹了大模型的構(gòu)建過(guò)程,還探討了它們的核心能力和所需的基礎(chǔ)設(shè)施。我特別喜歡的是,書(shū)中用通俗易懂的語(yǔ)言,把大
    發(fā)表于 12-20 15:46

    DMA是什么?詳細(xì)介紹

    DMA(Direct Memory Access)是一種允許某些硬件子系統(tǒng)直接訪問(wèn)系統(tǒng)內(nèi)存的技術(shù),而無(wú)需中央處理單元(CPU)的介入。這種技術(shù)可以顯著提高數(shù)據(jù)傳輸速率,減輕CPU的負(fù)擔(dān),并提高整體
    的頭像 發(fā)表于 11-11 10:49 ?5700次閱讀

    Windows管理內(nèi)存的三種主要方式

    Windows操作系統(tǒng)提供了多種方式來(lái)管理內(nèi)存,以確保系統(tǒng)資源的有效利用和性能的優(yōu)化。以下是關(guān)于Windows管理內(nèi)存的三種主要方式的詳細(xì)闡述,包括堆內(nèi)存管理、虛擬
    的頭像 發(fā)表于 10-12 17:09 ?800次閱讀

    反射內(nèi)存卡工作環(huán)境介紹

    電子發(fā)燒友網(wǎng)站提供《反射內(nèi)存卡工作環(huán)境介紹.docx》資料免費(fèi)下載
    發(fā)表于 09-14 09:17 ?0次下載

    內(nèi)存的分類有哪些

    內(nèi)存作為計(jì)算機(jī)系統(tǒng)中至關(guān)重要的組成部分,其分類可以從多個(gè)維度進(jìn)行闡述。以下將從主要類型、技術(shù)特性、應(yīng)用場(chǎng)景等多個(gè)方面詳細(xì)介紹內(nèi)存的分類,力求全面且深入地解析這一話題。
    的頭像 發(fā)表于 09-10 14:20 ?926次閱讀

    內(nèi)存管理的硬件結(jié)構(gòu)

    常見(jiàn)的內(nèi)存分配函數(shù)有malloc,mmap等,但大家有沒(méi)有想過(guò),這些函數(shù)在內(nèi)核中是怎么實(shí)現(xiàn)的?換句話說(shuō),Linux內(nèi)核的內(nèi)存管理是怎么實(shí)現(xiàn)的?
    的頭像 發(fā)表于 09-04 14:28 ?320次閱讀
    <b class='flag-5'>內(nèi)存</b>管理的<b class='flag-5'>硬件</b>結(jié)構(gòu)

    影響內(nèi)存延遲的因素有哪些

    內(nèi)存延遲是指等待對(duì)系統(tǒng)內(nèi)存中存儲(chǔ)數(shù)據(jù)的訪問(wèn)完成時(shí)引起的延期,它是衡量內(nèi)存響應(yīng)速度的重要指標(biāo)。影響內(nèi)存延遲的因素眾多,主要包括硬件因素和軟件因
    的頭像 發(fā)表于 09-04 11:46 ?1546次閱讀

    內(nèi)存時(shí)鐘是什么意思

    內(nèi)存時(shí)鐘是內(nèi)存模塊中一個(gè)至關(guān)重要的參數(shù),它直接關(guān)聯(lián)到內(nèi)存模塊能夠工作的最高頻率。以下是對(duì)內(nèi)存時(shí)鐘的詳細(xì)解析,包括其定義、作用、與
    的頭像 發(fā)表于 09-04 11:45 ?1242次閱讀

    智能硬件接入主流大模型做語(yǔ)音交互(附文心一言、豆包、kimi、智譜glm、通義千問(wèn)示例)

    本帖最后由 jf_40317719 于 2024-8-21 19:17 編輯 多模態(tài)交互離不開(kāi)硬件載體,近期有不少開(kāi)發(fā)者在研究聆思CSK6大模型開(kāi)發(fā)板除了使用出廠示例自帶的星火大模型,能不能
    發(fā)表于 08-21 19:13

    經(jīng)典卷積網(wǎng)絡(luò)模型介紹

    經(jīng)典卷積網(wǎng)絡(luò)模型在深度學(xué)習(xí)領(lǐng)域,尤其是在計(jì)算機(jī)視覺(jué)任務(wù)中,扮演著舉足輕重的角色。這些模型通過(guò)不斷演進(jìn)和創(chuàng)新,推動(dòng)了圖像處理、目標(biāo)檢測(cè)、圖像生成、語(yǔ)義分割等多個(gè)領(lǐng)域的發(fā)展。以下將詳細(xì)探討幾個(gè)經(jīng)典的卷積
    的頭像 發(fā)表于 07-11 11:45 ?523次閱讀

    聆思CSK6視覺(jué)語(yǔ)音大模型AI開(kāi)發(fā)板入門資源合集(硬件資料、大模型語(yǔ)音/多模態(tài)交互/英語(yǔ)評(píng)測(cè)SDK合集)

    =nTn9kMMCU 附件中有更詳細(xì)的軟硬件詳細(xì)資料和資源下載信息,可以按需下載。 后續(xù)會(huì)持續(xù)發(fā)布進(jìn)階資源,歡迎保持關(guān)注! 遇到問(wèn)題可以發(fā)在評(píng)論區(qū)一起討論! 【大模型開(kāi)發(fā)板使用示例
    發(fā)表于 06-18 17:33

    寄存器和內(nèi)存的區(qū)別

    在計(jì)算機(jī)體系結(jié)構(gòu)中,寄存器和內(nèi)存是兩個(gè)至關(guān)重要的組成部分。它們各自承擔(dān)著不同的角色,共同確保計(jì)算機(jī)系統(tǒng)的正常運(yùn)行。本文將對(duì)寄存器和內(nèi)存進(jìn)行詳細(xì)介紹,包括它們的定義、功能以及二者之間的
    的頭像 發(fā)表于 05-12 17:11 ?2302次閱讀

    物理內(nèi)存模型的演變

    內(nèi)存管理概述中,主要是以Linux v2.6.11為例進(jìn)行分析的,但是計(jì)算技術(shù)在不斷發(fā)展,新的存儲(chǔ)架構(gòu)、新的指令集架構(gòu)、新的SoC架構(gòu)等都對(duì)物理內(nèi)存模型的抽象提出了更高要求。為此,必須抽象一種完全獨(dú)立于
    的頭像 發(fā)表于 02-25 10:35 ?473次閱讀

    系統(tǒng)內(nèi)存和運(yùn)行內(nèi)存的區(qū)別

    系統(tǒng)內(nèi)存和運(yùn)行內(nèi)存都是計(jì)算機(jī)中重要的概念,它們?cè)谟?jì)算機(jī)的存儲(chǔ)和運(yùn)行方面起著不可或缺的作用。雖然它們與計(jì)算機(jī)存儲(chǔ)和運(yùn)行息息相關(guān),但是它們具有不同的功能和實(shí)現(xiàn)方式。接下來(lái)我將詳細(xì)介紹系統(tǒng)
    的頭像 發(fā)表于 01-15 16:32 ?3382次閱讀