0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Cache映射是硬件層面物理塊與物理塊之間建立的聯(lián)系

SSDFans ? 來源:未知 ? 作者:李倩 ? 2018-08-20 15:27 ? 次閱讀

理解Cache地址映射之前補充一些基礎知識,Cache的地址映射和MMU(內(nèi)存管理單元)和TLB Cache(轉譯查找緩存)中的映射是有區(qū)別的。Cache、TLB Cache、MMU在CPU中結構如圖1所示,圖1展現(xiàn)的是Cortex A9 Processor內(nèi)部結構,采用的指令和數(shù)據(jù)總線分開的哈佛結構。

CPU訪問內(nèi)部存儲和外部存儲,以及各種外設空間在硬件層面上看都是物理地址(硬件總線),然后為了滿足多進程脆弱的軟件系統(tǒng)提出了虛擬地址,虛擬地址是針對應用程序所提出的概念,MMU負責虛擬地址到物理地址的映射工作,從虛擬地址到物理地址的轉換過程可知:頁表存儲在內(nèi)存中,使用一級頁表進行地址轉換時,每次讀/寫數(shù)據(jù)需要訪問兩次內(nèi)存,第一次訪問一級頁表獲得物理地址,第二次才是真正的讀/寫數(shù)據(jù);使用兩級頁表時,每次讀/寫數(shù)據(jù)需要訪問三次內(nèi)存,訪問兩次頁表(一級頁表和二級頁表)獲得物理地址,第三次才是真正的讀/寫數(shù)據(jù),由于這種機制速率很慢,才提出TLB Cache用于存儲近期用到的頁表條目(段/大頁/小頁/極小頁描述符。

TLB Cache是一個內(nèi)存管理單元用于改進虛擬地址到物理地址轉換速度的高速緩存,位于MMU中,本文章不深入分析MMU和TLB。Cache映射是硬件層面物理塊與物理塊之間建立的聯(lián)系。

圖 1

Cache的容量一般都很小,即使是最大的三級Cache(L3)也只有20MB~30MB。而當今內(nèi)存的容量都是以GB作為單位,CPU對存儲器的訪問,通常是一次讀寫一個字單元。當CPU訪Cache不命中時,需將存儲在主存中的字單元連同其后若干個字一同調入Cache中,之所以這樣做(write-back策略才會有這種機制),是為了使其后的訪存能在Cache中命中。因此,主存和Cache之間一次交換的數(shù)據(jù)單位應該是一個數(shù)據(jù)塊(以前文章中提到的cache line,一般大小為64 Byte)。數(shù)據(jù)塊的大小是固定的,由若干個字組成,且主存和Cache的數(shù)據(jù)塊大小是相同的。

從Cache-主存模型來看,一方面既要使CPU的訪存速度接近于訪Cache的速度,另一方面為用戶程序提供的運行空間應保持為主存容量大小的存儲空間。在采Cache-主存層次的系統(tǒng)中,Cache對用戶程序而言是透明的,也就是說,用戶程序可以不需要知道Cache的存在。因此,CPU每次訪存時,依然和未使用Cache的情況一樣,給出的是一個主存地址。但在Cache-主存層次中,CPU首先訪問的是Cache,并不是主存。為此,需要一種機制將CPU的訪主存地址轉換成訪Cache地址。而主存地址與Cache地址之間的轉換是與主存塊與Cache塊之間的映射關系緊密聯(lián)系的。如何把內(nèi)存中的內(nèi)容存放到Cache中去,這就需要一個映射算法和一個分塊機制。

分塊機制就是說,Cache和內(nèi)存以塊為單位進行數(shù)據(jù)交換,塊的大小通常以在內(nèi)存的一個存儲周期中能夠訪問到的數(shù)據(jù)長度為限。當今主流塊的大小都是64字節(jié),因此一個Cache line就是指 64 個字節(jié)大小的數(shù)據(jù)塊。Cache容量模型如圖 2所示,圖中展現(xiàn)了data cache: 32-KB, 8-way set associative(每個組里有8行),64-byte line size的cache容量模型。

圖 2

映射算法是指把內(nèi)存地址空間映射到Cache地址空間。具體來說,就是把存放在內(nèi)存中的內(nèi)容按照某種規(guī)則裝入到 Cache 中,并建立內(nèi)存地址與 Cache 地址之間的對應關系。當處理器需要訪問這個數(shù)據(jù)塊內(nèi)容時,則需要把內(nèi)存地址轉換成 Cache 地址,從而在Cache 中找到該數(shù)據(jù)塊,最終返回給處理器。Cache 和內(nèi)存之間的映射關系可以分為三類:全關聯(lián)型Cache(full associative cache),直接關聯(lián)型 Cache(direct mapped cache),組關聯(lián)型 Cache(N-ways associative cache)。

全相聯(lián)映射是指主存中任一塊都可以映射到Cache中任一塊的方式,也就是說,當主存中的一塊需調入Cache時,可根據(jù)當時Cache的塊占用或分配情況,選擇一個塊給主存塊存儲,所選的Cache塊可以是Cache中的任意一塊。例如,設Cache共有m塊,主存共有n塊,當主存的某一塊j需調進Cache中時,它可以存入Cache的塊0、塊1、…、塊i、… 或塊m的任意一塊上,如圖3所示,區(qū)別在于cache和主存塊的對應關系不一樣。

圖3

在Cache中,需要建立一個目錄表,目錄表的每個表項都有三部分組成:內(nèi)存地址、Cache塊號和一個有效位。當處理器需要訪問某個內(nèi)存地址時,首先通過該目錄表查詢是否該內(nèi)容緩存在Cache中,具體過程如圖4所示。當一個主存塊調入Cache中時,會同時在一個存儲主存塊號和Cache塊號映射表的相聯(lián)存儲器中進行登記。CPU訪存時,主存的塊地址A在Cache的相聯(lián)存儲器目錄表中進行查詢,如果找到等值的內(nèi)存塊地址,檢查有效位是否有效,只有有效的情況下,才能通過Cache塊號在Cache中找到緩存的內(nèi)存,并且加上塊內(nèi)地址 B,找到相應數(shù)據(jù),這時則稱為Cache命中,處理器拿到數(shù)據(jù)返回;否則稱為不命中,處理器則需要在內(nèi)存中讀取相應的數(shù)據(jù)。使用全關聯(lián)型 Cache,塊的沖突最小,Cache的利用率也高,但是需要一個訪問速度很快的相聯(lián)存儲器。隨著Cache容量的增加,其電路設計變得十分復雜,因此只有容量很小的Cache才會設計成全關聯(lián)型。

圖 4

直接關聯(lián)型Cache是指主存中的一塊內(nèi)存只能映射到Cache的一個特定的塊中,Cache的目錄表只有兩部分組成:區(qū)號和有效位。其查找過程如圖5所示。首先,內(nèi)存地址被分成三部分:區(qū)號A、塊號B和塊內(nèi)地址C,在這里區(qū)號A和區(qū)號B其實是全關聯(lián)型中主存地址A。根據(jù)區(qū)號A在目錄表中找到完全相等的區(qū)號,并且在有效位有效的情況下,說明該數(shù)據(jù)在Cache中,然后通過內(nèi)存地址的塊號B獲得在Cache中的塊地址,加上塊內(nèi)地址C,最終找到數(shù)據(jù)。如果在目錄表中找不到相等的區(qū)號,或者有效位無效的情況下,則說明該內(nèi)容不在Cache中,需要到內(nèi)存中讀取。直接相聯(lián)映射方式的優(yōu)點 是比較電路最簡單,但缺點是Cache塊沖突率較高,從而降低了Cache的利用率。

圖 5

以上兩種方式各有優(yōu)缺點,而且非常有趣的是,它們的優(yōu)缺點正好相反,所以組關聯(lián)型映射就出現(xiàn)了,組關聯(lián)型映射是目前用的最多的映射方式。組關聯(lián)型Cache內(nèi)存被分為很多組,一個組的大小為多個Cache line的大小,一個組映射到對應的多個連續(xù)的Cache line,也就是一個Cache組,并且該組內(nèi)的任意一塊可以映射到對應Cache組的任意一個??梢钥闯觯诮M外,其采用直接關聯(lián)型 Cache 的映射方式,而在組內(nèi),則采用全關聯(lián)型Cache 的映射方式。

假設有一個4路組關聯(lián)型Cache,其大小為1M,一個Cache line的大小為64B,那么總共有16K個 Cache line,但是在4路組關聯(lián)的情況下,我們并不是簡簡單單擁有16K個Cache line,而是擁有了4K 個組,每個組有4個Cache line。一個內(nèi)存單元可以緩存到它所對應的組中的任意一個Cache line中去。圖 6以4路組關聯(lián)型 Cache 為例介紹其在Cache中的查找過程。目錄表由三部分組成,分別是“區(qū)號+塊號”、Cache塊號和有效位。當收到一個內(nèi)存地址時,該地址被分成四部分:區(qū)號A、組號B、塊號C和塊內(nèi)地址D。首先,根據(jù)組號 B 按地址查找到一組目錄表項,在4 路組關聯(lián)中,則有四個表項,每個表項都有可能存放該內(nèi)存塊;然后,根據(jù)區(qū)號A和塊號C在該組表項中進行關聯(lián)查找(即并行查找,為了提高效率),如果匹配且有效位有效,則表明該數(shù)據(jù)塊緩存在 Cache 中,得到Cache塊號,加上塊內(nèi)地址D,可以得到該內(nèi)存地址在Cache中映射的地址,得到數(shù)據(jù);如果沒有找到匹配項或者有效位無效,則表示該內(nèi)存塊不在Cache中,需要處理器到內(nèi)存中讀取。

圖 6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Cache
    +關注

    關注

    0

    文章

    129

    瀏覽量

    28363
  • 內(nèi)存管理

    關注

    0

    文章

    168

    瀏覽量

    14159

原文標題:Cache地址映射

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    為什么MMU的地址映射物理地址會跳變?

    關于MMU的地址映射,32位的cpu有4G的虛擬地址空間,將它分為4096個小塊,每個小塊是1M,用描述符進行虛擬地址和物理地址之間關系的建立。問題在上圖中,進行0xA0000000
    發(fā)表于 08-22 05:45

    如何使用Simscape Multibody的物理建模模塊來建立倒立擺模型?

    Multibody的物理建模模塊來建立倒立擺模型。Simscape庫中的代表實際的物理組件;因此,可以構建復雜的多體動力學模型,而無需通過物理
    發(fā)表于 07-07 06:16

    物理內(nèi)存和虛擬內(nèi)存之間的轉換

    內(nèi)存操作:涉及到了物理內(nèi)存和虛擬內(nèi)存之間的轉換,需要用到兩個函數(shù): ioremap 和 iounmap。ioremap :函 數(shù) 用 于 獲 取 指 定 物 理 地 址 空 間 對 應 的 虛 擬
    發(fā)表于 12-17 06:48

    Linux虛擬內(nèi)存和物理內(nèi)存的深刻分析

    的鏈表,實際上并不立即就把虛擬內(nèi)存對應位置的程序數(shù)據(jù)和代碼(比如.text .data段)拷貝到物理內(nèi)存中,只是建立好虛擬內(nèi)存和磁盤文件之間映射就好(叫做存儲器
    發(fā)表于 05-31 08:00

    ARM處理器使用虛擬地址來提供cache index和cache tag

    cache。這對于那些需要頻繁修改頁表映射的多任務系統(tǒng)具有顯著優(yōu)勢。使用虛擬地址作為index也有一些硬件優(yōu)勢,這意味著cache硬件在進
    發(fā)表于 06-20 15:22

    ARM處理器中的邏輯cache物理cache是什么

    ARM處理器中的邏輯cache物理cache是什么?有沒有哪位大神可以幫忙解決一下這個問題
    發(fā)表于 11-03 15:25

    傳輸信道與物理信道的映射

    傳輸信道與物理信道的映射 •PCH和FACH可以在物理層編碼組合生成CCTrCH;•BCH
    發(fā)表于 09-18 15:17 ?2474次閱讀

    容器中使用存儲的技巧分享

    存儲是將裸磁盤空間通過劃邏輯盤,做Raid,或者LVM(邏輯卷)等方式邏輯劃分出N個邏輯的硬盤,然后采用映射的方式將這些邏輯盤掛載到主機。主機的操作系統(tǒng)認為這些磁盤均為物理硬盤,跟直接拿一
    發(fā)表于 04-30 09:03 ?2253次閱讀

    存儲設備知識詳解

    一個做法是將早期寫入的進行HASH計算,將HASH值以及信息保存到內(nèi)存中,作為Cache,新預寫的計算HASH值,如果HASH值在Cache
    的頭像 發(fā)表于 05-16 16:11 ?5828次閱讀
    <b class='flag-5'>塊</b>存儲設備知識詳解

    Linux層架構介紹 層IO流程與層IO調度器詳解

    之前一直跟大家聊文件系統(tǒng),文件系統(tǒng)提供一層文件到物理層的映射轉換。這層邏輯可能非常復雜,依賴于文件系統(tǒng)的實現(xiàn)。今天則跟大家聊聊層,層位
    的頭像 發(fā)表于 05-16 12:12 ?2419次閱讀

    5G(NR)無線網(wǎng)絡中的傳輸(TBS)究竟有多大?

    傳輸(Transport Block)是無線網(wǎng)絡在MAC層和PHY(物理層)間傳遞的數(shù)據(jù)包;在發(fā)送端向下傳遞,接收端向上傳遞中傳輸(TBS)被映射
    的頭像 發(fā)表于 09-26 18:26 ?2053次閱讀
    5G(NR)無線網(wǎng)絡中的傳輸<b class='flag-5'>塊</b>(TBS)究竟有多大?

    Cache的原理和地址映射

    cache存儲系統(tǒng)中,把cache和主存儲器都劃分成相同大小的。 主存地址由號B和內(nèi)地址W兩部分組成,
    的頭像 發(fā)表于 10-31 11:21 ?1731次閱讀

    Cache內(nèi)容鎖定是什么

    “鎖定”在cache中的在常規(guī)的cache替換操作中不會被替換,但當通過C7控制cache中特定的時,比如使某特定的
    的頭像 發(fā)表于 10-31 11:31 ?768次閱讀

    memset會導致一大內(nèi)存進cache嗎?

    在 Arm 體系結構中,我們知道大多數(shù)的 normal memory 的配置都是 write allocation 和 read allocation 的,即當寫一內(nèi)存或讀一內(nèi)存的時候,如果 miss 了,那么會將該物理內(nèi)存
    的頭像 發(fā)表于 11-07 16:00 ?502次閱讀

    文件存儲和存儲的區(qū)別和聯(lián)系

    ,它將文件以樹狀結構進行組織,每個文件都被分配一個唯一的文件名。文件系統(tǒng)將文件劃分為邏輯上的或數(shù)據(jù),然后將這些映射到磁盤或其他存儲介質上進行
    的頭像 發(fā)表于 12-20 17:16 ?1240次閱讀