0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用MCU的存儲器架構(gòu)降低功耗并優(yōu)化系統(tǒng)成本

電子設(shè)計(jì) ? 來源:郭婷 ? 作者:電子設(shè)計(jì) ? 2019-02-06 11:09 ? 次閱讀

現(xiàn)代MCU具有各種存儲元件,了解其組織,性能限制和功耗對于有效實(shí)施應(yīng)用程序至關(guān)重要。特別是,用于代碼存儲的片上閃存的特性,用于數(shù)據(jù)存儲的片上SRAM的組織以及片外存儲器的訪問特性將對整體處理效率產(chǎn)生巨大影響。讓我們分析一下這些關(guān)鍵的存儲器元件,以便更好地了解如何最有效地使用它們來最大限度地提高性能,降低功耗并優(yōu)化系統(tǒng)成本。

片上閃存

片上閃存可能是最關(guān)鍵的任何應(yīng)用程序中的內(nèi)存元素,因?yàn)樗ǔJ翘幚砥鞯乃兄噶畹脑?。如果沒有有效地獲取指令,則整體MCU性能將受到影響。向CPU提供指令有兩種不同的方法。在一種方法中,存儲器根據(jù)需要快速操作以匹配CPU的指令周期。例如,瑞薩RX600群使用先進(jìn)的閃存技術(shù),提供對指令存儲器的高性能零等待狀態(tài)訪問。這種方法可以簡化CPU架構(gòu)和確定性時(shí)序。

訪問閃存通常使用雙端口方式進(jìn)行CPU訪問,通過高速總線進(jìn)行讀取操作和更慢訪問,使用閃存控制器進(jìn)行寫入操作。 RX600的閃存接口如圖1所示。請注意,閃存進(jìn)一步分為數(shù)據(jù)閃存部分,用于存儲經(jīng)常修改的非易失性信息,以及指令部分,通常被視為讀取僅存儲器(ROM),即使它使用Flash技術(shù),并且可以在制造期間或通過系統(tǒng)更新由用戶多次重新編程。閃存控制單元(FCU)是一個(gè)獨(dú)立的專用處理器,可管理閃存寫入并具有自己的RAM和固件存儲器塊。 CPU可以啟動FCU操作;這是使用圖1頂部所示的外設(shè)總線實(shí)現(xiàn)的。

使用MCU的存儲器架構(gòu)降低功耗并優(yōu)化系統(tǒng)成本

圖1:瑞薩RX600 MCU的閃存接口(由Renesas提供)。

另一種架構(gòu)使用比CPU時(shí)鐘慢的指令存儲器,可能需要插入等待狀態(tài)。這可以顯著降低處理性能,因此通常在CPU和較慢的指令和數(shù)據(jù)存儲器塊之間插入高速緩沖存儲器。高速緩存存儲最近的存儲器訪問,并且如果再次需要相同的指令或數(shù)據(jù)元素,則可以在不必訪問較慢的主存儲器塊的情況下使用它。 Atmel SAM9G MCU的數(shù)據(jù)和指令高速緩沖存儲器的組織如圖2所示.16 KB存儲器提供快速的本地存儲,減少了CPU通過多路復(fù)用訪問大型Flash ROM或SRAM塊所需的次數(shù)。層AHB矩陣。請注意,使用本地高速緩存存儲器的能力也減少了總線矩陣流量,因此DMA或外設(shè)訪問將具有額外的總線帶寬。

使用MCU的存儲器架構(gòu)降低功耗并優(yōu)化系統(tǒng)成本

圖2:Atmel的SAM9G MCU的高速緩存存儲器接口。

如果高速緩存存儲器是高效的,整個(gè)“內(nèi)部循環(huán)”可以適應(yīng)高速緩存,這可能導(dǎo)致應(yīng)用程序的最關(guān)鍵部分幾乎為零等待狀態(tài)性能。注意,在該方法中執(zhí)行定時(shí)可能更難以估計(jì),因?yàn)楦咚倬彺妗拔疵小睂?dǎo)致意外的處理減速。另外,如果一個(gè)小的內(nèi)部循環(huán)不可用,或者數(shù)據(jù)的組織方式使得緩存算法所依賴的“位置”被違反,則處理可能變得非常低效。然而,一般而言,由于大多數(shù)算法的局部特性,緩存算法已被證明可以提高效率。

更復(fù)雜的緩存架構(gòu)

高帶寬計(jì)算密集型MCU,如德州儀器面向DSP的TMS320DM814x視頻處理器,高速緩沖存儲器系統(tǒng)可以具有額外的復(fù)雜程度。 TMS320DM814x的處理器到存儲器接口(圖3)具有三種不同級別的存儲器層次結(jié)構(gòu)。最接近處理器的是兩個(gè)1級(L1)高速緩存存儲器,一個(gè)用于指令,一個(gè)用于數(shù)據(jù)。當(dāng)所需數(shù)據(jù)不在L1高速緩存中時(shí),向2級(L2)存儲器發(fā)出請求。 L2存儲器是多端口存儲器,具有多個(gè)存儲區(qū)以進(jìn)一步組織數(shù)據(jù)。帶寬管理用于每個(gè)高速緩存控制器,以管理存儲器訪問的優(yōu)先級,以保持?jǐn)?shù)據(jù)順暢地流入和流出處理器。最多可提供9個(gè)優(yōu)先級,如果低優(yōu)先級訪問被阻止時(shí)間過長(超過Max_Wait周期),則可以優(yōu)先考慮優(yōu)先級。

這種多級內(nèi)存架構(gòu)在高帶寬時(shí)并不少見是必需的,包含優(yōu)先級和其他高級管理功能對于減輕優(yōu)化帶寬的負(fù)擔(dān)至關(guān)重要。嘗試識別包含高效緩存,智能帶寬管理功能和多個(gè)內(nèi)存端口的MCU,以自動優(yōu)化內(nèi)存帶寬。

使用MCU的存儲器架構(gòu)降低功耗并優(yōu)化系統(tǒng)成本

圖3:德州儀器的TMS320DM814x DSP內(nèi)存接口架構(gòu)(圖片提供)德州儀器(TI))。片上SRAM

需要了解片上SRAM的組織,以便在應(yīng)用中組織數(shù)據(jù)元素以獲得最佳效率。在許多情況下,MCU將SRAM組織成單獨(dú)的塊,可以由總線主機(jī)獨(dú)立訪問以重疊并提高數(shù)據(jù)傳輸效率。恩智浦半導(dǎo)體LPC15xx MCU將SRAM分成三個(gè)不同的模塊,每個(gè)模塊通過多級AHB矩陣可用于處理器,USB或DMA主設(shè)備,如圖4頂部所示。圖中底部顯示了SRAM模塊的特性,如SRAM模塊的特性。作為大小,地址范圍,以及是否可以禁用它以節(jié)省每個(gè)LPC15xx系列成員的電源分配不同大小的SRAM模塊并不罕見,無論是從處理角度還是從功率角度來看,都可以幫助您以最有效的方式對設(shè)計(jì)進(jìn)行分區(qū)。讓我們更詳細(xì)地了解如何智能地將您的算法要求與SRAM塊組織相匹配,從而提高處理能力和功率效率。

使用MCU的存儲器架構(gòu)降低功耗并優(yōu)化系統(tǒng)成本

圖4:通過AHB矩陣將NXP LPC15xx SRAM連接到總線主控器和SRAM模塊特性(恩智浦提供)。

提高處理效率

基于MCU的設(shè)計(jì)中最常見的效率改進(jìn)之一是使用DMA功能從CPU卸載簡單的數(shù)據(jù)傳輸功能。如果CPU可以進(jìn)入休眠模式或與數(shù)據(jù)傳輸并行處理,則整體效率得到提高。多個(gè)SRAM塊的存在可以成為支持無沖突并行操作的重要元素。此外,同樣具有多級總線接口的高級MCU,如NXP LPC15xx,可以提供對共享資源的優(yōu)先訪問,以自動提高處理效率。例如,如果算法必須通過USB接口接收數(shù)據(jù),則處理數(shù)據(jù),存儲數(shù)據(jù),當(dāng)有足夠的數(shù)據(jù)可用時(shí),通過另一個(gè)接口發(fā)送結(jié)果,各種數(shù)據(jù)緩沖區(qū)的位置對整體性能至關(guān)重要。最好將輸入和輸出緩沖區(qū)分成不同的SRAM塊,因此來自CPU,DMA和USB端口的主控請求不會同時(shí)嘗試訪問同一個(gè)塊。為主訪問建立正確的優(yōu)先級設(shè)置將有助于消除算法停頓。確保在數(shù)據(jù)處理中以更高的優(yōu)先級捕獲接收的數(shù)據(jù)對于消除數(shù)據(jù)接收錯(cuò)誤和冗長的重試周期至關(guān)重要。了解算法的數(shù)據(jù)流要求是有效利用內(nèi)存塊的關(guān)鍵要求。

如上圖4的下半部分所示,可以啟用或禁用某些NXP LPC15xx SRAM模塊以降低功耗。組織數(shù)據(jù)以利用這一點(diǎn)可以有助于實(shí)現(xiàn)積極的電力目標(biāo)。例如,許多算法在CPU計(jì)算期間使用數(shù)據(jù)緩沖區(qū)來存儲大數(shù)據(jù)。計(jì)算完成后,無需保存該數(shù)據(jù),并且可以禁用相關(guān)的存儲器塊以節(jié)省電量。如果SRAM存儲器塊在使用之前需要一些額外的時(shí)間來“喚醒”,則始終啟用的SRAM塊中的較小緩沖區(qū)可以存儲數(shù)據(jù),直到新啟用的塊準(zhǔn)備就緒。在某些情況下,需要進(jìn)行詳細(xì)的計(jì)算以確定這些電源管理技術(shù)可以產(chǎn)生的節(jié)能量(如果有的話);但是具有多個(gè)具有省電選項(xiàng)的SRAM模塊通??梢蕴岣吖β市?。

外部存儲器接口

訪問片外存儲器資源會增加顯著的延遲,因此尋找緩沖片內(nèi)數(shù)據(jù)和預(yù)取存儲器的機(jī)會從片外可以顯著提高整體帶寬。將片上存儲器緩沖器匹配到適當(dāng)?shù)钠蟂RAM塊是重要的考慮因素,并且可以被認(rèn)為是先前描述的技術(shù)的擴(kuò)展。但是,外部存儲器接口通常組合多種類型的訪問。了解如何在訪問多個(gè)外部存儲器時(shí)避免沖突同樣重要。例如,Atmel SAM9G上的外部存儲器接口(如圖5所示)支持組合的DDR,LPDDR和SDRAM控制器,靜態(tài)存儲器控制器和NAND閃存控制器。雙從屬接口連接到多級總線矩陣,以便在由不同總線主控器啟動時(shí)傳輸可以重疊。請注意,靜態(tài)存儲器控制器和NAND控制器共享一個(gè)公共從端口。嘗試重疊NAND和靜態(tài)存儲器訪問可能效率低于重疊DDR2和NAND訪問。同樣需要注意在內(nèi)部存儲器塊中分配數(shù)據(jù)以避免影響效率

使用MCU的存儲器架構(gòu)降低功耗并優(yōu)化系統(tǒng)成本

圖5:Atmel SAM9G MCU上的外部存儲器接口(由Atmel提供)。許多存儲器接口子系統(tǒng)還提供緩存或本地存儲器緩沖區(qū)以減少訪問延遲。一些高級DDR控制器還可以自動優(yōu)先考慮訪問并組合操作,以利用DDR內(nèi)存架構(gòu)的塊性質(zhì)。如果外部存儲器流量是算法的重要組成部分,則必須檢查MCU上包含的存儲器控制器功能的詳細(xì)信息,以便更好地估計(jì)您可以預(yù)期的傳輸效率類型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19313

    瀏覽量

    230057
  • mcu
    mcu
    +關(guān)注

    關(guān)注

    146

    文章

    17171

    瀏覽量

    351485
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7496

    瀏覽量

    163929
收藏 人收藏

    評論

    相關(guān)推薦

    怎樣使移動電話存儲系統(tǒng)功耗降至最低

    隨著移動電話向著具有豐富媒體功能的無線平臺發(fā)展,對功率預(yù)算的控制是開發(fā)的重點(diǎn)。降低存儲器功耗可以顯著延長移動電話的電池壽命。為了降低存儲器
    發(fā)表于 10-08 15:53

    KeyStone存儲器架構(gòu)

    數(shù)據(jù) (L1D) 存儲器。另外,每個(gè) CorePac 還擁有局域的二級統(tǒng)一存儲器。每個(gè)局域存儲器均能獨(dú)立配置成存儲器映射的SRAM、高速緩存,或是兩者的組合?! eyStone
    發(fā)表于 08-13 15:45

    先進(jìn)MCU的新低功耗模式

    以最低功耗運(yùn)行有限的外設(shè)。隨著當(dāng)今的高級MCU轉(zhuǎn)向更高級的硅工藝(可將系統(tǒng)成本降至最低減小工作電流),一些新的
    發(fā)表于 08-27 15:41

    8個(gè)超低功耗 MCU 的設(shè)計(jì)指導(dǎo)原則

    與基于 16 位寄存的 CPU 相比需要更多的 CPU 開銷,因?yàn)楹笳咴试S直接存儲器對傳輸進(jìn)行存儲。從此例可以看出,16 位架構(gòu)所需代碼更少,功能執(zhí)行速度快 4 倍,從而縮短了運(yùn)行時(shí)
    發(fā)表于 01-21 11:10

    采用低功耗28nm FPGA降低系統(tǒng)成本

    模塊(ALM)、精度可調(diào)數(shù)字信號處理(DSP)模塊、分段式鎖相環(huán)(fPLL)、硬核存儲器控制等。28LP制造工藝降低設(shè)計(jì)成本Altera在28nm采用了雙管齊下的制造策略,對于需要盡
    發(fā)表于 02-09 15:02

    基于FRAM的MCU低功耗的應(yīng)用

    低功耗應(yīng)用提高安全性。此外,它們還采用非易失性 FRAM 替代 EEPROM 或閃存提供穩(wěn)健統(tǒng)一的存儲器架構(gòu),從而可簡化安全系統(tǒng)設(shè)計(jì)。
    發(fā)表于 07-08 06:03

    低功耗的嵌入式應(yīng)用的實(shí)現(xiàn):降低系統(tǒng)中電池功耗

    (通常為LCD)上進(jìn)行顯示?! ∫治鲞@種系統(tǒng)功耗,要看的第一個(gè)數(shù)據(jù)就是設(shè)備和顯示屏都處在斷電模式下的典型平均電流是多少。應(yīng)查看每個(gè)外設(shè)和控制的數(shù)據(jù)表,以了解功耗數(shù)據(jù)。為了最大限度
    發(fā)表于 08-20 12:30

    低功耗MCU如何降低功耗

    低功耗的問題就比較棘手了,比如某些可以低到微安級的MCU微控制,而自己設(shè)計(jì)的低功耗怎么測都是毫安級的,電流竟然能夠高出標(biāo)準(zhǔn)幾百到上千倍,遇到這種情況干萬不要怕,只要認(rèn)真你就贏了。接著
    發(fā)表于 11-12 13:57

    集成鐵電存儲器MCU有何作用

    集成鐵電存儲器MCU,由于在MCU上集成了鐵電存儲器,該產(chǎn)品數(shù)據(jù)寫入速度比基于閃存和EEPROM的MCU快100倍,
    發(fā)表于 11-10 08:28

    Ramtron推出最低功耗非易失性存儲器FM25P16

    Ramtron宣布推出世界上最低功耗的非易失性存儲器。該16 kb器件的型號為FM25P16,是業(yè)界功耗最低的非易失性存儲器,為對功耗敏感的
    發(fā)表于 02-07 09:00 ?1339次閱讀

    優(yōu)化EEG放大器設(shè)計(jì)的性能降低功耗

    優(yōu)化EEG放大器設(shè)計(jì)的性能降低功耗
    發(fā)表于 02-07 18:22 ?26次下載

    可提高性能降低功耗的UltraScale架構(gòu)

    與傳統(tǒng)FPGA架構(gòu)相比,UltraScale架構(gòu)引入了許多創(chuàng)新,可提高性能降低功耗。 在本視頻中,我們將重點(diǎn)介紹路由,邏輯和實(shí)現(xiàn)軟件的增強(qiáng)功能......
    的頭像 發(fā)表于 11-22 06:45 ?3349次閱讀

    低功耗藍(lán)牙芯片的應(yīng)用可顯著降低功耗成本

    低功耗藍(lán)牙是藍(lán)牙技術(shù)聯(lián)盟設(shè)計(jì)和銷售的一種個(gè)人局域網(wǎng)技術(shù),相較經(jīng)典藍(lán)牙,低功耗藍(lán)牙旨在保持同等通信范圍的同時(shí)顯著降低功耗成本。 在設(shè)計(jì)初始階段,優(yōu)化
    發(fā)表于 03-05 15:31 ?1221次閱讀

    電磁突破可以降低功耗,提高數(shù)字存儲器的速度

    電磁突破可以降低功耗,提高數(shù)字存儲器的速度??死锼沟侔病け葍?nèi)克(Christian Binek)說,“達(dá)到這一點(diǎn)是一個(gè)非常痛苦的過程。”
    的頭像 發(fā)表于 04-14 16:40 ?1849次閱讀

    華大電子MCU-CIU32F011x3、CIU32F031x5系統(tǒng)存儲器架構(gòu)

    延遲時(shí)間和低成本調(diào)試特性,而且高集成度和增強(qiáng)的特性使這顆處理 適合于那些需要高性能和低功耗微控制的市場領(lǐng)域。預(yù)先定義的存儲器映射和高達(dá)
    的頭像 發(fā)表于 10-13 08:55 ?1009次閱讀
    華大電子<b class='flag-5'>MCU</b>-CIU32F011x3、CIU32F031x5<b class='flag-5'>系統(tǒng)</b>及<b class='flag-5'>存儲器</b><b class='flag-5'>架構(gòu)</b>