一開始有手機(jī),它們很好 - 好吧,允許它們的大小和重量的磚塊,只能做一件事:撥打電話。今天的蜂窩手機(jī)是21世紀(jì)的微型計(jì)算機(jī),能夠運(yùn)行無(wú)數(shù)的“應(yīng)用程序”,流式傳輸高清視頻和高質(zhì)量音頻,捕捉和處理1200萬(wàn)像素圖片,并仍可撥打電話。
盡管摩爾定律,對(duì)單個(gè)處理器要求很高,尤其是需要長(zhǎng)時(shí)間使用小電池供電的處理器。手機(jī)長(zhǎng)期以來一直使用獨(dú)立的應(yīng)用處理器來卸載主處理器的工作。然而,隨著ARM最近推出其big.LITTLE方法 - 以及NXP在低功耗雙核(M4/M0)嵌入式MCU中實(shí)現(xiàn)它 - 其他便攜式設(shè)備中的非對(duì)稱多核處理器(AMP)的轉(zhuǎn)變看來已經(jīng)設(shè)定為迅速?gòu)睦呦蛑髁鳌?/p>
德州儀器的OMAP和DaVinci
德州儀器的OMAP?SoC長(zhǎng)期以來一直是蜂窩手機(jī)中的主要應(yīng)用處理器。由于流式視頻和音頻最好由數(shù)據(jù)路徑中的DSP處理,因此OMAP SoC都將通用ARM?處理器與TI DSP相結(jié)合。
最初的130 nm OMAP 1系列 - 例如OMAP5912ZZG - 配對(duì)192 MHz ARM926EJ-S?和TMS320C55x?DSP內(nèi)核。內(nèi)部總線結(jié)構(gòu) - 一個(gè)程序總線,三個(gè)數(shù)據(jù)讀總線,兩個(gè)數(shù)據(jù)寫總線以及用于外設(shè)和DMA活動(dòng)的附加總線 - 有效地使DSP能夠在一個(gè)周期內(nèi)執(zhí)行最多三次數(shù)據(jù)讀取和兩次數(shù)據(jù)寫入,相對(duì)較高高速視頻和圖像處理。
向下移動(dòng)到65 nm,OMAP 3系列顯著提高了速度。例如,600 MHz OMAP3530DZCBB將ARM926EJ-S升級(jí)為Cortex?-A8; C55x?DSP到TMS320C64x?;并添加了POWERVR?SGX圖形加速器和NEON?SIMD協(xié)處理器。雖然大多數(shù)OMAP 3系列SoC直接銷售給手機(jī)OEM,但OMAP3530是針對(duì)嵌入式開發(fā)人員的目錄項(xiàng)目。 TI在Digi-Key的網(wǎng)站上提供了一系列OMAP3530培訓(xùn)視頻。
繼續(xù)提高賭注,TI的45納米OMAP 4平臺(tái)轉(zhuǎn)向支持對(duì)稱多處理(SMP)的雙核ARM Cortex-A9 MPCore?處理器;切換到基于C64x?DSP的可編程多媒體引擎;增加了IVA 3硬件加速器;并升級(jí)到POWERVR SGX540 3D圖形加速器(參見圖1)??紤]到高端應(yīng)用,OMAP4460可以提供1080p多標(biāo)準(zhǔn)視頻記錄和回放以及立體3D編碼/解碼。雖然TI利用這些芯片中的幾乎所有電源管理技巧,但人們不應(yīng)期望能夠在不給手機(jī)充電的情況下整天進(jìn)行高速在線3D游戲。希望評(píng)估OMAP4460的開發(fā)人員應(yīng)該查看流行的SVTronics的Pandaboard ES。
圖1:德州儀器的OMAP44x框圖(由德州儀器公司提供)。
雖然TI的OMAP 5系列 - 圍繞ARM的雙核Cortex-A15和兩個(gè)Cortex-M4構(gòu)建 - 顯然對(duì)服務(wù)器比對(duì)手機(jī)更感興趣,但是來自DaVinci?系列視頻處理器的OMAP-L138又向后移動(dòng)了考慮到便攜設(shè)備的功率曲線。 OMAP-L138采用ARM926EJ-S RISC MPU和TMS320C674x固定/浮點(diǎn)VLIW DSP,運(yùn)行溫度為375/456-MHz。與DaVinci芯片相比,OMAP-L138支持更寬,更少視頻的外設(shè),并包含浮點(diǎn)DSP。 TI推出OMAP-L138實(shí)驗(yàn)套件,您可以在此查看。
如果您的項(xiàng)目更加面向視頻,那么DM644系列雙核DaVinci DSP可能只需支付費(fèi)用。 TMS320DM6446包括一個(gè)運(yùn)行頻率高達(dá)405 MHz的ARM926EJ-S內(nèi)核和一個(gè)運(yùn)行頻率高達(dá)810 MHz的VLIW TMS320C64x + DSP內(nèi)核。該芯片可用于DM6446評(píng)估模塊的在線測(cè)試。
ADI公司的Blackfin設(shè)計(jì)公司專為低功耗便攜式應(yīng)用而設(shè)計(jì),ADI公司的Blackfin?是一款令人尊敬的處理器,就好像它是雙核處理器 - 其中一些實(shí)際上是。 Blackfin系列與英特爾共同開發(fā),包含各種小型16/32位RISC處理器,運(yùn)行頻率范圍為300至600 MHz。該處理器基于SIMD架構(gòu),具有兩個(gè)16位MAC,兩個(gè)40位ALU和一個(gè)扁平地址空間。每個(gè)MAC可以在每個(gè)周期中執(zhí)行16位乘16位乘法,并且包括特殊指令以加速各種信號(hào)處理任務(wù);所以Blackfin可以執(zhí)行控制功能并同時(shí)充當(dāng)DSP。 ADI聲稱Blackfin顯示出“同類最佳的MHz/mW性能”,盡管這已成為每個(gè)人都在追逐的激烈競(jìng)爭(zhēng)指標(biāo)。
ADSP-BF561SBBZ600(見圖2)是一款真正的雙核設(shè)備,包含兩個(gè)600 MHz Blackfin內(nèi)核,每個(gè)內(nèi)核有兩個(gè)16位MAC,兩個(gè)40位ALU,四個(gè)8位視頻ALU,一個(gè)40-位移寄存器,128 KB低延遲片上L2 SRAM和外部存儲(chǔ)器控制器。這是一款針對(duì)各種多媒體,工業(yè)和電信應(yīng)用的對(duì)稱多處理器(SMP)設(shè)備。
圖2:ADI公司的ADSP-BF561功能框圖(由Analog Devices提供)。
飛思卡爾半導(dǎo)體的QorIQ
飛思卡爾QorIQ?P1022是一款SMP處理器,圍繞兩個(gè)Power Architecture?e500v2內(nèi)核構(gòu)建,共享一個(gè)256 KB的L2緩存(參見圖3)。 P1022明確強(qiáng)調(diào)連接性,包括帶TCP/UDP/IP卸載的虛擬化增強(qiáng)型三速以太網(wǎng),用于ASIC連接的直接FIFO模式,用于本地存儲(chǔ)的SATA,支持三種PCI Express接口選項(xiàng),以及通常的USB,SPI ,多個(gè)GPIO等.QorIQ P1022NSN2LFB的運(yùn)行頻率為1055 MHz,具有雙精度浮點(diǎn)單元。 P1平臺(tái)概述培訓(xùn)模塊介紹了處理器系列,P1022多核開發(fā)系統(tǒng)讓您可以親身體驗(yàn)該芯片。
圖3:飛思卡爾半導(dǎo)體的QorIQ P1022框圖(由飛思卡爾提供)。
恩智浦的LPC4350
最新進(jìn)入低功耗多核市場(chǎng)的是恩智浦的LPC4350,它被稱為“世界上第一款雙核心DSC”。遵循ARM的“big.LITTLE”方法 - TI采用了同樣的方法其OMAP 5系列使用Cortex-M4s和Cortex-A15s - NXP結(jié)合了Cortex-M4和Cortex-M0內(nèi)核,功耗更低的LPC4350。
為了最大限度地降低功耗,204 MHz LPC4350使用Cortex-M0內(nèi)核盡可能從Cortex-M4卸載工作,Cortex-M4根據(jù)需要快速突發(fā)數(shù)據(jù)。 LPC4350的連接選項(xiàng)明顯針對(duì)嵌入式市場(chǎng),包括CAN,EBI/EMI,以太網(wǎng),I2C,微線,SD/MMC,SPI,SSI,SSP,UART/USART和USB OTG;內(nèi)置外設(shè)包括掉電檢測(cè)/復(fù)位,DMA,I2S,LCD,電機(jī)控制PWM,POR,PWM和WDT(見圖4)。
圖4:恩智浦半導(dǎo)體的LPC4350框圖(由NXP Semiconductors提供)。
LPC4350增加了兩個(gè)有趣的新功能:狀態(tài)可配置定時(shí)器(SCT)和四SPI閃存接口(SPIFI)。 SCT子系統(tǒng)位于AHB總線上,由兩個(gè)16位計(jì)數(shù)器或一個(gè)32位計(jì)數(shù)器組成,可通過總線時(shí)鐘或外部輸入進(jìn)行時(shí)鐘控制。 SCT支持跨多個(gè)計(jì)數(shù)器周期進(jìn)行排序,并使事件能夠控制輸入,輸出和其他事件。 SPIFI接口可以以高達(dá)每秒40 MB的速度向外部閃存?zhèn)鬏斔膫€(gè)數(shù)據(jù)通道,這是一種獨(dú)特且非常有用的技巧。
總而言之,LPC4350是進(jìn)入低功耗多核市場(chǎng)的一個(gè)有趣的新進(jìn)入;一個(gè)提高了其他人必須滿足的標(biāo)準(zhǔn)。但是那些產(chǎn)品可能已經(jīng)在籌備中,這將繼續(xù)使這個(gè)市場(chǎng)更加有趣。
ARM的big.LITTLE架構(gòu)
由于本文中提到的所有供應(yīng)商都是ARM許可證持有者,因此可以安全地假設(shè)ARM的路線圖將在相當(dāng)短的時(shí)間內(nèi)在硅片中發(fā)揮作用。該路線圖的最新主要補(bǔ)充 - 去年10月宣布 - 是對(duì)多核處理器的‘big.LITTLE’方法。即使是飛思卡爾,其Power Architecture許可證也已正式簽署。恩智浦已經(jīng)發(fā)布了第一款基于big.LITTLE的芯片,雖然不是ARM去年年底提出的版本。
ARM的第一個(gè)big.LITTLE設(shè)計(jì)將Cortex-A15與Cortex-A7配對(duì)。 big.LITTLE的核心原則是兩個(gè)核心必須在架構(gòu)上基本相同,以便所有指令在兩個(gè)核心上都能一致地執(zhí)行。 Cortex-A15和Cortex-A7都共享完整的ARM v7A架構(gòu),包括虛擬化和大型物理地址擴(kuò)展,因此在微架構(gòu)級(jí)別之上,它們完全兼容。 Cortex-M4和Cortex-M0也是如此。只要保持這種對(duì)稱性,SoC就可以包含任意數(shù)量的匹配big.LITTLE內(nèi)核。
Cortex-A15 vs Cortex-A7
性能Cortex-A15 vs Cortex-A7
能效Dhrystone 1.9x 3.5x FDCT 2.3x 3.8x IMDCT 3.0x 3.0x MemCopy L1 1.9x 2.3x MemCopy L2 1.9 x 3.4x
表1:Cortex-A15和Cortex-A7性能和能量比較(由ARM提供)。
在微體系結(jié)構(gòu)層面,Cortex-A15的管道比Cortex-A7復(fù)雜得多,它們的性能也大不相同(見表1)。 Cortex-A15傾向于權(quán)衡性能,而Cortex-A7傾向于相反;這些差異將傾向于確定應(yīng)用程序分區(qū)。
Cortex-A15和Cortex-A7通過CCI-400(高速緩存一致性互連)共享內(nèi)存和系統(tǒng)端口,如圖5所示,盡管每對(duì)內(nèi)核共享一個(gè)集成的二級(jí)高速緩存。 Cortex-A15和Cortex-A7對(duì)共用一個(gè)可編程通用中斷控制器(GIC-400),可在各種內(nèi)核之間分配多達(dá)480個(gè)中斷。針對(duì)主要的多核障礙,Cortex-A15和Cortex-A7均提供跟蹤解決方案,使程序員能夠使用ARM的CoreSight?SoC調(diào)試其代碼。
圖5:Cortex-A15 CCI Cortex-A7系統(tǒng)(由ARM提供)。
ARM使用big.LITTLE的方法涉及使用Cortex-A7進(jìn)行盡可能多的處理,只在需要性能時(shí)將任務(wù)遷移到Cortex-A15,將操作系統(tǒng)和應(yīng)用程序移動(dòng)到更快的核心。 ARM處理器工作頻率為1 GHz時(shí),可以在不到20微秒的時(shí)間內(nèi)完成這種遷移。這是可能的,因?yàn)閮蓚€(gè)處理器是相同的,并且入站和出站處理器中的狀態(tài)寄存器之間存在1:1映射。
總而言之,ARM的big.LITTLE方法似乎在邏輯上和架構(gòu)上都很有意義。通過使用相干高速緩存并自動(dòng)執(zhí)行中斷處理和存儲(chǔ)器訪問,這種架構(gòu)可能會(huì)為今年晚些時(shí)候點(diǎn)擊分銷渠道的便攜式設(shè)備帶來新一波多核處理器。這不能保證,但這是一個(gè)非常好的選擇。
-
處理器
+關(guān)注
關(guān)注
68文章
19384瀏覽量
230494 -
便攜式設(shè)備
+關(guān)注
關(guān)注
1文章
137瀏覽量
23118 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7525瀏覽量
88319
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論