面向后E級(jí)計(jì)算的高性能處理器技術(shù)參考和借鑒

?商用高性能計(jì)算處理器市場(chǎng)主要被NVIDIA、AMD和Intel3家公司長(zhǎng)期占據(jù),在面向E級(jí)計(jì)算的高性能處理器中,AMD 最新的Instinct MI250X處理器雙精度浮點(diǎn)運(yùn)算能力已經(jīng)高達(dá)95.7TFlops，NVIDIA和Intel最新發(fā)布的高性能處理器峰值性能也均達(dá)到了數(shù)十 TFlops。 ?

本文主要分析和探討國(guó)際上面向 E 級(jí)計(jì)算的先進(jìn)高性能處理器的核心運(yùn)算架構(gòu)，包括 Fujitsu A64FX、NVIDIA H100、AMD MI250X 和 Intel PonteVecchio 4款高性能處理器,著重關(guān)注運(yùn)算資源組織結(jié)構(gòu)、數(shù)據(jù)和指令級(jí)并行方式、領(lǐng)域?qū)Ｓ眉铀俳Y(jié)構(gòu) DSA、支持?jǐn)?shù)據(jù)類型和算力等方面,并總結(jié)和展望主流高性能處理器的運(yùn)算架構(gòu)研究發(fā)展現(xiàn)狀和趨勢(shì),以期為國(guó)內(nèi)自主研發(fā)面向后 E 級(jí)計(jì)算的高性能處理器提供技術(shù)參考和借鑒。

1、Fujitsu A64FX

Fujitsu A64FX 是由富士通(Fujitsu)在2018年發(fā)布的,主要用于構(gòu)建日本原計(jì)劃研發(fā)的首臺(tái) E級(jí)計(jì)算機(jī) “后京”(POST-K)[6],后改名為 “富岳”(Fugaku)并于2020年6月發(fā)布。目前,“富岳”超算在全球高性能計(jì)算機(jī) TOP500榜單中排名第2,集成的 A64FX處理器芯片數(shù)量高達(dá)158976片,全機(jī)峰值性能為0.537212EFlops,Linpack實(shí)測(cè)性能為0.44201EFlops,效率為82.28%。

A64FX處理器結(jié)構(gòu)框圖如圖1所示,分成4個(gè)處理核心存儲(chǔ)組 CMG(CPU MemoryGroup),每個(gè) CMG 包含13個(gè)同構(gòu)核心、L2Cache和存儲(chǔ)控制器,其中12個(gè)核心為計(jì)算核心,1個(gè)為輔助核心,用于運(yùn)行操作系統(tǒng)和I/O 操作,全片共52個(gè)核心。每個(gè) CMG 集成8GB 容量的 HBM2存儲(chǔ)器,全片總?cè)萘繛?2GB,總帶寬為 1024GB/s。

片上還集成了 PCIe3.016x接口和富士通特有的TofuD互連網(wǎng)絡(luò)接口與路由器,這些外接口與4個(gè)CMG 通過片上網(wǎng)絡(luò) NoC(NetworkonChip)實(shí)現(xiàn)互連和通信。

A64FX 處理器采用臺(tái)積電7nm 工藝和 CoWoS封裝實(shí)現(xiàn),集成了87.86億晶體管,最高運(yùn)行頻率為2.2GHz,峰值性能為3.3792TFlops,功耗為200W。

2、NVIDIA H100

NVIDIA 在 HPC 和人工智能 AI商用處理器市場(chǎng)占比非常高,一直是圖形處理器 GPU領(lǐng)域的佼佼者。TOP500最新榜單排行前20的超算系統(tǒng)中有11臺(tái)采用了 NVIDIA 的 GPU 實(shí)現(xiàn)。目前這些超算算力主要由前兩代 GPU 產(chǎn)品 V100和A100提供。

NVIDIA 于2022年3月發(fā)布了面向 HPC 和AI的最新款高性能處理器 H100GPU。該處理器采用新一代 HOPPER 架構(gòu),基于上一代 GPUA100的 Ampere架構(gòu)主要進(jìn)行了如下擴(kuò)展:

(1)集成第4代張量核心(TensorCore);

(2)新增動(dòng)態(tài)規(guī)劃算法加速指令 DPX;

(3)流多處理器 SM內(nèi) CUDA核數(shù) 量翻倍;

(4)與GPC相對(duì)應(yīng),強(qiáng)化線程塊簇特征;

(5)新增 TMA引擎，增強(qiáng) 異步數(shù) 據(jù) 傳輸功能;

(6)定制Transformer引擎,以加速 Transformer 模型訓(xùn)練;

(7)更新?lián)Q代 HBM3、PCIe5.0和第4代 NVLink等存儲(chǔ)和外接口。

H100的結(jié) 構(gòu) 框圖如圖 2 所示,全片實(shí) 際(非 GH100架構(gòu)滿配)集成了132個(gè) SM,每2個(gè)SM 構(gòu)成一個(gè) TPC(TextureProcessingCluster),9個(gè)或8個(gè) TPC構(gòu)成一個(gè) GPC,全片共8個(gè) GPC。 ?

每個(gè)SM 包含128個(gè) FP32(單精度浮點(diǎn))CUDA核和 4 個(gè) TensorCore,全片共 16896 個(gè) CUDA核,528個(gè) TensorCore。 ?

H100GPU 片上集成了50MB的L2Cache,5個(gè)16GB容量的 HBM3,存儲(chǔ)總?cè)萘繛?0GB,總訪存帶寬為 3 TB/s。此外,片上還集成了 PCIe 5.0 16x和第 4 代 NVLink 外接口,支持與 CPU或 GPU 高速互連。 ?

H100GPU 采用臺(tái) 積電為 NVIDIA 定制的4N 工藝和 CoWOS封裝實(shí)現(xiàn),全片集成了800億個(gè)晶體管,運(yùn)行頻率為1.776GHz(根據(jù)雙精度浮點(diǎn)峰值性能和全片集成運(yùn)算部件數(shù)量推算得到),峰值性能為 60.0TFlops,TDP功耗為700 W。

3、AMD MI250X

為進(jìn)一步加強(qiáng)在 HPC領(lǐng)域的影響力,AMD將旗下通用 GPUGP拆分成 RDNA(RadeonDNA)和 CDNA(ComputeDNA)架構(gòu),前者主要面向?qū)崟r(shí)游戲和圖形處理,后者主要面向 HPC應(yīng)用。 ?

CDNA 架構(gòu)目前已經(jīng)發(fā)展到第2代 MI200,代表高性能處理器是 MI250X發(fā)布于2021年11月,并用于構(gòu)建美國(guó)E級(jí)超算“前線”(Frontier)。“前線”超算發(fā) 布于 2022 年 5 月 30日,在全球高性能計(jì)算機(jī) TOP500榜單中排名第1,集成的 MI250X 處理器芯片數(shù)量高達(dá)36992片,全機(jī)峰值性能為1.68565EFlops，Linpack實(shí)測(cè)性能為1.102EFlops,效率為65.38%。

MI250X處理器采用 AMD 特有的先進(jìn)3D封裝技術(shù) 集成 2 個(gè) MI200 GCD(GraphicsComputeDie),2個(gè) GCD 間通過無盡互連IF(Infinit Fabric)接口直連實(shí)現(xiàn)高帶寬通信。MI250X 處理y器中單個(gè) GCD(非 MI200滿配)結(jié)構(gòu)框圖如圖3所示,包含4個(gè)計(jì)算引擎 CE(ComputeEngine)，每個(gè) CE內(nèi)含27或28個(gè)計(jì)算單元 CU(ComputeUnit)。

MI250X 處理器全片 2 個(gè) GCD 共 220 個(gè)CU;集成了16 MB 的 L2Cache；8個(gè)16GB 容量的 HBM2E,總?cè)萘繛?28GB、總帶寬為3.2TB/s;8路IFLink或者6路IFLink加PCIe4.0接口(2路IF接口可重構(gòu)配置成 PCIE4.0接口),支持GPU 和 CPU 多種可擴(kuò)展高速互連。

MI250X處理器采用臺(tái)積電 N6工藝實(shí)現(xiàn),全片集成了 582 億個(gè)晶體管,運(yùn)行頻率最高為 1.7GHz,峰值性能為 95.7TFlops,是首個(gè)峰值性能接近 100 TFlops的高性能處理器,TDP 功耗為560 W。

4、Intel PonteVecchio

Intel一直致力于重新贏得 HPC 領(lǐng)域的高性能處理器領(lǐng)導(dǎo)者地位,其精心打造的面向 E 級(jí)計(jì)算的高性能處理器 PonteVecchio于2021年8月在Intel體系結(jié)構(gòu)日上發(fā)布,2023年1季度已上市。PonteVecchio處理器將用于構(gòu)建2臺(tái)美國(guó) E級(jí)計(jì) 算機(jī) “極光”(Aurora)和 “酋長(zhǎng) 巖”(ElCaptain)，并為其提供主要算力，預(yù)計(jì)“極光”的超算峰值性能為1.0EFlops、“酋長(zhǎng)巖”的超算峰值性能為2.0EFlops。

PonteVecchio處理器采用 X HPC架構(gòu)實(shí)現(xiàn),結(jié)構(gòu)框圖如圖4所示。

PonteVecchio處理器通過多種先進(jìn)封裝集成2個(gè)同構(gòu)的 Stack,Stack 間通過高速直連接口互連;全片共8個(gè) Slice,每個(gè) Slice包含16個(gè) X 核心,總計(jì)128個(gè) X 核心;全片集成了144 MB的共享 L2Cache;8個(gè) HBM2E,總帶寬超過5TB/s;16路 X Link,支持多 CPU 間高速直連,總帶寬超過2TB/s;此外還集成了 PCIe5.0接口。

PonteVecchio處理器采用 5 種先進(jìn)工藝實(shí)現(xiàn),包括臺(tái)積電5nm、7nm 和Intel 7nm 等,全片多達(dá) 47 個(gè) Tile (Die),通過 Foveros和 EMIB等多種先進(jìn)封裝技術(shù)集成。全片集成了超過1000億個(gè)晶體管,運(yùn)行頻率為1.373GHz(根據(jù)單精度浮點(diǎn)峰值性能和全片集成運(yùn)算部件數(shù)量推算得到),峰值性能超過45.0TFlops(雙精度浮點(diǎn)與單精度浮點(diǎn)相同),功耗暫無官方數(shù)據(jù)。

5、小結(jié)

4款面向 E級(jí)計(jì)算的高性能處理器參數(shù)與對(duì)比統(tǒng)計(jì)信息如表1所示,4款處理器均采用臺(tái)積電7nm 或更先進(jìn)工藝,集成密度高、晶體管數(shù)目龐大,通過先進(jìn)封裝集成高帶寬存儲(chǔ)器 HBM 提供TB/s級(jí)訪存帶寬,并采用商用大容量存儲(chǔ)顆粒。

工作頻率方面，A64FX 的較高,達(dá) 到了 2.2GHz，H100 和 MI250X 的均在 1.7 GHz 左右，PonteVecchio的最低為1.373GHz； ?

峰值性能方面,A64FX 是唯一峰值性能低于10.0TFlops的處理器,其他3款的均超過45.0TFlops，MI250X的甚至高達(dá) 95.7 TFlops； ?

功耗方面,H100 和MI250X的均超過 500 W,PonteVecchio的無官方數(shù)據(jù),預(yù)計(jì)也會(huì)超過500W。 ?

先進(jìn)封裝技術(shù)方面,均采用了2.5D 或3D 封裝,MI250X 還通過 EFB封裝集成了2個(gè) GCD,而 PonteVecchio采用 Foveros+EMIB 封裝集成超過47個(gè) Die,并通過多種先進(jìn)工藝分別實(shí)現(xiàn)了計(jì)算 Die、存儲(chǔ) Die和互連 Die。? ?

審核編輯：劉清

閱讀全文

處理器(221451) 處理器(221451)
計(jì)算機(jī)(83912) 計(jì)算機(jī)(83912)
晶體管(134507) 晶體管(134507)
DSA(14979) DSA(14979)
片上網(wǎng)絡(luò)(11728) 片上網(wǎng)絡(luò)(11728)

評(píng)論

相關(guān)推薦

全球首款面向專業(yè)音頻市場(chǎng)的高性能RISC-V處理器面世

電子發(fā)燒友網(wǎng)報(bào)道（文/吳子鵬）近日，睿思芯科推出了一款高性能RISC-V向量處理器，首個(gè)應(yīng)用領(lǐng)域瞄準(zhǔn)DSP領(lǐng)域，尤其是高品質(zhì)音視頻需求。據(jù)悉，該處理器是全球首個(gè)面向專業(yè)音頻市場(chǎng)的高性能RISC-V

2022-06-23 09:29:41

2238

異構(gòu)眾核系統(tǒng)高性能計(jì)算架構(gòu)

隨著計(jì)算機(jī)技術(shù)的發(fā)展，單核處理器已經(jīng)難以滿足高性能計(jì)算的需求，眾核處理器成為了一種有效的解決方案。眾核處理器是指在一個(gè)芯片上集成多個(gè)處理器核心，通過并行計(jì)算提高性能和能效，眾核處理器可以分為同構(gòu)

2023-11-30 08:27:32

392

367-基于ZYNQ XC7Z100 FFG 900的高性能計(jì)算模塊解決方案

基于ZYNQ XC7Z100 FFG 900的高性能計(jì)算模塊北京太速科技有限公司一、板卡概述本板卡基于Xilinx公司的FPGA XC7Z100 FFG 9000 芯片，該平臺(tái)為設(shè)計(jì)和驗(yàn)證

2018-12-19 15:06:32

面向工業(yè)應(yīng)用并且采用 PRU-ICSS 的高性能脈沖序列輸出 (PTO)

`描述面向工業(yè)應(yīng)用的具有 PRU-ICSS 的 TIDEP0027 高性能脈沖序列輸出 (PTO) 將德州儀器 (TI) 的 AM335x Sitara 處理器系列與 PTO 模塊整合成單個(gè)片上系統(tǒng)

2015-04-28 11:30:13

高性能FPGA計(jì)算加速卡

的高性能FPGA計(jì)算加速卡。作為基于服務(wù)器的PCI Express數(shù)據(jù)采集、處理、存儲(chǔ)設(shè)備，該板卡可以實(shí)現(xiàn)2通道萬兆光纖網(wǎng)絡(luò)數(shù)據(jù)的高速采集、實(shí)時(shí)處理、實(shí)時(shí)記錄和寬帶回放，強(qiáng)大的FPGA處理性能，可以實(shí)現(xiàn)

2016-03-04 11:13:54

高性能FPGA計(jì)算加速卡

2016-03-11 11:07:39

高性能FPGA計(jì)算加速卡

2016-03-18 11:16:02

高性能FPGA計(jì)算加速卡

2016-03-25 11:34:03

高性能FPGA計(jì)算加速卡

2016-04-01 10:53:42

高性能FPGA計(jì)算加速卡

2016-04-11 14:45:24

高性能FPGA計(jì)算加速卡

2016-04-18 14:12:57

高性能FPGA計(jì)算加速卡

2016-04-27 11:51:14

高性能NXP QorIQ通信處理器供電設(shè)計(jì)包括BOM及層圖

描述TIDA-01512 采用 TPS53681 多相控制器和 CSD95490Q5MC 智能功率級(jí)，可實(shí)現(xiàn)適合為 NXP QorIQ 通信處理器供電的高性能設(shè)計(jì)。該控制器的雙路輸出分別面向具有四相

2018-10-10 09:18:38

高性能信號(hào)處理通用平臺(tái)研究

，如果使用移位定標(biāo)或用定點(diǎn)模擬浮點(diǎn)運(yùn)算，程序的執(zhí)行速度將大大降低，為增強(qiáng)計(jì)算平臺(tái)的適用性，該通用信號(hào)處理平臺(tái)使用浮點(diǎn)處理器。同樣的任務(wù)量，用高性能的處理單元構(gòu)成的“小”規(guī)模系統(tǒng)，其效率要高于用較低性能

2016-05-31 17:53:59

高性能的機(jī)器學(xué)習(xí)讓邊緣計(jì)算更給力

進(jìn)行語音和自然語言處理的高性能800MHz音頻DSP雙攝像頭圖像信號(hào)處理器（ISP）用于豐富圖形渲染的3D GPUFETMX8MP-C核心板的處理器使用的是14nm FinFET工藝技術(shù)，因而具有低功耗

2021-10-15 13:58:18

高性能計(jì)算機(jī)的發(fā)展歷史是怎樣的？

高性能計(jì)算機(jī)的發(fā)展史高性能計(jì)算機(jī)的內(nèi)容高性能計(jì)算機(jī)的應(yīng)用高性能計(jì)算機(jī)的現(xiàn)狀高性能計(jì)算機(jī)的應(yīng)用領(lǐng)域高性能計(jì)算機(jī)的未來展望

2019-09-10 10:42:36

AM57x處理器實(shí)施多種內(nèi)核

隨著嵌入式領(lǐng)域的不斷擴(kuò)大，應(yīng)用也變得日趨復(fù)雜。因此，對(duì)特定處理器內(nèi)核（面向特定任務(wù)）的需求正在迅速增加。在我們生活的世界里，一種高性能、單架構(gòu)處理器稱霸天下的情況已不復(fù)存在。在單個(gè)處理器中實(shí)施多種

2018-09-04 09:54:55

ARM 720T處理器技術(shù)參考手冊(cè)

系列兼容的軟件。片上混合的數(shù)據(jù)和指令高速緩存以及寫入緩沖器大大提高了平均執(zhí)行速度，并減少了處理器所需的平均內(nèi)存帶寬。這允許外部?jī)?nèi)存支持額外的處理器或直接內(nèi)存訪問（DMA）通道，同時(shí)將性能損失降至最低

2023-08-02 11:36:56

ARM 946E-S可合成處理器技術(shù)參考手冊(cè)

ARM946E-S是一款可合成處理器，結(jié)合了ARM9E-S? 具有可配置存儲(chǔ)器系統(tǒng)的處理器核心。它是ARM9E的成員? 高性能32位片上系統(tǒng)處理器解決方案系列。 ARM946E-S是哈佛體系結(jié)構(gòu)

2023-08-02 10:17:36

ARM Cortex-A9處理器

宏的形式，設(shè)計(jì)使用***臺(tái)積電（TSMC）的40G40nm制造工藝技術(shù)制造。Osprey硬宏分別針對(duì)功耗和性能作了優(yōu)化，而針對(duì)性能的優(yōu)化使得ARM處理器完全進(jìn)入了高性能應(yīng)用競(jìng)爭(zhēng)領(lǐng)域。“Osprey

2018-09-06 09:27:22

ARM Cortex-M85處理器技術(shù)參考手冊(cè)

Cortex?-M85處理器是一款完全可合成的高性能微控制器類處理器，它實(shí)現(xiàn)ARM?v8.1-M主線架構(gòu)，其中包括對(duì)M-Profile向量擴(kuò)展(MVE)的支持。該處理器還支持以前ARM?V8-M架構(gòu)

2023-08-09 07:28:27

ARM920T處理器技術(shù)參考手冊(cè)

簡(jiǎn)單的總線接口，允許您圍繞它設(shè)計(jì)自己的緩存和內(nèi)存系統(tǒng)。ARM9TDMI系列微處理器支持32位ARM和16位Thumb指令集，允許您在高性能和高代碼密度之間進(jìn)行權(quán)衡。ARM920T處理器是一款哈佛

2023-08-02 13:05:00

ARM920T高緩存處理器有哪些性能參數(shù)和特性？

ARM920T 高緩存處理器是 ARM9 Thumb 系列中高性能的 32 位系統(tǒng)處理器。而 ARM920T 系列微處理器包含如下幾種類型的內(nèi)核。ARM9TDMI：只有內(nèi)核。ARM940T：由內(nèi)核

2019-09-26 09:43:55

ARM922T處理器技術(shù)參考手冊(cè)

高性能和高性能之間進(jìn)行權(quán)衡代碼密度。ARM922T處理器是哈佛高速緩存體系結(jié)構(gòu)處理器，其目標(biāo)是全內(nèi)存管理、高性能和低功率是至關(guān)重要的。此設(shè)計(jì)中的獨(dú)立指令和數(shù)據(jù)緩存每個(gè)大小為8KB，具有8字線長(zhǎng)度。ARM922T實(shí)現(xiàn)了增強(qiáng)型ARM體系結(jié)構(gòu)v4 MMU為指令和數(shù)據(jù)地址

2023-08-02 15:44:14

ARM946E-S (Rev0) 片上系統(tǒng)DSP增強(qiáng)處理器產(chǎn)品概述

）AHB（高級(jí)高性能總線）接口。它是ARM9E-S Thumb?系列高性能32位片上系統(tǒng)（SoC）處理器的一員，非常適合各種嵌入式應(yīng)用。指令和數(shù)據(jù)緩存以及指令和數(shù)據(jù)SRAM的大小可單獨(dú)配置，允許您根據(jù)

2023-08-02 17:50:31

ARM946E-S (Rev1)系統(tǒng)單片DSP增強(qiáng)處理器產(chǎn)品概述

）AHB（高級(jí)高性能總線）接口。它是的成員ARM9E-S Thumb?高性能32位片上系統(tǒng)（SoC）系列處理器，它非常適合廣泛的嵌入式應(yīng)用程序。的大小指令和數(shù)據(jù)高速緩存以及指令和數(shù)據(jù)SRAM是單獨(dú)

2023-08-08 07:33:30

ARM966E-S處理器技術(shù)參考手冊(cè)

ARM966E-S是一個(gè)可合成的宏單元，將ARM處理器與緊密耦合的SRAM存儲(chǔ)器相結(jié)合。它是ARM9 Thumb系列高性能32位片上系統(tǒng)（SoC）處理器解決方案的一員，面向廣泛的嵌入式應(yīng)用，在這

2023-08-02 07:46:42

ARM968E-S處理器技術(shù)參考手冊(cè)

可合成的ARM968E-S處理器是ARM9Thumb系列的一員，實(shí)現(xiàn)了ARMv5TE體系結(jié)構(gòu)。它支持32位ARM指令集和16位Thumb指令集。ARM968E-S處理器適用于要求高性能、低系統(tǒng)成本、小芯片尺寸和低功耗的各種嵌入式應(yīng)用。

2023-08-02 12:08:51

ARM9E系列微處理器處理高速數(shù)字信號(hào)處理效果如何？

ARM9E 系列微處理器的主要特點(diǎn)如下。支持 DSP 指令集，適合于需要高速數(shù)字信號(hào)處理的場(chǎng)合。5級(jí)流水線，指令執(zhí)行效率更高。支持 32 位 ARM 指令集和 16 位 Thumb 指令集。支持

2019-09-26 09:36:52

ARM9系列微處理器高性能和低功耗怎么樣？

ARM9系列微處理器在高性能和低功耗特性方面提供最佳的表現(xiàn)，具有以下特點(diǎn)。5級(jí)流水，指令執(zhí)行效率更高。提供 1.1MIPS/MHz 的哈佛結(jié)構(gòu)。支持 32 位 ARM 指令集和 16 位 Thumb

2019-09-26 09:34:01

ARM處理器的發(fā)展歷程

，再往低的部分手機(jī)產(chǎn)品中基本已經(jīng)不再使用。　　　　　　-ARM Cortex-R 　　ARM Cortex-R實(shí)時(shí)處理器為要求可靠性、高可用性、容錯(cuò)功能、可維護(hù)性和實(shí)時(shí)響應(yīng)的嵌入式系統(tǒng)提供高性能計(jì)算

2016-12-16 19:24:17

ARM處理器設(shè)計(jì)RISC介紹（上）

是20世紀(jì)70年代微處理器性能增強(qiáng)的主要因素，而計(jì)算機(jī)結(jié)構(gòu)體系自身對(duì)性能的貢獻(xiàn)不太明顯。微處理器的設(shè)計(jì)在體系結(jié)構(gòu)級(jí)上缺乏獨(dú)創(chuàng)思想，特別會(huì)體系結(jié)構(gòu)對(duì)他的VLSI實(shí)現(xiàn)技術(shù)的需求方面。處理器的設(shè)計(jì)者大多是

2022-04-24 09:57:10

ARM處理器設(shè)計(jì)RISC介紹（下）

時(shí)的實(shí)現(xiàn)工藝。容易實(shí)現(xiàn)高性能。RISC體系結(jié)構(gòu)的簡(jiǎn)單性、有效性很容易設(shè)計(jì)出低成本、高性能的處理器。RISC技術(shù)的歷史貢獻(xiàn)在計(jì)算機(jī)設(shè)計(jì)技術(shù)的發(fā)展變化中，20世紀(jì)60年代初引入的虛擬存儲(chǔ)器、Cache和流水線

2022-04-24 10:02:29

ARM處理器詳細(xì)分析與比較

。經(jīng)典 ARM 處理器ARM11 系列 - 基于 ARMv6 架構(gòu)的高性能處理器ARM9 系列 - 基于 ARMv5 架構(gòu)的常用處理器ARM7 系列- 面向通用應(yīng)用的經(jīng)典處理器 ARM 經(jīng)典處理器

2014-10-13 14:04:17

GD32E5高性能微控制器

、電機(jī)變頻、測(cè)量?jī)x器、混合信號(hào)處理、高端消費(fèi)類應(yīng)用等多種功能集成和工作負(fù)載需求。微控制器又稱微處理器、MCU或單片機(jī)，通過將CPU、存儲(chǔ)器等核心器件集成在一芯片上形成芯片級(jí)計(jì)算機(jī)，為不同的應(yīng)用場(chǎng)合做不同組合的控制。早期微控制器是將一個(gè)計(jì)算機(jī)集成到一個(gè)芯片中，實(shí)現(xiàn)嵌入式應(yīng)用，故稱單片機(jī)。GD32E5系

2021-12-16 08:13:14

Hifn全新SentryXL系列安全處理器

Hifn公司日前宣布，在服務(wù)應(yīng)用型處理器（ASP）領(lǐng)域推出SentryXL系列安全處理器，為受制于空間、功耗和成本的新一代通信和消費(fèi)產(chǎn)品提高性能數(shù)據(jù)加密、壓縮和散列計(jì)算。

2019-07-25 06:06:39

Linux系統(tǒng)下超線程技術(shù)怎么提高處理器的性能？

隨著計(jì)算機(jī)應(yīng)用的日益普及，用戶對(duì)計(jì)算機(jī)的處理能力的需求成指數(shù)級(jí)增長(zhǎng)。為了滿足用戶的需求，處理器生產(chǎn)廠商采用了諸如超流水、分支預(yù)測(cè)、超標(biāo)量、亂序執(zhí)行及緩存等技術(shù)以提高處理器的性能。但是這些技術(shù)的采用

2019-09-19 06:59:47

i.MX RT跨界處理器

應(yīng)用處理器與MCU“跨界”處理器—從性能差距到新解決方案領(lǐng)域降低成本—去除片內(nèi)閃存集高性能、低延遲、高能效和安全性于一體相關(guān)行業(yè)和應(yīng)用 i.MX RT跨界處理器

2021-02-19 06:06:39

中科院發(fā)布“香山”與“傲來”兩項(xiàng)開源處理器芯片

中科院計(jì)算技術(shù)研究所副所長(zhǎng)包云崗介紹了目前全球性能最高的開源高性能RISC-V處理器核項(xiàng)目“香山”。他指出，計(jì)算技術(shù)研究所對(duì)標(biāo)ARM Cortex-A72，已于2021年成功研制出第一代“香山

2023-05-28 08:43:00

什么是ARM處理器 ARM處理器有哪些系列

ARM 處理器是一種低功耗高性能的 32 位 RISC（精簡(jiǎn)指令系統(tǒng)）處理器。從結(jié)構(gòu) 入手對(duì)其進(jìn)行分析，并針對(duì)目前流行的 ARM920T 核詳細(xì)描述其硬件結(jié)構(gòu)和編程。ARM 處理器共有 31 個(gè)

2019-09-24 17:47:38

介紹一種高性能超低功率的存儲(chǔ)器技術(shù)

Molex推出下一代高性能超低功率存儲(chǔ)器技術(shù)

2021-05-21 07:00:24

凌華科技發(fā)布兩款基于最新的英特爾? 酷睿?處理器的模塊化電腦

凌華科技發(fā)布基于第13代英特爾? 酷睿?處理器的COM Express和COM-HPC計(jì)算模塊提供高達(dá)24核的擴(kuò)展計(jì)算能力以及工業(yè)級(jí)的穩(wěn)定性用英特爾?性能混合架構(gòu)，可實(shí)現(xiàn)高效率的邊緣計(jì)算、IoT

2023-02-15 10:30:48

分享：中國(guó)造ARM架構(gòu)處理器：完勝英特爾x86處理器？

和之前的一系列國(guó)產(chǎn)超級(jí)計(jì)算機(jī)均采用Intel、Nvidia、AMD等美國(guó)企業(yè)生產(chǎn)的處理器，其計(jì)算能力、軟件編寫嚴(yán)重依賴這些外國(guó)公司。若想自己掌控超級(jí)計(jì)算機(jī)的研發(fā)節(jié)奏，研制自主知識(shí)產(chǎn)權(quán)的高性能"

2015-11-19 16:24:03

創(chuàng)龍帶您了解ARM Cortex-A8高性能低功耗處理器設(shè)計(jì)的TL335x-EVM評(píng)估板

產(chǎn)品方案評(píng)估與技術(shù)預(yù)研。圖 1 評(píng)估板正面圖圖 2 評(píng)估板正面圖圖 3 評(píng)估板斜視圖2.Cortex-A8處理器TI Sitara AM335x是一款高性能嵌入式32位工業(yè)級(jí)Cortex-A8處理器

2020-09-09 09:42:08

君正X1830高性能，低功耗處理器介紹

MMU功能執(zhí)行與OS相關(guān)的TASKs。CPU內(nèi)核的核心部分是XBurst?處理器引擎。XBurst?是行業(yè)領(lǐng)先的微處理器內(nèi)核，可提供高性能和極低功耗。還包括一個(gè)與IEEE754兼容的硬件浮點(diǎn)單元

2020-05-07 09:56:48

君正X2000/X2000E芯片性能和處理器介紹

`簡(jiǎn)介：X2000是一款低功耗，高性能和高集成度的處理器，專注于IoT設(shè)備，同時(shí)也可以滿足許多其他嵌入式設(shè)備的需求。X2000也是第一顆基于XBurst2架構(gòu)的芯片，運(yùn)算能力相對(duì)于之前的芯片有大幅度

2020-05-25 09:21:52

基于ARM Cortex-M4處理器與板載NAND閃存的ATSAM4E-EK評(píng)估套件

ATSAM4E-EK，SAM4E-EK評(píng)估板基于ARM Cortex-M4處理器與板載NAND閃存和一系列流行外設(shè)的集成。它旨在為各種應(yīng)用提供高性能的高性能處理器評(píng)估解決方案

2019-04-22 10:16:24

基于Cortex-A53架構(gòu)的低功耗高性能處理器RK3328有哪些功能呢

基于Cortex-A53架構(gòu)的低功耗高性能處理器RK3328有哪些功能呢？

2022-03-09 06:27:22

基于TMS320C6701信號(hào)處理器的高性能信號(hào)處理模塊的設(shè)計(jì)方案

本文提出了一種基于TMS320C6701信號(hào)處理器的高性能信號(hào)處理模塊的設(shè)計(jì)方案，設(shè)計(jì)了具有一定通用性的并行信號(hào)處理模塊，該模塊具有高速互連接口，可以根據(jù)應(yīng)用系統(tǒng)的需求構(gòu)成不同的并行系統(tǒng)，完成各種信號(hào)處理任務(wù)。

2021-04-02 07:30:14

基于eZ80微處理器構(gòu)建的可擴(kuò)展DIY計(jì)算系統(tǒng)

描述Z20X 是一個(gè)簡(jiǎn)單的可擴(kuò)展 DIY 計(jì)算系統(tǒng)，圍繞 eZ80 微處理器構(gòu)建。我選擇 eZ80 是因?yàn)樗脑?jiǎn)單性以及與非常受歡迎的 Z80 和 Z180 的完全向后代碼兼容性。Z20X

2022-08-23 07:08:31

多內(nèi)核處理器應(yīng)用趨勢(shì)下的高性能視頻系統(tǒng)設(shè)計(jì)

和斑馬線特征計(jì)算出車輛的前方和側(cè)面相對(duì)位置，曲線檢測(cè)算法可以自動(dòng)處理由車輛、信號(hào)標(biāo)志、光斑、陰影，或者低圖像對(duì)比度造成的盲區(qū)，這么復(fù)雜的高強(qiáng)度數(shù)學(xué)運(yùn)算，只有像BF561這樣的高性能信號(hào)處理器才可以

2010-03-16 10:52:08

多核處理器的優(yōu)點(diǎn)

的設(shè)計(jì)流程相同，并且現(xiàn)有的單線程應(yīng)用也將繼續(xù)運(yùn)行。得益于線程技術(shù)的應(yīng)用在多核處理器上運(yùn)行時(shí)將顯示出卓越的性能可擴(kuò)充性，此類軟件包括多媒體應(yīng)用(內(nèi)容創(chuàng)建、編輯，以及本地和數(shù)據(jù)流回放)、工程和其他技術(shù)計(jì)算應(yīng)用以及諸如應(yīng)用服務(wù)器和數(shù)據(jù)庫等中間層與后層服務(wù)器應(yīng)用。

2019-06-20 06:47:01

多核處理器設(shè)計(jì)九大要素

商用CPU的“未來”高性能處理器結(jié)構(gòu)?！　‰m然多核能利用集成度提高帶來的諸多好處，讓芯片的性能成倍地增加，但很明顯的是原來系統(tǒng)級(jí)的一些問題便引入到了處理器內(nèi)部?！　? 核結(jié)構(gòu)研究: 同構(gòu)還是異構(gòu)

2011-04-13 09:48:17

如何利用FPGA開發(fā)高性能網(wǎng)絡(luò)安全處理平臺(tái)？

通過FPGA來構(gòu)建一個(gè)低成本、高性能、開放架構(gòu)的數(shù)據(jù)平面引擎可以為網(wǎng)絡(luò)安全設(shè)備提供性能提高的動(dòng)力。隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展，性能成為制約網(wǎng)絡(luò)處理的一大瓶頸問題。FPGA作為一種高速可編程器件，為網(wǎng)絡(luò)安全流量處理提供了一條低成本、高性能的解決之道。

2019-08-12 08:13:53

富媒體應(yīng)用處理器ZMS-08怎么樣？

ZiiLABS公司融合了原3DLABS公司的媒體處理技術(shù)和創(chuàng)新科技在MP3和MP4等消費(fèi)電子產(chǎn)品規(guī)劃上的優(yōu)勢(shì)，推出了第三代富媒體應(yīng)用處理器ZMS-08，將ZiiLABS干細(xì)胞計(jì)算陣列靈活的多格式媒體

2019-10-10 07:18:38

工業(yè)應(yīng)用理想選擇多核處理器

于中央的高性能ARM? Cortex?-A15，該處理器系列為工業(yè)市場(chǎng)提供了一個(gè)擁有高性能和高靈活性的解決方案。多核處理器是很多工業(yè)應(yīng)用的理想選擇，其中就包括可編程邏輯控制器（PLC）。PLC上的工業(yè)

2018-09-04 10:07:50

微處理器功耗和性能的測(cè)試方法是什么？

隨著嵌入式系統(tǒng)在消費(fèi)電子和工業(yè)設(shè)備中的廣泛應(yīng)用，功耗已經(jīng)開始像時(shí)鐘速度和系統(tǒng)性能一樣成為微處理器的一個(gè)核心特性。為了確定各種微處理器的功耗效率，嵌入式微處理器基準(zhǔn)協(xié)會(huì)開發(fā)了一個(gè)有力的工具

2019-08-22 07:30:54

微處理器的低功耗芯片設(shè)計(jì)技術(shù)詳解

控制技術(shù)的Montecito處理器，就利用了變頻時(shí)鐘系統(tǒng)。該芯片內(nèi)嵌一個(gè)高精度數(shù)字電流表，利用封裝上的微小電壓降計(jì)算總電流;通過內(nèi)嵌的一個(gè)32位微處理器來調(diào)整主頻，達(dá)到64級(jí)動(dòng)態(tài)功耗調(diào)整的目的，大大降低了功耗。

2016-06-29 11:28:15

快速調(diào)節(jié)器用于高性能處理器

DN87- 快速調(diào)節(jié)器用于高性能處理器

2019-05-28 07:30:54

怎么區(qū)分ARM Cortex系列的處理器

——Cortex-MCortex－M處理器家族更多的集中在低性能端，但是這些處理器相比于許多微控制器使用的傳統(tǒng)處理器性能仍然很強(qiáng)大。例如，Cortex－M4和Cortex－M7處理器應(yīng)用在許多高性能的微控制器產(chǎn)品中，最大的時(shí)鐘

2018-09-13 10:01:22

怎么實(shí)現(xiàn)多內(nèi)核處理器開發(fā)趨勢(shì)下的高性能視頻系統(tǒng)設(shè)計(jì)？

怎么實(shí)現(xiàn)多內(nèi)核處理器開發(fā)趨勢(shì)下的高性能視頻系統(tǒng)設(shè)計(jì)？

2021-06-03 06:19:40

恩智浦加速量產(chǎn)S32R41高性能雷達(dá)處理器

中國(guó)上?！?023年3月14日 ——恩智浦半導(dǎo)體（NXP Semiconductors N.V.，納斯達(dá)克股票代碼：NXPI）宣布量產(chǎn)其可擴(kuò)展S32R雷達(dá)處理器系列的最新成員。高性能S32R41

2023-03-14 16:10:18

智能網(wǎng)卡簡(jiǎn)介及其在高性能計(jì)算中的作用

的縮寫，可以從主機(jī)CPU卸載與網(wǎng)絡(luò)相關(guān)的任務(wù)，從而為其他關(guān)鍵操作釋放寶貴的處理能力。在高性能計(jì)算 （HPC）領(lǐng)域，智能網(wǎng)卡獲得了巨大的吸引力。HPC 環(huán)境需要高處理能力、高效的數(shù)據(jù)移動(dòng)和高速互連，以實(shí)現(xiàn)

2023-07-28 10:10:17

最高性能的Arm Cortex-R處理器,會(huì)領(lǐng)導(dǎo)計(jì)算型存儲(chǔ)的未來嗎？

Arm 今日宣布推出 Arm Cortex-R82，是 Arm 第一顆 64 位、支持 Linux 操作系統(tǒng)的 Cortex-R 處理器，該實(shí)時(shí)處理器可就近在數(shù)據(jù)存儲(chǔ)的位置進(jìn)行數(shù)據(jù)處理，專為加速

2020-09-16 11:02:12

求一種高性能視頻系統(tǒng)的解決方案

一種基于多內(nèi)核處理器的高性能視頻系統(tǒng)設(shè)計(jì)

2021-06-07 07:07:40

用FPGA 嵌入式處理器實(shí)現(xiàn)高性能浮點(diǎn)元算

APU-FPU 執(zhí)行浮點(diǎn)密集代代碼的性能表現(xiàn)。表中所列數(shù)據(jù)是賽靈思用于評(píng)估處理器浮點(diǎn)單元性能的一組基準(zhǔn)數(shù)據(jù)的子集。平均而言，軟 FPU 可比軟件仿真快 6 倍，而單精度 FPU 可比雙精度 FPU

2018-08-03 11:15:23

電腦處理器技術(shù)簡(jiǎn)介

MX)芯片，按下按鍵你可以看到M2芯片的外觀。Cyrix M2系列CPU是一種高性能的超標(biāo)量結(jié)構(gòu)微處理器。它專門針對(duì)16位和32位的X86軟件進(jìn)行了優(yōu)化。并配有MMX指令集，兼容Intel

2008-05-29 14:40:45

讓FPGA協(xié)處理器實(shí)現(xiàn)代碼加速的方法有哪些？

當(dāng)今的設(shè)計(jì)工程師受到面積、功率和成本的約束，不能采用GHz級(jí)的計(jì)算機(jī)實(shí)現(xiàn)嵌入式設(shè)計(jì)。在嵌入式系統(tǒng)中，通常是由相對(duì)數(shù)量較少的算法決定最大的運(yùn)算需求。使用設(shè)計(jì)自動(dòng)化工具可以將這些算法快速轉(zhuǎn)換到硬件協(xié)處理器中。然后，協(xié)處理器可以有效地連接到處理器，產(chǎn)生“GHz”級(jí)的性能。

2019-09-03 06:26:27

請(qǐng)大佬分享一款基于太空級(jí)Virtex FPGA的靈活高性能計(jì)算平臺(tái)

請(qǐng)問有沒有基于太空級(jí)Virtex FPGA的靈活高性能計(jì)算平臺(tái)？

2021-04-15 06:01:10

讀《玄鐵RISC-V處理器入門與實(shí)戰(zhàn)》

，書籍介紹平頭哥現(xiàn)有產(chǎn)品的分布： ①、面向低功耗領(lǐng)域的CPU，有入門級(jí)微控制器E902，高能效微控制器E906，以及計(jì)算增強(qiáng)型微控制器E907。 ②、面向中高端服務(wù)器CPU，有高能效應(yīng)用處理器C906

2023-09-28 11:58:35

適用于高性能運(yùn)算的處理器

三星八核６４位高性能處理器適用于對(duì)運(yùn)算要求較高的設(shè)備．如機(jī)器人，虛擬現(xiàn)實(shí)，增加現(xiàn)實(shí)．

2016-03-14 15:39:26

采用Sitara處理器PRU-ICSS的高性能脈沖序列輸出 (PTO)

描述面向工業(yè)應(yīng)用的具有 PRU-ICSS 的 TIDEP0027 高性能脈沖序列輸出 (PTO) 將德州儀器 (TI) 的 AM335x Sitara 處理器系列與 PTO 模塊整合成單個(gè)片上系統(tǒng)

2018-12-17 16:03:53

阿里云彈性高性能計(jì)算產(chǎn)品商業(yè)化正式發(fā)布

://click.aliyun.com/m/41646/[/url]彈性高性能計(jì)算（E-HPC）基于阿里云基礎(chǔ)設(shè)施，為用戶提供一站式公有云HPC服務(wù)，面向教育科研，企事業(yè)單位和個(gè)人，提供快捷，彈性，安全

2018-02-02 16:36:04

飛思卡爾高性能ColdFire微處理器簡(jiǎn)介

最新款的ColdFire微處理器在大約380 mW的功率上提供了410 Dhrystone MIPS（DMIPS）的內(nèi)核性能，能夠輕松滿足開發(fā)人員的系統(tǒng)功率預(yù)算，同時(shí)實(shí)現(xiàn)卓越的系統(tǒng)級(jí)性能。

2019-07-18 06:23:30

香山是什么？“香山” 高性能開源 RISC-V 處理器項(xiàng)目介紹

香山是什么2019 年，在中國(guó)科學(xué)院支持下，由中國(guó)科學(xué)院計(jì)算技術(shù)研究所牽頭發(fā)起 “香山” 高性能開源 RISC-V 處理器項(xiàng)目，研發(fā)出目前國(guó)際上性能最高的開源高性能 RISC-V 處理器核

2022-04-07 14:20:44

高級(jí)處理器特性能否提高編碼效率？

高級(jí)處理器特性能否提高編碼效率？

2021-04-26 06:41:08

驅(qū)動(dòng)高性能ASIC和微處理器

驅(qū)動(dòng)高性能ASIC和微處理器當(dāng)今的高性能ASIC和微處理器可能會(huì)消耗高達(dá)150W的功率。對(duì)于IV到1.5V的電源電壓，這些器件所需的電流很容易超出100A。采用多相DC-DC轉(zhuǎn)換

2010-04-10 09:25:09

英偉達(dá)發(fā)布高性能計(jì)算處理器丹佛計(jì)劃

據(jù)國(guó)外媒體報(bào)道，英偉達(dá)近日發(fā)布了丹佛（Denver）高性能計(jì)算處理器計(jì)劃，但并未公布具體上市時(shí)間。公司首席執(zhí)行官Jen-Hsun Huang在本周四的公司財(cái)務(wù)會(huì)議上指出該處理器可進(jìn)行64位單線

2011-11-14 09:36:20

619

Supermicro(R)利用新處理器和高速互連技術(shù)拓展高性能解決方案

Supermicro(R)利用即將面市的新處理器和最新的高速互連技術(shù)拓展高性能解決方案Supermicro(R)利用即將面市的新處理器和最新的高速互連技術(shù)拓展高性能解決方案

2011-11-14 19:03:50

894

高性能低成本Cortex-M3處理器

高性能低成本Cortex-M3處理器，參考下。

2016-01-22 14:23:54

基于FPGA的1024點(diǎn)高性能FFT處理器的設(shè)計(jì)鐘冠文

基于FPGA的1024點(diǎn)高性能FFT處理器的設(shè)計(jì)_鐘冠文

2017-03-19 11:36:55

32位高性能嵌入式處理器TMS470

高性能 32位嵌入式處理器TMS470 家族

2018-06-12 01:33:00

5917

基于Intel處理器技術(shù)的高性能單板計(jì)算機(jī)產(chǎn)品

英國(guó)并行科技公司（CCT）作為生產(chǎn)高性能嵌入式系統(tǒng)的世界級(jí)企業(yè)，相對(duì)于其它公司產(chǎn)品全面的各層次覆蓋，并行公司專注于設(shè)計(jì)和開發(fā)基于Intel處理器技術(shù)的高性能單板計(jì)算機(jī)產(chǎn)品。

2020-04-13 07:56:00

2179

基于NXP QorIQ 64位T1042處理器的高性能計(jì)算機(jī)

該高性能計(jì)算機(jī)是基于NXP QorIQ 64位T1042處理器，T1042處理器集成了4個(gè)e5500內(nèi)核，具有高性能的數(shù)據(jù)路徑加速架構(gòu)以及多路網(wǎng)絡(luò)外設(shè)接口。

2019-09-25 19:02:58

5400

基于T4240多核處理器的高性能計(jì)算機(jī)產(chǎn)品特點(diǎn)

該高性能計(jì)算機(jī)，是基于NXP QorIQ 64位、12核雙線程T4240處理器，最高主頻1.8GHZ。T4240處理器集成了12個(gè)新一代E6500內(nèi)核，支持高性能AitiVectorc處理單元，使T4240具有DSP級(jí)別的數(shù)據(jù)處理能力。

2019-10-08 15:08:54

3522

AMD EPYC處理器隨斬獲新的超級(jí)計(jì)算及高性能云計(jì)算系統(tǒng)而擴(kuò)張部署

采用AMD EPYC處理器開展領(lǐng)先研究 2020年6月23日，加州圣克拉拉訊 AMD公司(NASDAQ: AMD)今天公布了多項(xiàng)AMD EPYC處理器在高性能計(jì)算領(lǐng)域的最新成就，包括世界排名第七的超級(jí)

2020-06-23 14:57:05

965

高性能處理器RK3588數(shù)據(jù)手冊(cè)

RK3588是一款低功耗、高性能的處理器，用于基于ARM的PC和邊緣計(jì)算設(shè)備、個(gè)人移動(dòng)互聯(lián)網(wǎng)設(shè)備和其他數(shù)字多媒體應(yīng)用，以及將四核Cortex-A76和四核Cortex-A55與NEON集成協(xié)處理器。

2022-05-07 15:41:15

基于鯤鵬處理器的高性能計(jì)算實(shí)踐

相比主流的Intel Xeon 6248處理器，華為鯤鵬920的核數(shù)和內(nèi)存通道更多，因此提供了更高的并發(fā)度和內(nèi)存訪問帶寬。但在向量化位寬上，鯤鵬920為Intel主流處理器的1/4。基于以上特征，鯤鵬920更加適合訪存密集型應(yīng)用的計(jì)算

2023-04-20 09:43:25

1272