0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Kunpeng處理器組織及芯片架構(gòu)

架構(gòu)師技術(shù)聯(lián)盟 ? 來(lái)源:架構(gòu)師技術(shù)聯(lián)盟 ? 2023-03-24 13:56 ? 次閱讀

鯤鵬處理器基于Arm架構(gòu)。Arm是一種CPU架構(gòu),有別于Intel、AMD CPU采用的CISC復(fù)雜指令集,Arm CPU采用RISC精簡(jiǎn)指令集(精簡(jiǎn)指令集計(jì)算機(jī))。更多內(nèi)容參考“華為鯤鵬處理器介紹”、“鯤鵬計(jì)算產(chǎn)業(yè)發(fā)展白皮書”和“華為鯤鵬生態(tài)研究框架”。 推薦閱讀:?1、?華為鯤鵬處理器介紹 2、2023「企業(yè)智能分析與決策」實(shí)踐合集

1、鯤鵬處理器的組織

Chip:芯片(Chip)是指有大規(guī)模集成電路的硅片,我們見(jiàn)過(guò)的CPU這種是最常見(jiàn)的芯片。一般幾塊硅片可以封裝在一起組成一個(gè)芯片。

DIE:芯片的最小物理單元。Kunpeng 920封裝了3個(gè)DIE,兩個(gè)用來(lái)做計(jì)算,第三個(gè)用來(lái)做IO。

晶粒(die)是以半導(dǎo)體材料制作而成未經(jīng)封裝的一小塊集成電路本體,該集成電路的既定功能就是在這一小片半導(dǎo)體上實(shí)現(xiàn)。通常情況下,集成電路是以大批方式,經(jīng)光刻等多項(xiàng)步驟,制作在大片的半導(dǎo)體晶圓,然后再分割成方型小片,這一小片就稱為晶粒,每個(gè)晶粒就是一個(gè)集成電路的復(fù)制品。

Core:真正的計(jì)算單元,我們?cè)?a target="_blank">操作系統(tǒng)側(cè)看到的“核”。

Cluster:若干個(gè)核(core)的集合。Kunpeng 920把4個(gè)core集合成為一個(gè)cluster,而一個(gè)DIE上有8個(gè)cluster。

SoC: System on chip,例如,Kunpeng 920除了CPu外,還集成了RoCE 網(wǎng)卡、SAS控制器和南橋。 SoC可以理解為一個(gè)芯片集成了一個(gè)系統(tǒng),可以完成特定的一系列的工作,例如,CPU是大腦,SoC是不僅有大腦,還有手、腳、身體等等,這些手腳就相當(dāng)于,GPU,網(wǎng)卡處理器,聲卡處理器等。

2、Kunpeng 920芯片的架構(gòu)

d13f8d1e-ca07-11ed-bfe3-dac502259ad0.jpg

1片SoC上包含3個(gè)DIE,2個(gè)計(jì)算DIE,1個(gè)IO DIE。 1個(gè)計(jì)算DIE中8個(gè)Cluster。 1個(gè)Cluster中4個(gè)Core。 因此一個(gè)kunpeng 920芯片中包含4*8*2=64個(gè)核。 計(jì)算DIE上的每一個(gè)core具有自己的L1和L2級(jí)Cache,所有的core共享L3級(jí)Cache。 IO DIE上集成有網(wǎng)絡(luò)模塊、PCle模塊。 這些DIE在芯片內(nèi)部通過(guò)高速內(nèi)部總線進(jìn)行連接。

3、芯片架構(gòu)的系統(tǒng)安全&IMU

d1566480-ca07-11ed-bfe3-dac502259ad0.jpg

系統(tǒng)安全:支持安全啟動(dòng),以及保證系統(tǒng)在可信環(huán)境內(nèi)運(yùn)行的一套軟硬件方案。該方案由Secure Boot技術(shù)和ARM架構(gòu)中的Trust Zone技術(shù)結(jié)合而成。 IMU ( lntelligent Management Unit )是Hi162x芯片內(nèi)部的智能管理單元,完善ARM節(jié)點(diǎn)在數(shù)據(jù)中心的管理和控制,未來(lái)數(shù)據(jù)中心設(shè)備管理要求統(tǒng)一、智能和協(xié)同,遵循管理系統(tǒng)集中決策+節(jié)點(diǎn)執(zhí)行監(jiān)控,按照設(shè)備節(jié)點(diǎn)模型統(tǒng)一管理。 IMU作為數(shù)據(jù)中心的管理末端,協(xié)同BMC,完成數(shù)據(jù)中心的節(jié)點(diǎn)執(zhí)行監(jiān)控。 IMU可以覆蓋的功能:RA5故障預(yù)處理以及錯(cuò)誤記錄上報(bào)、安全信任根、能效管理、芯片內(nèi)部管理。

4、Kunpeng 920的其他子系統(tǒng)

d168d7fa-ca07-11ed-bfe3-dac502259ad0.jpg

鯤鵬處理器包含計(jì)算、存儲(chǔ)、設(shè)備IO、中斷以及虛擬化等子系統(tǒng)。 鯤鵬920含有兩個(gè)CPU DIE、一個(gè)IO DIE、以及共8組DDR4channel,它們通過(guò)AMBA(Advanced MicrocontrollerBus Architecture)總線互聯(lián)。

5、Kunpeng 920的IO子系統(tǒng)

鯤鵬處理器和IO子系統(tǒng)通過(guò)IO DIE進(jìn)行擴(kuò)展,支持soC片上加速器,如100G網(wǎng)卡、SAS控制器等。鯤鵬處理器同時(shí)支持基于PCle 4.0的設(shè)備擴(kuò)展,可支持網(wǎng)卡、GPu等板卡。 為了方便軟件編程,內(nèi)部SoC上的高速設(shè)備也基于PCle,且可以通過(guò)PCle的配置空間進(jìn)行配置。 各子系統(tǒng) PCIE(含CCIX ),Hydra(多片互聯(lián)),Network,Storage,HAC,ME,各自遵循行業(yè)標(biāo)準(zhǔn),兼容軟件接口規(guī)范,滿足開(kāi)源及演進(jìn)要求。

d16e7796-ca07-11ed-bfe3-dac502259ad0.jpg

6、Kunpeng 920的中斷子系統(tǒng)

d17ba09c-ca07-11ed-bfe3-dac502259ad0.jpg

1.在兼容ARM GIC規(guī)范的基礎(chǔ)上,實(shí)現(xiàn)了線中斷、消息中斷支持。 (1)GlC ( Generic Interrupt Controller)指Arm定義的通用中斷控制器。也是當(dāng)前的芯片系統(tǒng)基于GIC規(guī)范提出的一種全局中斷管理架構(gòu),它主要包括如下功能:

使能、禁用、選擇所有的SGI、PPI、SPI以及LPI。

支持將輸入的中斷路由到任一指定的CPU內(nèi)核。

支持中斷優(yōu)先級(jí)配置。

支持Arm AArch64安全化擴(kuò)展。

持Arm AArch64虛擬化擴(kuò)展。

(2)gicv3中,引入了消息中斷,并且為之支持了LPI。分配了大量的中斷號(hào),用于LPIo對(duì)于LPI的實(shí)現(xiàn),有2種方式,一種是訪問(wèn)redistributor提供的寄存器,一種是使用ITS。 (3)ITS( Hyper Interrupt Translation Service)功能是提供LPI中斷重定向服務(wù),將LPI中斷路由到不同的CPU內(nèi)核,其中中斷和CPU內(nèi)核的路由關(guān)系支持動(dòng)態(tài)配置。 (4)LPI(Locality-specific Peripheral Interrupt):基于message的中斷。 2.鯤鵬處理器引入中斷收集再分發(fā)的概念。 3.鯤鵬920上還實(shí)現(xiàn)了華為公司的MBIGEN(message based interrupt generator)技術(shù)。

7、Kunpeng 920的網(wǎng)絡(luò)子系統(tǒng)

1、網(wǎng)絡(luò)子系統(tǒng)包括Network ICL和RoCE引擎兩大部分。 2、Network lCL包括多個(gè)1Gbps~100Gbps以太網(wǎng)控制器,二層DCB、MAC地址表,多播表,VLAN過(guò)濾表,流表,中斷,PCle化,具有完整的NIC引擎,可以在RoCE引擎關(guān)閉的情況下單獨(dú)工作。 3、RoCE(RDMA over Converge Ethernet)是一種在以太網(wǎng)上采用RDMA(RemoteDirect Memory Access,遠(yuǎn)程直接內(nèi)存訪問(wèn))的網(wǎng)絡(luò)互聯(lián)技術(shù)。 4、華為鯤鵬920處理器使用的RoCE v2協(xié)議是由InfiniBand(IB)協(xié)議演進(jìn)而來(lái),既具有l(wèi)nfiniBand網(wǎng)絡(luò)的低時(shí)延、低CPU利用率等特點(diǎn),又能夠很好地兼容于Ethernet網(wǎng)絡(luò)。

8、Kunpeng 920的SAS子系統(tǒng)

d1868e76-ca07-11ed-bfe3-dac502259ad0.jpg

1、提供2個(gè)X8 SAS 3.0控制器 (1)SAS(Serial Attached SCSI)即串行SCSI技術(shù),一種磁盤連接技術(shù)。SAS控制器用于磁盤與內(nèi)存之間進(jìn)行交互。 (2)SAS控制器主要通過(guò)總線與CPU和內(nèi)存進(jìn)行交互,同時(shí)通過(guò)SERDES與硬盤進(jìn)行連接。 (3)SAS控制器與設(shè)備連接方式有兩種:直連和Expander連接。

直連表示SAS控制器的PHY與設(shè)備直接連接,不經(jīng)過(guò)中間轉(zhuǎn)換或擴(kuò)展;.

Expander連接表示SAS控制器與設(shè)備之間通過(guò)擴(kuò)展器進(jìn)行連接

2、支持SAS 3.0,向下兼容SAS2.0和SAS1.0;支持SATA3.0,向下兼容SATA2.0和SATA1.0;SAS支持12G/6G/3G/1.5G四種速率,SATA支持6G/3G/1.5G速率,同時(shí)可以實(shí)現(xiàn)速率的自協(xié)商。 3、可以直接不經(jīng)過(guò)Expander最大連接8個(gè)SAS盤或者SATA盤,兩者可以混插; SAS盤分為SAS機(jī)械盤和SAS SSD盤,SAS盤是為滿足高性能、高可靠性而設(shè)計(jì),在內(nèi)部驅(qū)動(dòng)電機(jī)的可靠性、轉(zhuǎn)速以及基板方面都與SATA盤有差異。 4、可以連接SAS Expander擴(kuò)展更多磁盤。提供1個(gè)X2 SATA控制器; 5、支持SATA 3.0,向下兼容SATA 2.5;支持AHCI1.3,向下兼容AHCI 1.2;支持6G/3G/1.5G速率自協(xié)商; 6、支持直連兩個(gè)SATA盤。 7、支持NOR Flash控制器,4個(gè)片選,NOR FLASH最大支持512K。 8、支持SPI Flash控制器,2個(gè)片選,SPI Flash最大支持32M。 9、支持NAND FLASH接口,4個(gè)片選。

9、Kunpeng 920的PCle子系統(tǒng)

d1992914-ca07-11ed-bfe3-dac502259ad0.jpg

1、支持PCle GEN1/2/3/4.0

Run at the 2.5G/5G/8G/16G。

x16 PCle控制器

嵌入式DMA引擎

PCle是一種高性能、通用的I/O互連接口,適用于各種計(jì)算和通信平臺(tái)。鯤鵬920PCle子系統(tǒng)提供了實(shí)現(xiàn)PCle根聯(lián)合體(Root Complex,RC)或端點(diǎn)(Endpoint,EP)應(yīng)用程序的解決方案。 2、最多支持40個(gè)PCle Lane

3 PCle控制器

提供了實(shí)現(xiàn)PCIe根聯(lián)合體或端點(diǎn)應(yīng)用程序的解決方案

鯤鵬920 PCle子系統(tǒng)包含3個(gè)PCle Core,最多支持40個(gè)PCle Lane。每個(gè)PCle Core包括多個(gè)PCle端口。PCle Core0共享16個(gè)Lane。PCle Core1共享16個(gè)Lane。PCle Core2共享8個(gè)Lane。3個(gè)PCle Core均可作為根端口(Root Port,RP)使用。只有PCle Core1能作為EP端口。 3、硬件特性:SRIS(Separate Refclk Independent ssc)支持SR-IOv 4、支持共享虛擬內(nèi)存 5、支持CCIX 6、支持P2P(Peer to Peer)。不同控制器之間的對(duì)等流量

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19372

    瀏覽量

    230434
  • 集成電路
    +關(guān)注

    關(guān)注

    5390

    文章

    11584

    瀏覽量

    362476
  • 半導(dǎo)體材料
    +關(guān)注

    關(guān)注

    11

    文章

    547

    瀏覽量

    29617
  • 芯片架構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    31

    瀏覽量

    14574

原文標(biāo)題:Kunpeng處理器組織及芯片架構(gòu)

文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    華為首次發(fā)布基于ARM架構(gòu)處理器芯片

    今年10月,華為發(fā)布的兩款A(yù)I芯片:昇騰910和昇騰310是華為AI的核心武器,用來(lái)武裝企業(yè)端——華為云EI;而今日華為發(fā)布了最新款的基于ARM架構(gòu)處理器芯片
    的頭像 發(fā)表于 12-25 10:04 ?7662次閱讀

    MIT突破傳統(tǒng)架構(gòu),挑戰(zhàn)36核心處理器

    麻省理工學(xué)院采用新架構(gòu)開(kāi)發(fā)出一款36核的處理器芯片原型。
    發(fā)表于 07-10 09:21 ?1045次閱讀

    淺談ARM處理器架構(gòu)

    ,新的 Cortex-M處理器家族設(shè)計(jì)的非常容易使用。因此,ARM 微控制處理器在單片機(jī)和深度嵌入式系統(tǒng)市場(chǎng)非常成功和受歡迎。二、ARM三個(gè)系列處理器特點(diǎn)三、目前,有哪些
    發(fā)表于 08-18 12:04

    存儲(chǔ)是如何組織的?是如何與處理器總線連接的?

    第一套在8086的微計(jì)算機(jī)系統(tǒng)中,存儲(chǔ)是如何組織的?是如何與處理器總線連接的?#BHE信號(hào)起什么作用?答:8086 為 16 位處理器,可訪問(wèn) 1M 字節(jié)的存儲(chǔ)
    發(fā)表于 07-26 06:06

    ARM微處理器的特點(diǎn)及其架構(gòu)解析

    - 基于 ARMv5 架構(gòu)的常用處理器? ARM7? 系列- 面向通用應(yīng)用的經(jīng)典處理器ARM 經(jīng)典處理器適用于那些希望在新應(yīng)用中使用經(jīng)過(guò)市場(chǎng)驗(yàn)證的技術(shù)的
    發(fā)表于 04-13 12:08

    多核處理器架構(gòu)及調(diào)試

      認(rèn)識(shí)多核基本架構(gòu)   多核處理器在同一個(gè)芯片中植入了多個(gè)處理器引擎,這就可以提供更高的CPU性能、功能特性和分區(qū)能力。一般說(shuō)來(lái),多核有兩種實(shí)現(xiàn)形式。
    發(fā)表于 08-26 18:08 ?1348次閱讀

    ARM公版架構(gòu) 真的是麒麟處理器的槽點(diǎn)嗎?

    只要出現(xiàn)麒麟處理器,那么必定會(huì)有很多人糾結(jié)于其使用的是ARM的公版架構(gòu),或者用之作為麒麟處理器的弱點(diǎn)進(jìn)行攻擊。那么,在筆者看來(lái),拿采用ARM公版架構(gòu)來(lái)否認(rèn)麒麟
    發(fā)表于 01-04 16:24 ?3128次閱讀
    ARM公版<b class='flag-5'>架構(gòu)</b> 真的是麒麟<b class='flag-5'>處理器</b>的槽點(diǎn)嗎?

    華為推出基于ARM架構(gòu)的服務(wù)處理器鯤鵬920

    1月7日,華為宣布推出業(yè)界最高性能基于ARM架構(gòu)的服務(wù)處理器鯤鵬920(Kunpeng 920),以及基于鯤鵬920的TaiShan服務(wù)
    的頭像 發(fā)表于 01-10 16:03 ?6707次閱讀

    音頻處理器架構(gòu)_音頻處理器的延時(shí)怎么調(diào)整

    本文主要闡述了音頻處理器架構(gòu)與音頻處理器延時(shí)的調(diào)整方法。
    發(fā)表于 04-09 11:01 ?5321次閱讀

    處理器架構(gòu)與指令集

    大家天天都在使用手機(jī),你知道你的手機(jī)使用的什么處理器?處理器又是何種架構(gòu)呢?今天筆者就來(lái)談?wù)?b class='flag-5'>處理器的架構(gòu)和指令集。 我們知道一臺(tái)手機(jī)最重要的
    的頭像 發(fā)表于 04-26 11:40 ?3715次閱讀
    <b class='flag-5'>處理器</b><b class='flag-5'>架構(gòu)</b>與指令集

    m3芯片與m1處理器參數(shù)對(duì)比

    ,它是一款基于ARM架構(gòu)芯片,而M1處理器是蘋果公司在2020年推出的首款基于ARM架構(gòu)芯片,它是蘋果公司自主設(shè)計(jì)的
    的頭像 發(fā)表于 08-16 11:33 ?1.1w次閱讀

    簡(jiǎn)單認(rèn)識(shí)MIPS架構(gòu)處理器

    無(wú)互鎖流水級(jí)微處理器 (Microprocessors without Interlocked Pipeline Stages,MIPS) 是流行的 RISC 架構(gòu)處理器之一。其原理是盡量利用軟件
    的頭像 發(fā)表于 11-29 09:14 ?2016次閱讀
    簡(jiǎn)單認(rèn)識(shí)MIPS<b class='flag-5'>架構(gòu)</b><b class='flag-5'>處理器</b>

    處理器的指令集架構(gòu)介紹

    處理器的指令集架構(gòu)(Instruction Set Architecture,ISA)是計(jì)算機(jī)體系結(jié)構(gòu)中至關(guān)重要的部分,它定義了微處理器能夠執(zhí)行的操作和指令的集合,以及這些指令如何被組織
    的頭像 發(fā)表于 08-22 10:53 ?1417次閱讀

    ARM處理器的寄存組織及功能

    ARM處理器的寄存組織是其核心架構(gòu)的重要組成部分,對(duì)于理解ARM處理器的運(yùn)行機(jī)制和性能特點(diǎn)具有重要意義。以下是對(duì)ARM
    的頭像 發(fā)表于 09-10 11:11 ?1505次閱讀

    OrangePi KunPeng Pro部署AI模型介紹

    OrangePi Kunpeng Pro是一款香橙派聯(lián)合華為精心打造的高性能板卡,搭載了鯤鵬處理器,可提供8TOPS INT8計(jì)算能力,板卡設(shè)計(jì)很精致,板載資源也非常多:
    的頭像 發(fā)表于 11-16 11:03 ?380次閱讀
    OrangePi <b class='flag-5'>KunPeng</b> Pro部署AI模型介紹