鯤鵬處理器基于Arm架構(gòu)。Arm是一種CPU架構(gòu),有別于Intel、AMD CPU采用的CISC復(fù)雜指令集,Arm CPU采用RISC精簡(jiǎn)指令集(精簡(jiǎn)指令集計(jì)算機(jī))。更多內(nèi)容參考“華為鯤鵬處理器介紹”、“鯤鵬計(jì)算產(chǎn)業(yè)發(fā)展白皮書”和“華為鯤鵬生態(tài)研究框架”。 推薦閱讀:?1、?華為鯤鵬處理器介紹 2、2023「企業(yè)智能分析與決策」實(shí)踐合集
1、鯤鵬處理器的組織
Chip:芯片(Chip)是指有大規(guī)模集成電路的硅片,我們見(jiàn)過(guò)的CPU這種是最常見(jiàn)的芯片。一般幾塊硅片可以封裝在一起組成一個(gè)芯片。
DIE:芯片的最小物理單元。Kunpeng 920封裝了3個(gè)DIE,兩個(gè)用來(lái)做計(jì)算,第三個(gè)用來(lái)做IO。
晶粒(die)是以半導(dǎo)體材料制作而成未經(jīng)封裝的一小塊集成電路本體,該集成電路的既定功能就是在這一小片半導(dǎo)體上實(shí)現(xiàn)。通常情況下,集成電路是以大批方式,經(jīng)光刻等多項(xiàng)步驟,制作在大片的半導(dǎo)體晶圓,然后再分割成方型小片,這一小片就稱為晶粒,每個(gè)晶粒就是一個(gè)集成電路的復(fù)制品。
Core:真正的計(jì)算單元,我們?cè)?a target="_blank">操作系統(tǒng)側(cè)看到的“核”。
Cluster:若干個(gè)核(core)的集合。Kunpeng 920把4個(gè)core集合成為一個(gè)cluster,而一個(gè)DIE上有8個(gè)cluster。
SoC: System on chip,例如,Kunpeng 920除了CPu外,還集成了RoCE 網(wǎng)卡、SAS控制器和南橋。 SoC可以理解為一個(gè)芯片集成了一個(gè)系統(tǒng),可以完成特定的一系列的工作,例如,CPU是大腦,SoC是不僅有大腦,還有手、腳、身體等等,這些手腳就相當(dāng)于,GPU,網(wǎng)卡處理器,聲卡處理器等。
2、Kunpeng 920芯片的架構(gòu)
1片SoC上包含3個(gè)DIE,2個(gè)計(jì)算DIE,1個(gè)IO DIE。 1個(gè)計(jì)算DIE中8個(gè)Cluster。 1個(gè)Cluster中4個(gè)Core。 因此一個(gè)kunpeng 920芯片中包含4*8*2=64個(gè)核。 計(jì)算DIE上的每一個(gè)core具有自己的L1和L2級(jí)Cache,所有的core共享L3級(jí)Cache。 IO DIE上集成有網(wǎng)絡(luò)模塊、PCle模塊。 這些DIE在芯片內(nèi)部通過(guò)高速內(nèi)部總線進(jìn)行連接。
3、芯片架構(gòu)的系統(tǒng)安全&IMU
系統(tǒng)安全:支持安全啟動(dòng),以及保證系統(tǒng)在可信環(huán)境內(nèi)運(yùn)行的一套軟硬件方案。該方案由Secure Boot技術(shù)和ARM架構(gòu)中的Trust Zone技術(shù)結(jié)合而成。 IMU ( lntelligent Management Unit )是Hi162x芯片內(nèi)部的智能管理單元,完善ARM節(jié)點(diǎn)在數(shù)據(jù)中心的管理和控制,未來(lái)數(shù)據(jù)中心設(shè)備管理要求統(tǒng)一、智能和協(xié)同,遵循管理系統(tǒng)集中決策+節(jié)點(diǎn)執(zhí)行監(jiān)控,按照設(shè)備節(jié)點(diǎn)模型統(tǒng)一管理。 IMU作為數(shù)據(jù)中心的管理末端,協(xié)同BMC,完成數(shù)據(jù)中心的節(jié)點(diǎn)執(zhí)行監(jiān)控。 IMU可以覆蓋的功能:RA5故障預(yù)處理以及錯(cuò)誤記錄上報(bào)、安全信任根、能效管理、芯片內(nèi)部管理。
4、Kunpeng 920的其他子系統(tǒng)
鯤鵬處理器包含計(jì)算、存儲(chǔ)、設(shè)備IO、中斷以及虛擬化等子系統(tǒng)。 鯤鵬920含有兩個(gè)CPU DIE、一個(gè)IO DIE、以及共8組DDR4channel,它們通過(guò)AMBA(Advanced MicrocontrollerBus Architecture)總線互聯(lián)。
5、Kunpeng 920的IO子系統(tǒng)
鯤鵬處理器和IO子系統(tǒng)通過(guò)IO DIE進(jìn)行擴(kuò)展,支持soC片上加速器,如100G網(wǎng)卡、SAS控制器等。鯤鵬處理器同時(shí)支持基于PCle 4.0的設(shè)備擴(kuò)展,可支持網(wǎng)卡、GPu等板卡。 為了方便軟件編程,內(nèi)部SoC上的高速設(shè)備也基于PCle,且可以通過(guò)PCle的配置空間進(jìn)行配置。 各子系統(tǒng) PCIE(含CCIX ),Hydra(多片互聯(lián)),Network,Storage,HAC,ME,各自遵循行業(yè)標(biāo)準(zhǔn),兼容軟件接口規(guī)范,滿足開(kāi)源及演進(jìn)要求。
6、Kunpeng 920的中斷子系統(tǒng)
1.在兼容ARM GIC規(guī)范的基礎(chǔ)上,實(shí)現(xiàn)了線中斷、消息中斷支持。 (1)GlC ( Generic Interrupt Controller)指Arm定義的通用中斷控制器。也是當(dāng)前的芯片系統(tǒng)基于GIC規(guī)范提出的一種全局中斷管理架構(gòu),它主要包括如下功能:
使能、禁用、選擇所有的SGI、PPI、SPI以及LPI。
支持將輸入的中斷路由到任一指定的CPU內(nèi)核。
支持中斷優(yōu)先級(jí)配置。
支持Arm AArch64安全化擴(kuò)展。
持Arm AArch64虛擬化擴(kuò)展。
(2)gicv3中,引入了消息中斷,并且為之支持了LPI。分配了大量的中斷號(hào),用于LPIo對(duì)于LPI的實(shí)現(xiàn),有2種方式,一種是訪問(wèn)redistributor提供的寄存器,一種是使用ITS。 (3)ITS( Hyper Interrupt Translation Service)功能是提供LPI中斷重定向服務(wù),將LPI中斷路由到不同的CPU內(nèi)核,其中中斷和CPU內(nèi)核的路由關(guān)系支持動(dòng)態(tài)配置。 (4)LPI(Locality-specific Peripheral Interrupt):基于message的中斷。 2.鯤鵬處理器引入中斷收集再分發(fā)的概念。 3.鯤鵬920上還實(shí)現(xiàn)了華為公司的MBIGEN(message based interrupt generator)技術(shù)。
7、Kunpeng 920的網(wǎng)絡(luò)子系統(tǒng)
1、網(wǎng)絡(luò)子系統(tǒng)包括Network ICL和RoCE引擎兩大部分。 2、Network lCL包括多個(gè)1Gbps~100Gbps以太網(wǎng)控制器,二層DCB、MAC地址表,多播表,VLAN過(guò)濾表,流表,中斷,PCle化,具有完整的NIC引擎,可以在RoCE引擎關(guān)閉的情況下單獨(dú)工作。 3、RoCE(RDMA over Converge Ethernet)是一種在以太網(wǎng)上采用RDMA(RemoteDirect Memory Access,遠(yuǎn)程直接內(nèi)存訪問(wèn))的網(wǎng)絡(luò)互聯(lián)技術(shù)。 4、華為鯤鵬920處理器使用的RoCE v2協(xié)議是由InfiniBand(IB)協(xié)議演進(jìn)而來(lái),既具有l(wèi)nfiniBand網(wǎng)絡(luò)的低時(shí)延、低CPU利用率等特點(diǎn),又能夠很好地兼容于Ethernet網(wǎng)絡(luò)。
8、Kunpeng 920的SAS子系統(tǒng)
1、提供2個(gè)X8 SAS 3.0控制器 (1)SAS(Serial Attached SCSI)即串行SCSI技術(shù),一種磁盤連接技術(shù)。SAS控制器用于磁盤與內(nèi)存之間進(jìn)行交互。 (2)SAS控制器主要通過(guò)總線與CPU和內(nèi)存進(jìn)行交互,同時(shí)通過(guò)SERDES與硬盤進(jìn)行連接。 (3)SAS控制器與設(shè)備連接方式有兩種:直連和Expander連接。
直連表示SAS控制器的PHY與設(shè)備直接連接,不經(jīng)過(guò)中間轉(zhuǎn)換或擴(kuò)展;.
Expander連接表示SAS控制器與設(shè)備之間通過(guò)擴(kuò)展器進(jìn)行連接
2、支持SAS 3.0,向下兼容SAS2.0和SAS1.0;支持SATA3.0,向下兼容SATA2.0和SATA1.0;SAS支持12G/6G/3G/1.5G四種速率,SATA支持6G/3G/1.5G速率,同時(shí)可以實(shí)現(xiàn)速率的自協(xié)商。 3、可以直接不經(jīng)過(guò)Expander最大連接8個(gè)SAS盤或者SATA盤,兩者可以混插; SAS盤分為SAS機(jī)械盤和SAS SSD盤,SAS盤是為滿足高性能、高可靠性而設(shè)計(jì),在內(nèi)部驅(qū)動(dòng)電機(jī)的可靠性、轉(zhuǎn)速以及基板方面都與SATA盤有差異。 4、可以連接SAS Expander擴(kuò)展更多磁盤。提供1個(gè)X2 SATA控制器; 5、支持SATA 3.0,向下兼容SATA 2.5;支持AHCI1.3,向下兼容AHCI 1.2;支持6G/3G/1.5G速率自協(xié)商; 6、支持直連兩個(gè)SATA盤。 7、支持NOR Flash控制器,4個(gè)片選,NOR FLASH最大支持512K。 8、支持SPI Flash控制器,2個(gè)片選,SPI Flash最大支持32M。 9、支持NAND FLASH接口,4個(gè)片選。
9、Kunpeng 920的PCle子系統(tǒng)
1、支持PCle GEN1/2/3/4.0
Run at the 2.5G/5G/8G/16G。
x16 PCle控制器
嵌入式DMA引擎
PCle是一種高性能、通用的I/O互連接口,適用于各種計(jì)算和通信平臺(tái)。鯤鵬920PCle子系統(tǒng)提供了實(shí)現(xiàn)PCle根聯(lián)合體(Root Complex,RC)或端點(diǎn)(Endpoint,EP)應(yīng)用程序的解決方案。 2、最多支持40個(gè)PCle Lane
3 PCle控制器
提供了實(shí)現(xiàn)PCIe根聯(lián)合體或端點(diǎn)應(yīng)用程序的解決方案
鯤鵬920 PCle子系統(tǒng)包含3個(gè)PCle Core,最多支持40個(gè)PCle Lane。每個(gè)PCle Core包括多個(gè)PCle端口。PCle Core0共享16個(gè)Lane。PCle Core1共享16個(gè)Lane。PCle Core2共享8個(gè)Lane。3個(gè)PCle Core均可作為根端口(Root Port,RP)使用。只有PCle Core1能作為EP端口。 3、硬件特性:SRIS(Separate Refclk Independent ssc)支持SR-IOv 4、支持共享虛擬內(nèi)存 5、支持CCIX 6、支持P2P(Peer to Peer)。不同控制器之間的對(duì)等流量
審核編輯 :李倩
-
處理器
+關(guān)注
關(guān)注
68文章
19372瀏覽量
230434 -
集成電路
+關(guān)注
關(guān)注
5390文章
11584瀏覽量
362476 -
半導(dǎo)體材料
+關(guān)注
關(guān)注
11文章
547瀏覽量
29617 -
芯片架構(gòu)
+關(guān)注
關(guān)注
1文章
31瀏覽量
14574
原文標(biāo)題:Kunpeng處理器組織及芯片架構(gòu)
文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論