CPU是底層硬件基礎(chǔ)設(shè)施中的核心,當(dāng)前主流芯片架構(gòu)為 ARM 和 X86,均為國外主導(dǎo),芯片國產(chǎn)化率較低。國家啟動(dòng)發(fā)展國產(chǎn) CPU 的泰山計(jì)劃,863 計(jì)劃也提出自主研發(fā) CPU。2006 年核高基專項(xiàng)啟動(dòng),國產(chǎn) CPU領(lǐng)域迎來新一輪的國家支持,鯤鵬、飛騰、龍芯、兆芯、海光、申威等一批優(yōu)質(zhì)國產(chǎn) CPU 廠商快速崛起。 ? 本文內(nèi)容來自“中流擊水:六大國產(chǎn)CPU廠商分析(2022)”以及六大國產(chǎn)CPU分析。
1、國內(nèi)CPU廠商概述
海光信息和兆芯采用 x86 架構(gòu) IP 內(nèi)核授權(quán)模式,可基于公版 CPU 核進(jìn)行優(yōu)化或修改,優(yōu)點(diǎn)是性能起點(diǎn)高、生態(tài)壁壘低,缺點(diǎn)是需要支付授權(quán)費(fèi)、自主創(chuàng)新程度較低。海光最新一代 CPU 已接近國際同類高端產(chǎn)品水平,并兼容x86 指令集。 ? 鯤鵬和天津飛騰采用 ARM 指令集架構(gòu)授權(quán),可自行設(shè)計(jì) CPU 內(nèi)核和 SOC,也可擴(kuò)充指令集,自主化程度相對(duì)較高。華為鯤鵬 920 處理器是業(yè)內(nèi)首款 7nm 數(shù)據(jù)中心 ARM 處理器,非 X86 架構(gòu)芯片中鯤鵬 920 芯片在算力維度方面優(yōu)勢(shì)領(lǐng)先,且發(fā)展至今已經(jīng)達(dá)到可以與 X86 芯片相匹配的性能。 ? 龍芯中科采用自研的 LoongArch 指令集,擁有較強(qiáng)的自主性和可靠性,其秉承獨(dú)立自主和開放合作的運(yùn)營模式,從指令集/IP 核授權(quán)、到芯片級(jí)/主板級(jí)開發(fā)以及系統(tǒng)內(nèi)核應(yīng)用等方面對(duì)生態(tài)伙伴進(jìn)行全方位的開放支持。
申威采用自研的申威 64 位指令集,重點(diǎn)應(yīng)用于特種領(lǐng)域,努力實(shí)現(xiàn)在國防和網(wǎng)絡(luò)安全領(lǐng)域芯片的自主可控。隨著其產(chǎn)品技術(shù)的日益成熟,其生態(tài)也不斷趨于完善。 ? 海思、飛騰均已經(jīng)獲得 ARMv8 永久授權(quán),盡管 ARM 此前表態(tài) ARMv9 架構(gòu)不受美國出口管理?xiàng)l例約束,華為海思等國內(nèi)CPU產(chǎn)商依然可獲授權(quán),但是ARMv9不再提供永久授權(quán),采用 ARM 架構(gòu)仍有長期隱患。
RISC-V 因其相對(duì)精簡(jiǎn)的指令集架構(gòu)(ISA)以及開源寬松的 BSD 協(xié)議近年來發(fā)展較快,國內(nèi)阿里平頭哥、國芯科技等企業(yè)推出了該架構(gòu)相關(guān)產(chǎn)品。MIPS 和 ALPHA 指令架構(gòu)相對(duì)小眾,對(duì)應(yīng)國產(chǎn) CPU 的代表性企業(yè)分別是龍芯和申威。
2、鯤鵬920處理器
鯤鵬920處理器。該芯片支持 ARMv8.2 指令集,是行業(yè)內(nèi)首款 7nm數(shù)據(jù)中心 ARM 處理器,專為大數(shù)據(jù)處理以及分布式存儲(chǔ)等應(yīng)用而設(shè)計(jì)。鯤鵬 920 采用多發(fā)射、亂序執(zhí)行、優(yōu)化分支預(yù)測(cè)等多種手段提升單核性能。 ? 鯤鵬920 擁有 64 個(gè)內(nèi)核,集成 8 通道 DDR4,可以提供多個(gè)接口,主頻可達(dá) 2.6GHz,總內(nèi)存帶寬最高可達(dá) 1.5Tb/s,支持 PCIe 4.0 及 CCIX 接口,總帶寬 640Gbps。華為 Cache一致性總線(HCCS)的 480Gbps 片間互聯(lián)支持最多四顆鯤鵬 920 互聯(lián)和最高 256 個(gè)物理核的 NUMA 架構(gòu),保證了鯤鵬 920 超強(qiáng)算力的高效輸出。此外,在 Memory 子系統(tǒng)上也進(jìn)行了大量的優(yōu)化,采用當(dāng)前典型的 3 級(jí) Cache 的架構(gòu),對(duì) Cache 大小以及延時(shí)進(jìn)行了優(yōu)化設(shè)計(jì)。
鯤鵬 920 不同核心下與競(jìng)品芯片的對(duì)比,其在 48 核的時(shí)候,整數(shù)打平 intel 至強(qiáng) 8180,功耗低 20%。而 64 核心的鯤鵬 920,則比過 intel至強(qiáng) 8180 33%左右。其中至強(qiáng) 8180 是 intel 用于服務(wù)器的旗艦芯片,采用 28 核心,2.5GHz 頻率,廣泛應(yīng)用于 X86 服務(wù)器中。
3、飛騰處理器
飛騰對(duì)高性能服務(wù)器 CPU、高效能桌面 CPU、高端嵌入式 CPU 三條產(chǎn)業(yè)線進(jìn)行了全面的品牌升級(jí)。高性能服務(wù)器CPU產(chǎn)品線統(tǒng)一以飛騰騰云S系列進(jìn)行命名,高性能桌面 CPU 產(chǎn)品線以飛騰騰銳 D 系列進(jìn)行命名,高端嵌入式 CPU 產(chǎn)品線統(tǒng)一以飛騰騰瓏 E 系列進(jìn)行命名,提供定制化、契合各行各業(yè)嵌入式應(yīng)用的解決方案。
PKS 體系最早由飛騰 CPU(Phytium)和麒麟操作系統(tǒng)(Kylin)的“PK 體系”發(fā)展而來。依托飛騰全新的硬件級(jí)安全機(jī)制,以相關(guān)可信技術(shù)為支撐,PK 體系融合“S-Security”的立體防護(hù)安全鏈,升級(jí)為 PKS體系,并全球首創(chuàng)將“可信計(jì)算 3.0”技術(shù)融入到 CPU、操作系統(tǒng)和存儲(chǔ)控制器中,實(shí)現(xiàn)底層構(gòu)架的本質(zhì)安全,并成為國內(nèi)首個(gè)計(jì)算機(jī)軟硬件基礎(chǔ)體系標(biāo)準(zhǔn)。
4、海光處理器
海光信息與 AMD 公司合作密切,授權(quán)海光微電子 x86 指令集和Zen 架構(gòu),AMD 獲得 2.93 億美元的授權(quán)費(fèi)。海光集成電路購買海光微電子的 IP 授權(quán),以此為基礎(chǔ)開發(fā) CPU。海光集成電路與海光微電子的股權(quán)結(jié)構(gòu)保證了公司在規(guī)避了英特爾的 x86 授權(quán)限制的同時(shí),又使得海光 x86 CPU 成為內(nèi)資公司開發(fā)的產(chǎn)品,滿足了國家產(chǎn)業(yè)政策和創(chuàng)新的需求。
基于 AMD Zen1 架構(gòu),產(chǎn)品性能起點(diǎn)較高。選取 Intel 在 2020 年(與海光7285 同期)發(fā)布的 6 款至強(qiáng)鉑金系列產(chǎn)品(能夠反映 Intel 2020 年發(fā)布的主流 CPU產(chǎn)品的性能)與海光 7285 進(jìn)行性能對(duì)比可以發(fā)現(xiàn),在典型場(chǎng)景下,公司最新一代 CPU相關(guān)產(chǎn)品均已接近國際同類高端產(chǎn)品水平。
5、兆芯“開先、開勝”處理器
兆芯自主研發(fā)的通用處理器產(chǎn)品涵蓋“開先”、“開勝”兩大系列,具備良好的操作系統(tǒng)和軟硬件兼容性,生態(tài)體系成熟,支持構(gòu)建臺(tái)式機(jī)、筆記本、一體機(jī)、云終端等多種類型的桌面整機(jī)以及服務(wù)器、存儲(chǔ)等產(chǎn)品。此外,在嵌入式領(lǐng)域,也已經(jīng)有不同規(guī)格基于兆芯通用處理器的工業(yè)主板、模塊化電腦、工業(yè)整機(jī)、Box PC、工業(yè)級(jí)服務(wù)器、網(wǎng)絡(luò)安全平臺(tái)等產(chǎn)品陸續(xù)推出。
開先 KX-6000/開勝 KH-30000 系列處理器是業(yè)內(nèi)第一款完整集成 CPU、GPU、芯片組的SoC 單芯片國產(chǎn)通用處理器,這為整機(jī)系統(tǒng)的開發(fā)提供了較大的便利條件,同時(shí)也更利于控制成本。 ? 通過 KX-6000 系列處理器橫向?qū)Ρ龋? 核心的 KX-U6780A 產(chǎn)品性能與第七代的 4 核心英特爾 i5 整體水平仍存在差距,尤其是單核性能不足 7 代 i5 一半,但整數(shù)性能方面對(duì)英特爾 i5 實(shí)現(xiàn)了反超。
6、龍芯LoongISA 指令系統(tǒng)
龍芯中科采用自主LoongISA 指令系統(tǒng),兼容 MIPS 指令,所有 IP 模塊皆為自主設(shè)計(jì),擁有片內(nèi)安全機(jī)制,可信性高。龍芯處理器以 32 位核 64 位單核及多核 CPU/SOC 為主,主要面向高端嵌入式、個(gè)人電腦、服務(wù)器和高性能機(jī)等應(yīng)用。2002 年 8 月誕生的“龍芯一號(hào)”是我國首枚擁有自主知識(shí)產(chǎn)權(quán)的通用高性能微處理芯片。 ? 龍芯 1 號(hào)系列為低功耗、低成本的專用嵌入式 SoC 或MCU 處理器;龍芯 2 號(hào)系列為低功耗通用處理器,采用單芯片 SoC 設(shè)計(jì),應(yīng)用場(chǎng)景面向工業(yè)控制與終端等領(lǐng)域;龍芯 3 號(hào)系列為高性能通用處理器,通常集成 4 個(gè)及以上 64 位高性能處理器核,與橋片配套使用,應(yīng)用場(chǎng)景面向桌面和服務(wù)器等信息化領(lǐng)域,對(duì)標(biāo) Intel的酷睿/至強(qiáng)系列。
LoongArch 具有較強(qiáng)的擴(kuò)展性和自主性。LoongArch 包括基礎(chǔ)架構(gòu)部分和向量指令、虛擬化、二進(jìn)制翻譯等擴(kuò)展部分近 2000 條指令,具有較好的擴(kuò)展性。自主性方面,LoongArch 指令系統(tǒng)從整個(gè)架構(gòu)的頂層規(guī)劃,到各部分的功能定義,再到每條指令的編碼、名稱、含義,都進(jìn)行了自主設(shè)計(jì),具有充分的自主可靠性。
基于自主指令系統(tǒng)(LoongArch)的 3A5000/3B5000 是龍芯當(dāng)前重點(diǎn)發(fā)展產(chǎn)品。龍芯3A5000/3B5000 是面向個(gè)人計(jì)算機(jī)、服務(wù)器等信息化領(lǐng)域的通用處理器,基于龍芯自主指令系統(tǒng)(LoongArch)的 LA464 微結(jié)構(gòu),并進(jìn)一步提升頻率,降低功耗,優(yōu)化性能。
從 3A5000 在 SPEC CPU 2006 BASE 性能測(cè)試中的表現(xiàn)來看,龍芯 3A5000 單核定點(diǎn)為25.1 分,單核浮點(diǎn)為 26 分。相比 intel i5 9500 六核 14nm 的確有不小的差距,但單核定點(diǎn)與國產(chǎn) ARM V8 四核 7nm 處理器不相上下,單核浮點(diǎn)略優(yōu)于國產(chǎn) ARM V8 四核 7nm 處理器。龍芯 3A5000 對(duì)比國產(chǎn) ARM V8 八核 14nm 處理器的單核定點(diǎn)則高出近 10 分,單核浮點(diǎn)則高出近一倍。多線程測(cè)試中,intel i5 9500 六核 14nm 處理器依然表現(xiàn)最佳,而龍芯 3A5000 的多核定點(diǎn)與多核浮點(diǎn)均高于國產(chǎn) ARM V8 四核 7nm處理器,由于國產(chǎn) ARM V8 八核 14nm 處理器核心數(shù)量上具有一定的優(yōu)勢(shì),因此定點(diǎn)和浮點(diǎn)的分?jǐn)?shù)要高于龍芯 3A5000 和國產(chǎn) ARM V8 四核 7nm 處理器。
7、申威Alpha 指令處理器
申威處理器以 Alpha 指令集為基礎(chǔ)進(jìn)行拓展,高度自主可控。Alpha 指令集由美國 DEC公司研制,主要用于 64 位的 RISC 微處理器。 ? 江南計(jì)算所基于原來的 Alpha 指令集,開發(fā)出了更多的自主知識(shí)產(chǎn)權(quán)的指令集,并研制了申威指令系統(tǒng),推出了申威處理器。申威處理器是在國家"核高基"重大專項(xiàng)支持下,由上海高性能集成電路中心研制的全國產(chǎn)處理器。首顆申威處理器代號(hào)“SW-1”,于 2006 年研制成功,“SW-1”基于 DEC公司 Alpha 架構(gòu),130nm 制程,主頻為 900MHz。
申威在研發(fā)出第一代基于 Alpha 指令集的 CPU 后,將指令集替換為自研的自主可控申威 64 位指令集,完全區(qū)別于原有 Alpha 指令集。申威處理器專注于高性能計(jì)算,尤其是在服務(wù)器領(lǐng)域,浮點(diǎn)運(yùn)算算力與同期外國處理器相當(dāng)。申威 SW26010 是中國首個(gè)采用國產(chǎn)自研架構(gòu)且性能強(qiáng)大的計(jì)算機(jī)芯片。
申威 26010 處理器的峰值性能大于每秒 12.5 萬萬億次浮點(diǎn)運(yùn)算結(jié)果,峰值速度、持續(xù)性能、性能功耗比排在世界前列。 ? 2016 年,搭載了 40960 顆申威 SW26010 并運(yùn)行國產(chǎn)操作系統(tǒng)神威睿思的神威太湖之光獲得全球超級(jí)計(jì)算機(jī)第一名,神威太湖之光峰值計(jì)算速度達(dá)每秒 12.54 億億次,是全球首臺(tái)峰值計(jì)算速度超過十億億次的超級(jí)計(jì)算機(jī),持續(xù)性能為每秒 9.3 億億次,軟件硬件并行,均為申威自主設(shè)計(jì)。
申威 8A 芯片采用最新的第四代申威處理器核心(簡(jiǎn)稱 Core4)。Core4 核心繼續(xù)采用超標(biāo)量流水線結(jié)構(gòu),支持亂序發(fā)射、亂序執(zhí)行、推測(cè)執(zhí)行,并首次采用 SMT 技術(shù),支持每個(gè)核心同時(shí)運(yùn)行兩個(gè)線程。申威 831 相比上一代 4 核 CPU 申威 421 在功耗相當(dāng)?shù)那疤嵯拢阅芴嵘?2 倍以上,下一代產(chǎn)品申威 4E 相比申威 831 性能再提升 50%以上,與 Intel 中端桌面處理器相當(dāng);申威下一代服務(wù)器產(chǎn)品威鑫 8A 與 Intel 中端服務(wù)器處理器相當(dāng)。 ? ?
編輯:黃飛
?
評(píng)論
查看更多