Marvell最新推出了新一代的ARM服務(wù)器芯片Thunder X3,使用臺(tái)積電7nm工藝制造,核心數(shù)量達(dá)到96核,同時(shí)繼續(xù)支持四線程,IPC性能比ThunderX2提升超過(guò)25%,是一次全面的革新與巨大的提升。
在半導(dǎo)體領(lǐng)域,Marvell(美滿電子)公司略顯低調(diào),但又是那種遮不住光芒的實(shí)力型公司。Marvell成立于1995年,目前全球員工數(shù)量超過(guò)5000名,核心業(yè)務(wù)主要聚焦在基礎(chǔ)設(shè)施半導(dǎo)體方案,包括存儲(chǔ)、網(wǎng)絡(luò)、計(jì)算三大領(lǐng)域,2020財(cái)年總收入高達(dá)27億美元。
Mavell旗下?lián)碛型暾?a href="http://www.wenjunhu.com/v/tag/132/" target="_blank">CPU產(chǎn)品線,包括Armada、Octeon TX、ThunderX等多種類型的處理器。2017年Mavell收購(gòu)了Cavium(凱為半導(dǎo)體)公司,Cavium此前擁有15年以上的高性能計(jì)算多核CPU的技術(shù)積累,在基于ARM架構(gòu)的嵌入式服務(wù)器領(lǐng)域經(jīng)驗(yàn)豐富,這幫助Marvell公司在該領(lǐng)域繼續(xù)保持領(lǐng)先。
目前,Marvell已為客戶交付上億顆CPU芯片,旗下基于ARM架構(gòu)的服務(wù)器處理器ThunderX在全球獲得廣泛部署,Marvell已經(jīng)成為全球最大的ARM服務(wù)器處理器供應(yīng)商。
前不久,Marvell推出了新一代的ARM服務(wù)器芯片Thunder X3,不僅使用了更先進(jìn)的臺(tái)積電7nm工藝制造,升級(jí)為ARM v8.3指令集,核心數(shù)量也達(dá)到了驚人的96核,同時(shí)繼續(xù)支持四線程,帶來(lái)可觀的性能提升,令業(yè)界矚目。
近日我們與Marvell半導(dǎo)體公司副總裁及服務(wù)器處理器部總經(jīng)理Gopal Hegde以及Marvell半導(dǎo)體公司服務(wù)器處理器部產(chǎn)品營(yíng)銷高級(jí)總監(jiān)周立新進(jìn)行了在線訪談,就Thunder X3的產(chǎn)品信息以及Marvell在ARM服務(wù)市場(chǎng)方面的布局進(jìn)行了交流。
·應(yīng)用場(chǎng)景發(fā)生變化 ARM服務(wù)器工藝制程已經(jīng)領(lǐng)先
在服務(wù)器領(lǐng)域,尤其是大規(guī)模數(shù)據(jù)中心市場(chǎng),基于x86架構(gòu)的處理器長(zhǎng)久以來(lái)都占據(jù)絕對(duì)優(yōu)勢(shì),但近年來(lái)隨著云計(jì)算等應(yīng)用的不斷變化,基于ARM架構(gòu)的服務(wù)器逐漸受到客戶的青睞。
Marvell公司服務(wù)器處理器事業(yè)部產(chǎn)品營(yíng)銷高級(jí)總監(jiān)周立新說(shuō)到,“十幾年前,數(shù)據(jù)中心的規(guī)模還比較小,用戶數(shù)量相對(duì)來(lái)說(shuō)比較少。傳統(tǒng)的業(yè)務(wù)模式對(duì)CPU的要求只聚焦在單線程性能上,對(duì)于并行業(yè)務(wù)的要求不高?,F(xiàn)在,除了繼續(xù)強(qiáng)調(diào)單線程性能,同時(shí)還要強(qiáng)調(diào)并行處理能力,這點(diǎn)在今天尤為重要。而且由于數(shù)據(jù)中心的規(guī)模越來(lái)越大,很多客戶都需要成本最低的解決方案,對(duì)成本、功耗非常敏感,這也是他們對(duì)ARM這樣低功耗、低成本處理器感興趣的原因。”
“另外,現(xiàn)在已經(jīng)不是一個(gè)架構(gòu)解決所有問(wèn)題的時(shí)代。隨著GPU、異構(gòu)計(jì)算架構(gòu)不斷涌現(xiàn),客戶對(duì)基于ARM架構(gòu)的服務(wù)器處理器的興趣也是越來(lái)越高。之前傳統(tǒng)的軟件有很多都是由第三方提供的,比如Oracle提供數(shù)據(jù)庫(kù),很多客戶沒(méi)有源代碼。但現(xiàn)在不一樣,一些超大規(guī)模數(shù)據(jù)中心的工作負(fù)載、應(yīng)用都是有源代碼的,所以能夠很快的解決問(wèn)題,而且還允許改變?cè)创a、改變程序來(lái)加速創(chuàng)新能力。這也對(duì)ARM服務(wù)器的引入帶來(lái)方便,可以更輕松應(yīng)對(duì)兼容性問(wèn)題?!敝芰⑿抡f(shuō)到。
“在X86架構(gòu)幾十年的歷史中,它的單個(gè)CPU核心既要解決服務(wù)器市場(chǎng)的需求,也要解決筆記本市場(chǎng)需求,相當(dāng)于一個(gè)架構(gòu)要解決很多問(wèn)題,并沒(méi)有針對(duì)特定的應(yīng)用有所優(yōu)化。而ARM服務(wù)不同,它是專門為服務(wù)器所做的,不需要支持消費(fèi)級(jí)產(chǎn)品,所以可以實(shí)現(xiàn)高度優(yōu)化的方案?!?/p>
周立新還說(shuō):“另外,與x86相比,ARM服務(wù)在制程工藝方面已經(jīng)領(lǐng)先。例如,英特爾雖然有自己的晶圓廠,但今天量產(chǎn)的仍然是14nm產(chǎn)品,而Marvell是TMSC臺(tái)積電代工的7nm,整整領(lǐng)先了兩代。而AMD的Rome還是非常成功的,但在架構(gòu)方面采用chiplets設(shè)計(jì),雖然核心數(shù)量多,但不是放在一個(gè)die上面做,die與die之間就會(huì)存在延遲、帶寬方面的限制。而Marvell的ARM處理器單核面積與AMD、Intel相比小了許多,集成度更高,功耗、性能也比他們更強(qiáng)。”
·96核心ThunderX3性能大幅提升 并行計(jì)算優(yōu)勢(shì)明顯
Marvell ThunderX3處理器采用臺(tái)積電(TSMC)7nm制程工藝制造,擁有高達(dá)96個(gè)核,每個(gè)核心4個(gè)線程,每個(gè)插槽的總計(jì)算能力達(dá)到384線程。內(nèi)存接口支持8通道DDR4-3200,每個(gè)通道可搭載2個(gè)DIMM。IO擴(kuò)展方面提供了64個(gè)PCIe Gen 4.0通道,搭載 16個(gè)控制器。
Marvell Thunder X3相比Thunder X2性能大幅提升
Marvell官方表示,ThunderX3微架構(gòu)的改進(jìn)使得IPC性能比ThunderX2提升超過(guò)25%,結(jié)合處理器頻率和DDR頻率的提升,單線程性能提升超過(guò)60%,單個(gè)插槽整數(shù)運(yùn)算性能提升最多3倍。在浮點(diǎn)運(yùn)算方面,ThunderX3的每個(gè)核心搭載四個(gè)128位SIMD (Neon) 單元,相比ThunderX2翻倍,因此性能可以增加5倍多。因此,ThunderX3相比ThunderX2可以說(shuō)是全面的革新與巨大的提升。
關(guān)于單核四線程相比單線程的優(yōu)勢(shì),周立新進(jìn)一步說(shuō)到:“我們從3個(gè)標(biāo)準(zhǔn)來(lái)看,一是SPECCPU,這是一個(gè)標(biāo)準(zhǔn)的衡量服務(wù)器的指標(biāo);第二是MySQL,大家都很熟悉的數(shù)據(jù)庫(kù);第三是Web搜索。從性能上看,在這三個(gè)應(yīng)用中四個(gè)線程開了以后跟單線程比,都有明顯提升,尤其在MySQL當(dāng)中最高可以提高80%。所以,四線程對(duì)性能提升還是非常顯著的,從這點(diǎn)來(lái)看,ThunderX3的性能有著比較大的領(lǐng)先?!?/p>
Thunder X3的主要規(guī)格
“Marvell的ARM服務(wù)器處理器主要聚焦超算、云端計(jì)算和原生ARM應(yīng)用這幾個(gè)方面,這些應(yīng)用場(chǎng)景大多要求高度并行、I/O密集、延遲敏感以及ARM原生(移動(dòng)工作負(fù)載)。ThunderX3的目標(biāo)工作負(fù)載(如大數(shù)據(jù)、數(shù)據(jù)庫(kù)、流媒體、Web 層、彈性搜索和云存儲(chǔ))其本質(zhì)上是高度并行。例如,ThunderX3的96顆核心最多可以支持384個(gè)線程,每個(gè)線程就可以作為一個(gè)操作系統(tǒng)運(yùn)行一個(gè)虛擬機(jī),這樣一個(gè)芯片就可以支持384個(gè)虛機(jī)。在“安卓云”的部署中,需要邊緣設(shè)備做加速、做CDN,此時(shí)ThunderX3的并行計(jì)算優(yōu)勢(shì)就體現(xiàn)出來(lái)了?!盙opal Hegde在訪談中這樣說(shuō)到。
“ThunderX3服務(wù)器非常適合在云端或邊緣以容器或虛擬機(jī)的形式運(yùn)行當(dāng)前部署在手機(jī)和ARM終端上的原生ARM應(yīng)用程序。這使得各種新興的應(yīng)用有機(jī)會(huì)成為現(xiàn)實(shí),包括Android云游戲、云端Android和ARM軟件/應(yīng)用程序開發(fā)。由于很多APP就是為了ARM開發(fā)的,所以相比x86架構(gòu)我們更有優(yōu)勢(shì)?!敝芰⑿抡f(shuō)。
還有Arm Native,國(guó)內(nèi)主要是安卓云的業(yè)務(wù)。Marvell目前已經(jīng)有了相應(yīng)的解決方案,不僅能提供硬件設(shè)備,還可以提供包括軟件在內(nèi)的整套解決方案。
“另外,與云計(jì)算類似,超算任務(wù)也有很多都是并行的應(yīng)用,包括天氣預(yù)測(cè)、能源行業(yè)等等。所以多核、多線程是非常適合這些場(chǎng)景。然后超算里面還有很重要一點(diǎn),就是對(duì)內(nèi)存帶寬、延時(shí)的要求非常高,同時(shí)超算的部署密度非常高,所以對(duì)功耗要求也很敏感,ARM處理器在這些方面也具有明顯優(yōu)勢(shì)。在很多實(shí)驗(yàn)室、Oil Gas、CAE、Genomics、EDA等行業(yè),我們都找到了適用性非常強(qiáng),且與x86相比有著明顯競(jìng)爭(zhēng)優(yōu)勢(shì)的方案?!敝芰⑿抡f(shuō)。
·完整生態(tài)支持 ARM服務(wù)器增長(zhǎng)潛力巨大
要知道服務(wù)器市場(chǎng)是一個(gè)跟生態(tài)密切相關(guān)的業(yè)務(wù),終端芯片只是一部分,客戶需要的是從芯片、操作系統(tǒng)、到應(yīng)用層等一整套的解決方案。任何一個(gè)服務(wù)器包括x86,都不是獨(dú)立運(yùn)作的,都需要系統(tǒng)廠商以及各種各樣的硬體配合,包括Memory、HBA等很多外設(shè),還有操作系統(tǒng)、應(yīng)用軟件等一系列的支持,這樣的業(yè)態(tài)才會(huì)成功。
周立新說(shuō):“Marvell目前已經(jīng)有超過(guò)100個(gè)生態(tài)伙伴,從系統(tǒng)廠商到硬件的外設(shè),從軟件到操作系統(tǒng)OS,以及中間的Middleware,這對(duì)我們而言非常重要,我們也很高興看到ARM服務(wù)器生態(tài)還在持續(xù)成長(zhǎng)。
周立新在提到Marvell在ARM服務(wù)器領(lǐng)域所取得的成就時(shí)非常自豪,他表示:“五年前,我們只有三四個(gè)生態(tài)伙伴,剛開始是非常艱難的。過(guò)去兩年,ThunderX2已經(jīng)廣泛部署在了云計(jì)算和HPC市場(chǎng),主要客戶包括Microsoft Azure、桑迪亞國(guó)家實(shí)驗(yàn)室中的 500強(qiáng)超級(jí)計(jì)算機(jī)Astra、美國(guó)能源部的國(guó)家實(shí)驗(yàn)室、英國(guó)萊斯特大學(xué)等等。”
微軟公司Microsoft Azure資深工程師Leendert van Doorn博士曾表示:“微軟Project Olympus云硬件與Marvell ThunderX2服務(wù)器處理器的結(jié)合是一個(gè)里程碑,提升了Azure云基礎(chǔ)設(shè)施中ARM64產(chǎn)品的開發(fā)能力。微軟致力于推動(dòng)平臺(tái)創(chuàng)新,我們對(duì)處理器架構(gòu)的進(jìn)一步支持是我們踐行行業(yè)領(lǐng)導(dǎo)力與最佳實(shí)踐的一部分。與Marvell和鴻佰科技的合作為我們的內(nèi)部使用帶來(lái)了最完整、性能最強(qiáng)的ARM服務(wù)器解決方案?!?/p>
Gopal Hegde說(shuō):“ThunderX2已經(jīng)成為世界上應(yīng)用最廣泛的基于ARM架構(gòu)的服務(wù)器處理器,而且是被一些業(yè)務(wù)規(guī)模非常大的客戶所證明。我們剛才提到的包括美國(guó)和歐洲的超算實(shí)驗(yàn)室,業(yè)務(wù)要求都是非常高的,我們?cè)趯?shí)踐中都已經(jīng)證明。ThunderX3的性能比ThunderX2有更大的提升,目前公開的二十幾個(gè)使用ThunderX2處理器的客戶,已經(jīng)表示將會(huì)繼續(xù)升級(jí)至ThunderX3?!?/p>
三年前ARM曾經(jīng)有過(guò)預(yù)測(cè),大概在2020~2022年的時(shí)候,全球大概會(huì)有20%左右的服務(wù)器將是基于ARM架構(gòu)運(yùn)行的。近年來(lái),包括Ampere、華為等數(shù)家廠商紛紛發(fā)力ARM服務(wù)器市場(chǎng),也充分說(shuō)明ARM生態(tài)的巨大潛力,ARM加速應(yīng)用的時(shí)機(jī)逐漸成熟,生機(jī)勃勃的春天已經(jīng)到來(lái)。
責(zé)任編輯:gt
-
芯片
+關(guān)注
關(guān)注
456文章
51045瀏覽量
425561 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7525瀏覽量
88331 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9262瀏覽量
85766
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論