至少有兩種(可能還有更多種)途徑可以讓Arm處理器在數(shù)據(jù)中心中與現(xiàn)有的Intel和AMD X86處理器競爭。
第一條途徑,也是迄今為止大多數(shù)Arm陣型采用的途徑,那就是基于Arm內(nèi)核和相鄰技術(shù)創(chuàng)建更好的CPU,最終使服務(wù)器的外觀,氣味和品味一直到管理控制器和外圍設(shè)備或多或少像過去二十年來在數(shù)據(jù)中心中普遍使用的X86服務(wù)器。通過這條道路,差異化體現(xiàn)在總吞吐量,價格/性能以及對未來處理器設(shè)計的激進(jìn)節(jié)奏上,英特爾近年來無法通過Xeons交付這些產(chǎn)品,而AMD在其前兩代Epyc處理器上做得相當(dāng)出色。
將Arm服務(wù)器帶入數(shù)據(jù)中心的另一條路徑(當(dāng)然也較少走過)是采用低功率的Arm CPU并構(gòu)建另一種系統(tǒng),該系統(tǒng)不需要當(dāng)今數(shù)據(jù)中心中標(biāo)準(zhǔn)的強大X86處理器,但可以仍然以較低的成本和更高的效率處理大量的分布式計算工作負(fù)載。這是一條固有的風(fēng)險之路,在過去的多年里也有很多人討論,我們現(xiàn)在也正在思考的關(guān)于微服務(wù)器與服務(wù)器權(quán)衡。但是在構(gòu)建了一些試驗性的Arm服務(wù)器以驗證這些想法之后,Bamboo Systems正在從私募股權(quán)(而不是學(xué)術(shù)和政府資金)中籌集第一筆資金,并將嘗試提出基于Arm處理器做低功耗的分布式系統(tǒng)的嘗試。
Bamboo Systems并不是一家新公司,而是一家專注和資金雄厚的公司。該公司的前身是Kaleao,我們在2016年8月就談到了這一點,當(dāng)時曼徹斯特大學(xué)的計算機架構(gòu)教授,前Arm的技術(shù)和系統(tǒng)總監(jiān)John Goodacre從超擴展程序工作負(fù)載到包括HPC工作負(fù)載改變了他基于微服務(wù)器的集群設(shè)計,開啟了一個稱為EuroServer的項目。
三年多以前,Goodacre堅信開發(fā)出許多用于并行化超級計算應(yīng)用程序的關(guān)鍵技術(shù),包括用于跨集群共享工作的消息傳遞接口(MPI)協(xié)議和分區(qū)全局地址空間(PGAS)內(nèi)存。尋址方案。這就可以使得無論運行什么工作負(fù)載,無論是在HPC中心還是超大規(guī)模生產(chǎn)者中,都必須將其集成到將來的百億億次系統(tǒng)的編程模型中。因為沒有其他方法可以同時承載數(shù)百萬個線程。
Goodacre和他的團隊早在2014年就開始了EuroServer項目,該平臺的許多構(gòu)想以及其他一些項目被結(jié)合在一起,創(chuàng)建了一個名為KMAX的商業(yè)產(chǎn)品。現(xiàn)在,他們正在對自己的Bamboo系統(tǒng)進(jìn)行更名,并長期致力于成為系統(tǒng)供應(yīng)商,該系統(tǒng)供應(yīng)商將在正確的時間出現(xiàn)在正確的位置,因為摩爾定律在接下來的十年中最終失效。
第一個KMAX系統(tǒng)于2017年交付,該公司于2014年4月解密了這些設(shè)計,我們在此處詳細(xì)介紹。KMAX集群基于三星開發(fā)的相對適中的Exynos 7420處理器打造,該芯片三星為其智能手機創(chuàng)建的,當(dāng)中包括了來自Arm的運行于2.1 GHz的四核Cortex-A57處理器以及運行于1.5 GHz的四核Cortex-A53。其中Cortex-A53內(nèi)核用于系統(tǒng)和管理功能,只有Cortex-A57內(nèi)核用于計算。Exynos 7420芯片采用三星本身的14納米工藝制造,由它們支持低功耗DDR4主存儲器,并且集成了Mali-T760 MP8 GPU。您可以基于他們一起做很多有趣的工作。
KMAX計算節(jié)點擁有四個Exynos 7420處理器,而該架構(gòu)是Goodacre所謂的“完全融合”,因為該節(jié)點具有捆綁在其上的所有計算,存儲和聯(lián)網(wǎng)功能,并且重要的是使用FPGA,特別是Xilinx的Zync FPGA。它能夠利用嵌入式網(wǎng)絡(luò)支持跨節(jié)點的PGAS和MPI內(nèi)存方案,并從CPU中卸載某些網(wǎng)絡(luò)功能。每個刀片(blade)上都有兩個KMAX節(jié)點,最多12個刀片可裝入一個3U機箱,該機箱具有128個內(nèi)核,64 GB內(nèi)存和2 TB嵌入式閃存的聚合,可提供80 GB /秒的I / O帶寬,在該機箱上每秒處理大約一千萬次I / O操作。每個刀片都可以附加32 TB的NVM-Express閃存存儲。
使用高密度KMAX-HD變體(比標(biāo)準(zhǔn)機架要深一點),單個KMAX機箱就可以完成兩打Dell PowerEdge服務(wù)器的超大規(guī)模工作(緩存,Web服務(wù)等)(可以使用老式的服務(wù)器) ,而功耗為Xeon E5處理器的四分之一,成本僅為三分之一,而空間僅為八分之一。據(jù)推測,將于今年推出的下一代Bamboo Systems機器將達(dá)到或超過這些分?jǐn)?shù)的倍數(shù)。
根據(jù)Goodacre的說法,數(shù)據(jù)中心消耗了當(dāng)今世界3.5%的能源,并且預(yù)計在未來五到十年內(nèi),能源消耗量將增長3倍至5倍。雖然在這些預(yù)測上有一些非常大的誤差線。但關(guān)鍵在于,這是毫無疑問的大量能源,更重要的是,數(shù)據(jù)中心將在今年取代航空業(yè)成為最大的溫室氣體排放來源,到2023年,數(shù)據(jù)中心的消耗量將是航空業(yè)的4倍至5倍。在美國或中國,這可能沒什么大不了的,但是能源效率一直是歐洲計算的更大動力,這些數(shù)字將在歐洲產(chǎn)生更好的共鳴。(這在一定程度上也解釋了為什么Arm像在嵌入式和手持設(shè)備上一樣迅速發(fā)展,以及Goodacre為什么在他所從事的服務(wù)器上做出了開創(chuàng)性的工作。
“服務(wù)器業(yè)務(wù)是一個超過800億美元的市場,這是一個巨大的市場,” Bamboo Systems的新任首席執(zhí)行官Tony Craythorne提醒The Next Platform。Craythorne最近在數(shù)據(jù)管理軟件制造商Komprise負(fù)責(zé)全球銷售,并在Brocade Communications,Hitachi Data Systems和Nexsan負(fù)責(zé)部分業(yè)務(wù)?!拔覀兌贾?,英特爾處理器占據(jù)了服務(wù)器市場的絕大部分。但是在過去的幾年中,有些事情發(fā)生了變化。軟件設(shè)計已經(jīng)從非常高效的C和C ++代碼轉(zhuǎn)變?yōu)樾实偷枚嗟慕忉屨Z言(interpreted languages ),例如Go和Python,以及由容器(containers )和Kubernetes主導(dǎo)的軟件堆棧。同時,人工智能工作負(fù)載(尤其是機器學(xué)習(xí))給英特爾架構(gòu)帶來了極大的壓力,因為它不是為運行那些應(yīng)用程序而設(shè)計的。人們通過處理越來越多的計算來解決這些問題。
我們不知道真實情況,但是,如果Bamboo Systems援引的數(shù)字正確,那么數(shù)據(jù)中心的能耗增長速度將超過聚合數(shù)據(jù)中心計算的增長速度。正如Goodacre 和Craythorne所看到的那樣,這是一個機會。更準(zhǔn)確地說,這就是機會。
但是Bamboo Systems不能只是在KMAX原型機上打一個新標(biāo)簽就可以做到。該公司沒有透露何時更新的微服務(wù)器將從三星處理器轉(zhuǎn)移到一個未指定的,現(xiàn)成的Arm處理器,Goodacre說它“相當(dāng)快”,然后暗示8核到16核之間的某個東西對于單個操作系統(tǒng),映像可能是平衡計算容量,內(nèi)存帶寬以及功耗和散熱的最佳選擇。他補充說,
有些東西與由Amazon Web Services創(chuàng)建的原始16核Graviton處理器類似,但與新的64核Graviton2沒有相似之處。這是他們的目標(biāo)。Goodacre沒透露它是什么芯片,而是說它已經(jīng)在當(dāng)今市場上出售。
Nvidia的Tegra“ Carmel” Arm芯片(嵌入在其“ Xavier” Jetson AGX自動駕駛汽車平臺中)最高達(dá)到八個內(nèi)核。Marvell Armada芯片甚至在Armada 8K和Armada XP高端版本中擁有四個核心。而高通Snapdragon 865的上面有八個“KRYO” 585核心。
高通芯片的可能性很高,但是英偉達(dá)是一種可能性,特別是對于需要一定數(shù)量的GPU內(nèi)存的工作負(fù)載而言。根據(jù)計算需求,沒有理由刀片不能同時具有這兩種功能。(如果我們忘記了清單,這并不意味著它是詳盡的清單。)
多年來,我們在The Next Platform上看到了許多有趣的微服務(wù)器風(fēng)格的處理器和系統(tǒng)來回走動,而現(xiàn)在我們問了過去幾年來的相同問題:為什么現(xiàn)在不行,為什么現(xiàn)在仍然可以工作呢?過去呢?
“我認(rèn)為關(guān)鍵是您必須使軟件相同,” Goodacre解釋說?!叭藗儗嶋H上只將系統(tǒng)視為它們軟件的制程,因此,如果軟件相同,那么一切都好辦很多?!?/p>
Goodacre和Craythorne都明白,企業(yè)需要花費一些時間來測試Bamboo系統(tǒng)架構(gòu)中的想法,并在其堆棧中找到正確的應(yīng)用程序進(jìn)行測試,然后投入生產(chǎn)。因此,該公司將專注于機器學(xué)習(xí)和人工智能,物聯(lián)網(wǎng)和邊緣計算,智能存儲,Web基礎(chǔ)設(shè)施,內(nèi)容交付和數(shù)據(jù)分析應(yīng)用程序。
同樣重要的是,將使客戶能夠輕松使用平臺測試機器,以便他們能夠最終發(fā)展為概念驗證并投入生產(chǎn)。Bamboo Systems的目標(biāo)是長期的,并且與其同名產(chǎn)品一樣,它希望能夠以穩(wěn)定,有機的步伐扎根并傳播。
該公司對我來說,對于經(jīng)銷商來說,在該系統(tǒng)中期望獲得的利潤要比X86服務(wù)器市場所能得到的利潤要多得多。我們都知道,過去十年或更長時間里,誰在X86服務(wù)器利潤中占了最大份額——英特爾。
最后一點:將Arm處理器帶入服務(wù)器的第三種方式是AWS通過其Nitro SmartNIC來完成的,該方式從處理器上分擔(dān)了存儲和網(wǎng)絡(luò)功能。而且,您可以將SmartNIC與上面提到的或強或弱的Arm處理器結(jié)合使用。
-
處理器
+關(guān)注
關(guān)注
68文章
19390瀏覽量
230598 -
ARM
+關(guān)注
關(guān)注
134文章
9143瀏覽量
368379 -
amd
+關(guān)注
關(guān)注
25文章
5485瀏覽量
134403
發(fā)布評論請先 登錄
相關(guān)推薦
評論