到目前為止,亞馬遜和其他大型云運(yùn)營商幾乎全部使用英特爾的 Xeon 芯片。雖然在服務(wù)器芯片市場(chǎng),英特爾市場(chǎng)占有率非常高,但亞馬遜正使用折扣策略來贏得客戶。亞馬遜表示,基于 Graviton 的云服務(wù)比英特爾處理器上運(yùn)行的現(xiàn)有產(chǎn)品「成本低得多」,具體在某些處理任務(wù)上,能夠減少 45% 的成本。
智能網(wǎng)卡與服務(wù)器處理器有何區(qū)別?如果你指的是亞馬遜云服務(wù)(Amazon Web Services),兩者大概相差三年。在西雅圖總部,公有云市場(chǎng)大佬亞馬遜 re:Invent 2018 大會(huì)現(xiàn)場(chǎng),亞馬遜推出了基于 ARM 架構(gòu)的 Graviton 服務(wù)器處理器。除去已經(jīng)在 AWS 運(yùn)行的 Intel Xeon 和 AMD Epyc 處理器,Annapurna Labs 表示 Graviton 還支持 EC2 虛擬計(jì)算服務(wù)。2015 年,亞馬遜以 3.5 億美元收購 Annapurna Labs。早些時(shí)候,亞馬遜從 Calxeda 挖來了幾名員工,Calxeda 是一家致力于開發(fā)基于 ARM 架構(gòu)服務(wù)器系統(tǒng)的初創(chuàng)公司。
過去一年的 ARM 服務(wù)器市場(chǎng)波譎云詭:先是高通宣布放棄 Centriq 2400;Ampere(獲得私募基金 The Carlyle Group 投資)搶先收購 X-Gene,讓 Applied Micro 終于獲得喘息之機(jī)。如此看來,AWS 創(chuàng)造了自己的服務(wù)器芯片,放棄使用目前 ARM 架構(gòu)服務(wù)器市場(chǎng)最領(lǐng)先的 Marvell(前身為 Cavium)ThunderX2 芯片,就顯得尤為重要。然而,這并不代表 Marvell 或者 Ampere──如果未來實(shí)現(xiàn)了超強(qiáng)浮點(diǎn)并行處理,擁有 A64FX 處理器(48 核且具備可伸縮矢量擴(kuò)展)的富士通也將縱橫 ARM 市場(chǎng)──ARM 芯片未來在 AWS 公有云市場(chǎng)一定毫無作為。我們認(rèn)為 AWS 已經(jīng)在 Annapurna Labs 中研發(fā)「Alpine」系列雙核及四核 ARM 芯片,為自己的服務(wù)器集群創(chuàng)造 SmartNIC。SmartNIC 是服務(wù)器集群不可或缺的。除了 EC2 上的 Xeon、 Epyc 和現(xiàn)在的 Graviton 處理器的操作系統(tǒng)和應(yīng)用之外,服務(wù)器集幾乎能卸載所有功能,使得公有云計(jì)算核心可以極大程度上運(yùn)行應(yīng)用。雖然之前說過,但我們還是想再次強(qiáng)調(diào):大部分 Hyperscaler 和云構(gòu)建仍依賴 SmartNIC 的發(fā)展。由于 InfiniBand 網(wǎng)絡(luò)具備搭配智能網(wǎng)卡 GeniusNIC(Mellanox Technology 的命名雖然有些玩笑意味,但能看得出企圖心)的卸載模型,HPC 中心能夠進(jìn)一步提升價(jià)值。最終,Mellanox Technology 的落后也是由于相同的原因:Hyperscaler 和 HPC 中心經(jīng)常采用卸載計(jì)算。核心計(jì)算十分昂貴,相對(duì)而言,卸載計(jì)算就不一樣了。
2016 年 1 月,亞馬遜與 Annapurna Labs 發(fā)布了 32 位 Armv7 與 64 位 Armv8 設(shè)計(jì),兩者已達(dá)到「企業(yè)級(jí)性能與特征」,如支持 DDR4 內(nèi)存、2MB 二級(jí)緩存。自那以后,再?zèng)]有透露好更多關(guān)于「Alpine」系列芯片的消息。Arm Holdings 生產(chǎn)的基于 Cortex-A15 核心的雙核及四核 32 位元件,其主頻分別達(dá)到 1.4 GHz 與 1.7 GHz;基于 Cortex-A57 設(shè)計(jì)的四核元件,主頻達(dá)到 1.7 GHz。上述 Arm Cortex 核心支持超標(biāo)量通道及亂序執(zhí)行,但并不具備超線程。這些設(shè)備的進(jìn)給量與速度并沒有任何特別之處,由于 Amazon 并未公布任何細(xì)節(jié),我們不展開討論具體架構(gòu)。但我們推測(cè)有兩點(diǎn)非常不可思議:亞馬遜如何生產(chǎn)這些廉價(jià)設(shè)備;亞馬遜如何運(yùn)用服務(wù)器卸載計(jì)算以使得服務(wù)器、網(wǎng)絡(luò)及存儲(chǔ)更加高效。主流廠商的策略確定無疑:Mellanox 主推 Bluefield 多核 ARM 處理器,微軟在 Azure 公有云的服務(wù)器上使用 FPGA 作為網(wǎng)絡(luò)加速及計(jì)算引擎,Netronome 主推 Agilio 網(wǎng)絡(luò)適配器。
AWS 全球基礎(chǔ)設(shè)施及客戶支持業(yè)務(wù)副總裁 Peter DeSantis 在 re:Invent 2018 大會(huì)介紹了 Graviton Arm 服務(wù)器的工藝。雖然我們不清楚 Graviton 芯片,Graviton 看起來是一個(gè)更加實(shí)用的處理器,其與 Intel Skylake Xeon-D-2100 v2 類似,搭配 8 到 18 個(gè)核心,主頻在 1.6 GHz 與 2.3 GHz 之間(通常核心數(shù)越多,時(shí)鐘頻率越低)。如果打開 AWS 網(wǎng)站,大家會(huì)發(fā)現(xiàn)一句申明「Gravitons 基于 64 位 Neoverse 核心」,這幾乎能斷定 Cosmos 核心是定制的。Cosmos 包含 ARM Cortex-A72 與 Cortex-A75 設(shè)計(jì)的微調(diào)版本,意圖達(dá)到 16 納米芯片工藝水平,其代工廠很可能是***半導(dǎo)體制造公司(Taiwan Semiconductor Manufacturing Corp)。大家回想下,Arm 發(fā)布的 Neoverse 正是 10 月曾發(fā)布的數(shù)據(jù)中心 Arm 芯片的翻版,其每年性能提高幅度達(dá)到 30%,并將在 2021 年前完成 7 納米到 5 納米制造工藝的升級(jí)。所有 AWS 的公開信息表示,通過 EC2 A1 讓業(yè)界熟悉的 Graviton 處理器,最多支持 16 個(gè)虛擬 CPU、32GB 主內(nèi)存,服務(wù)器適配器的網(wǎng)絡(luò)帶寬達(dá)到 10 Gb/秒,彈性塊存儲(chǔ)(EBS)帶寬達(dá)到 3.5 Gb/秒。當(dāng)我們想了解更多技術(shù)細(xì)節(jié)時(shí),AWS 并未確認(rèn)目前使用哪個(gè) Cosmos 核心,亦未確認(rèn) Graviton 具備 16 個(gè)核心且無法通過同步多線程(SMT)為各個(gè)核心提供虛擬多線程。(SMT 支持通常由 ARM 許可證持有用戶添加,尚未成為 ARM 基本內(nèi)核許可證部分。隨著 2019 年「Ares」內(nèi)核到期,情況可能會(huì)改變。)AWS 向 The Next Platform 確認(rèn),EC2 A1 具備 Graviton 芯片,主頻達(dá) 2.3 GHz。單就整數(shù)計(jì)算而言,Graviton 已能與 Xeon-D 抗衡,或許達(dá)到了 Xeon SP 的下限水平。不同 A1 的進(jìn)給量和速度如下:
我們推斷內(nèi)存及內(nèi)存帶寬不多,可能只有一個(gè)內(nèi)存控制器和兩個(gè)內(nèi)存通道,最高容量 512 GB,搭配十分昂貴的 128 GB 記憶棒,即便使用便宜的 8 GB 記憶棒也可輕松達(dá)到 32GB。Annapurna Labs 可能在芯片上放置了大量內(nèi)存你控制器,我們認(rèn)為其并不支持 SMT,推斷芯片上具備 16 個(gè)內(nèi)核。一個(gè)內(nèi)存控制器搭配八個(gè)核心是很好的平衡選擇,但如果大家想讓計(jì)算能力和內(nèi)存帶寬恢復(fù)平衡,四個(gè)內(nèi)存控制器的效果甚至?xí)?。(考慮到 AWS 并未大肆炫耀,該項(xiàng)可能仍未實(shí)現(xiàn)。)A1 采用 Amazon Linux 2 系統(tǒng)(紅帽 Linux 與亞馬遜 CentOS 克隆版結(jié)合的自研升級(jí)系統(tǒng)),亦支持 RHEL 和 Ubuntu 服務(wù)器系統(tǒng),未來將支持其他操作系統(tǒng)──如果以后 AWS Arm 服務(wù)器芯片支持 Windows Server,應(yīng)該十分有趣?;?Arm 的 A1 EC2 目前在美國東部、西部及歐洲(愛爾蘭)等區(qū)域可用,訂購類型一般涵蓋 On-Demand、 Reserved、Spot、Dedicated 及 Dedicated Host。AWS 特別提醒,上述 A1 實(shí)際應(yīng)用于內(nèi)存帶寬不做特別限制的橫向擴(kuò)展工作負(fù)載,如 Web 服務(wù)器、開發(fā)環(huán)境、緩存服務(wù)器或容器化微服務(wù)等輕量化及無狀態(tài)服務(wù)。AWS 表示與 EC2 上同等性能的 32 位服務(wù)相比,這些服務(wù)成本能降低到 45%。不過,AWS 并未說明具體的比較對(duì)象。劃重點(diǎn)了。我們來看看 Arm 服務(wù)器之于基礎(chǔ)設(shè)備的野心有多大。毫無疑問,A1 會(huì)有無數(shù)的衍生版本。對(duì)于支持極有可能成為下一代智能網(wǎng)卡處理器的發(fā)展來說,這是件好事。算上基于 Arm 的 A1,AWS 還在 EC2 主題上研發(fā)了一些其它基礎(chǔ)設(shè)施變體。新一代 C5 服務(wù)在這些變體之間的以太網(wǎng)速率達(dá)到每秒 100Gb,適用于那些帶寬依賴的 HPC 仿真建模、機(jī)器學(xué)習(xí)訓(xùn)練及密集數(shù)據(jù)分析工作。如同 C5 和 C5d,C5n 基于雙插槽服務(wù)器節(jié)點(diǎn),搭配定制 Skylake Xeon SP 8000 Platinum 系列處理器,各芯片可能具備 18 個(gè)內(nèi)核且主頻達(dá)到 3 GHz。
除了額外帶寬之外,C5n 的數(shù)據(jù)隊(duì)列是 C5 和 C5d 的數(shù)倍至多──32 比 8 的彈性網(wǎng)絡(luò)接口(Elastic Network Interface,應(yīng)用于 Annapurna 處理器,布置在網(wǎng)卡附近,使其更加智能──幫助網(wǎng)絡(luò)適配器中數(shù)據(jù)更快的在內(nèi)核中流轉(zhuǎn)。無論是單個(gè)可用范圍或區(qū)域內(nèi)跨越多個(gè)可用范圍,帶寬在同一區(qū)域內(nèi)都可用)。C5n 可用于 EC2 及其他服務(wù)器集群,與 S3 對(duì)象存儲(chǔ)或 Elastic MapReduce、Relational Database Service 及 ElastiCache 等服務(wù)連接。C5n 與 A1 的可用區(qū)域一致,業(yè)務(wù)范圍還附加美國政府私有云 GovCloud。
最后,去年 10 月 AWS 推出的 P3 GPU 加速服務(wù)使得以太網(wǎng)達(dá)到每秒 100 Gb,服務(wù)器鏈路上限達(dá)到每秒 25 Gb。具有更快網(wǎng)絡(luò)的 P3dn 將于下周推出,其配備 32 GB HBM2 內(nèi)存的 Volta Tesla V100 GPU 加速器,而初代 P3 配備 16 GB HBM2 內(nèi)存的初代 Volta 加速器。上述服務(wù)基于一對(duì)定制 24 核 Xeon SP 處理器,機(jī)箱中最多配備 8 個(gè) GPU。作為最大云計(jì)算提供商的 AWS 提供了 ARM,這對(duì) ARM 來說是一次勝利。在過去五年里,Calxeda、Applied Micro、英偉達(dá)、三星、博通、、Cavium、Marvell、AMD 和高通等多家先驅(qū)投身到 Arm 服務(wù)器芯片的研發(fā)。但發(fā)展到今日,這些想去幾乎全軍覆沒。
Moor Insight & Strategy 的行業(yè)分析師帕特里克·莫爾海德(Patrick Moorhead)上周五在給 CNBC 的郵件中寫道:「AWS 接受 ARM 為 ARM 帶來了可信度,將 ARM 的業(yè)務(wù)擴(kuò)展到更多的云參與者和工作負(fù)載。」盡管亞馬遜的大部分營收仍來自商品銷售,但 AWS 已成為該公司財(cái)務(wù)健康的關(guān)鍵。第三季度,亞馬遜超過一半的營業(yè)利潤來自 AWS。亞馬遜在線商店的收入本季度同比增長 10%,而 AWS 服務(wù)的營收增長了 46%。AWS 現(xiàn)在有超過 125 種服務(wù)可供客戶使用,包括核心的 EC2 計(jì)算服務(wù)。在接下來的幾年里,AWS 可以發(fā)布基于更強(qiáng)大 ARM 芯片的新實(shí)例?,F(xiàn)有實(shí)例使用 ARM 于 2015 年推出的 Cortex-A72 系統(tǒng)。但更重要的是,其他云計(jì)算提供商將可能同樣開始使用 ARM 技術(shù)發(fā)布實(shí)例。
-
芯片
+關(guān)注
關(guān)注
455文章
50851瀏覽量
423985 -
英特爾
+關(guān)注
關(guān)注
61文章
9974瀏覽量
171824 -
亞馬遜
+關(guān)注
關(guān)注
8文章
2667瀏覽量
83395
原文標(biāo)題:性價(jià)比高出英特爾45%,亞馬遜的云服務(wù)器芯片如何做到?| 解讀
文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論