電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在近期舉辦的Re:Invent大會上,亞馬遜為其AWS云服務(wù)公布了上線全新的EC2實(shí)例,分別是C7gn、HPC7g和R7iz。R7iz用到了英特爾最新的第四代Xeon Scalable處理器Sapphire Rapids,而HPC7g則是由新處理器Graviton3E來驅(qū)動的。與此同時(shí),AWS還在本次會議上公布了第五代Nitro芯片Nitro v5和第二代推理芯片AWS Inferentia 2,其中Graviton3E和Nitro v5都是基于Arm架構(gòu)打造的。
性能更上一層樓的Graviton3E
在HPC領(lǐng)域,Arm的出鏡率還是比較低的,除了像富岳超算這樣的頂級存在外,我們很少看到云服務(wù)廠商基于Arm芯片來打造HPC計(jì)算集群,Graviton的出現(xiàn)可謂改變了這一點(diǎn)。AWS在2020年推出的C6gn實(shí)例,就是基于其Graviton2處理器打造的,相較基于第二代AMD EPYC處理器的C5實(shí)例,C6gn做到了成本低上20%,性能卻高上40%的表現(xiàn)。
Graviton3E在不同負(fù)載下的性能提升 / 亞馬遜
根據(jù)亞馬遜給出的數(shù)據(jù),Graviton3E在Graviton3的基礎(chǔ)上再加改良,以測試浮點(diǎn)性能的基準(zhǔn)HPL為例,Graviton3E將矢量指令處理性能再度提高了35%。而HPC7g實(shí)例相比基于Graviton2的C6gn實(shí)例,更是將浮點(diǎn)性能拔高至兩倍,比基于第3代AMD EPYC 7003系列48核處理器的HPC6a實(shí)例,性能上也能高出20%,可以說是AWS上性價(jià)比最高的HPC實(shí)例了。
如今的亞馬遜已經(jīng)有了100多個不同的Graviton實(shí)例,供使用者靈活選擇。而且讓Graviton充分發(fā)揮作用的不僅是AWS EC2這樣的彈性計(jì)算云服務(wù),還有Fargate這樣無需管理實(shí)例的服務(wù),也獲得了不小的性能提升。
然而對于大部分云服務(wù)廠商來說,他們首推的實(shí)例很多依然是基于x86的,這不禁讓人深思,真的會有大型公司選擇了Arm服務(wù)器芯片嗎?亞馬遜給出了肯定的答案,也介紹了Graviton極快的普及速度。
從亞馬遜給出的合作伙伴中,我們可以看到大宇無限、Epic、Lyft、Zoom等公司,都選了圍繞Graviton芯片來構(gòu)造他們的產(chǎn)品服務(wù)。比如美國電視串流服務(wù)DirectTV在使用Graviton 3的實(shí)例后,成本減少了20%的同時(shí),延遲也有了最高50%的降低,使得他們能在訪問流量變化巨大的同時(shí)靈活擴(kuò)展容量,還能保證性能不受影響。
加劇DPU和AI芯片內(nèi)卷的Nitro和Inferentia
對于多數(shù)超大規(guī)模數(shù)據(jù)中心和云服務(wù)廠商來說,他們的DPU往往來自第三方,比如英偉達(dá)的BlueField、AMD的Pensando等,而亞馬遜旗下的Annapurna Labs,則成了AWS DPU產(chǎn)品的Nitro的幕后功臣。
Nitro v5芯片 / 亞馬遜
而這次Annapurna Labs設(shè)計(jì)的Nitro v5在性能上再度實(shí)現(xiàn)了飛躍,亞馬遜展示的數(shù)據(jù)上提到,Nitro v5相較上一代集成了兩倍的晶體管數(shù)目,在算力上提升近兩倍,擁有快上50%的DRAM速度,PCIe帶寬也提升至兩倍。由此可以看出,Nitro v5應(yīng)該選擇了更先進(jìn)的工藝,DRAM和PCIe也換成了最新一代。
在實(shí)際測試中,Nitro v5可以提高最多60%的吞吐量,降低30%的延遲,在能效比上也有了40%的提升。正是因?yàn)橛兄@樣強(qiáng)大的性能,AWS選擇了將其集成到C7gn、HPC7g實(shí)例中去,與Graviton3和Graviton3E一起實(shí)現(xiàn)200Gbps的超高網(wǎng)絡(luò)性能。
大型語言模型的出現(xiàn)推動深度學(xué)習(xí)進(jìn)入了下一個階段,但龐大的參數(shù)量加大了推理所需的算力和成本。2019年,AWS的Inferentia芯片第一代出現(xiàn)在Inf1實(shí)例上,為用戶提供了性價(jià)比優(yōu)于GPU實(shí)例的選項(xiàng),但彼時(shí)的深度學(xué)習(xí)模型還大多數(shù)停留在數(shù)百萬個,如今某些深度學(xué)習(xí)模型的參數(shù)已經(jīng)超過了數(shù)百億,比如百度的PLATO-XL對話生成模型、亞馬遜的AlexaTM等。
為此,Annapurna Labs拿出了全新的Inferentia2芯片,最高可支持到1750億參數(shù)的大型深度學(xué)習(xí)模型?;贗nferentia2芯片的Inf2實(shí)例也首次支持到分布式推理,將大型模型分布到多個芯片上進(jìn)行推理。與上一代Inf1實(shí)例相比,Inf2可以提供高達(dá)4倍的吞吐量和10分之一的延遲,與GPU實(shí)例相比更是將能效提高了50%之多。
小結(jié)
這樣頻繁的芯片發(fā)布節(jié)奏,足以看出亞馬遜在自研服務(wù)器芯片上已經(jīng)到了一個新的高度。不得不承認(rèn),亞馬遜早在2016年就收購Annapurna Labs是一個多么具有前瞻性的戰(zhàn)略決策,在云服務(wù)廠商競爭愈演愈烈的當(dāng)下,擁有自研可控的服務(wù)器芯片無疑是殺手锏。雖然谷歌、阿里巴巴等廠商也都加入到了自研服務(wù)器芯片的行列中來,但與亞馬遜的AWS相比,在產(chǎn)品陣容和布局時(shí)間上還是有所差距。
性能更上一層樓的Graviton3E
在HPC領(lǐng)域,Arm的出鏡率還是比較低的,除了像富岳超算這樣的頂級存在外,我們很少看到云服務(wù)廠商基于Arm芯片來打造HPC計(jì)算集群,Graviton的出現(xiàn)可謂改變了這一點(diǎn)。AWS在2020年推出的C6gn實(shí)例,就是基于其Graviton2處理器打造的,相較基于第二代AMD EPYC處理器的C5實(shí)例,C6gn做到了成本低上20%,性能卻高上40%的表現(xiàn)。
Graviton3E在不同負(fù)載下的性能提升 / 亞馬遜
根據(jù)亞馬遜給出的數(shù)據(jù),Graviton3E在Graviton3的基礎(chǔ)上再加改良,以測試浮點(diǎn)性能的基準(zhǔn)HPL為例,Graviton3E將矢量指令處理性能再度提高了35%。而HPC7g實(shí)例相比基于Graviton2的C6gn實(shí)例,更是將浮點(diǎn)性能拔高至兩倍,比基于第3代AMD EPYC 7003系列48核處理器的HPC6a實(shí)例,性能上也能高出20%,可以說是AWS上性價(jià)比最高的HPC實(shí)例了。
如今的亞馬遜已經(jīng)有了100多個不同的Graviton實(shí)例,供使用者靈活選擇。而且讓Graviton充分發(fā)揮作用的不僅是AWS EC2這樣的彈性計(jì)算云服務(wù),還有Fargate這樣無需管理實(shí)例的服務(wù),也獲得了不小的性能提升。
然而對于大部分云服務(wù)廠商來說,他們首推的實(shí)例很多依然是基于x86的,這不禁讓人深思,真的會有大型公司選擇了Arm服務(wù)器芯片嗎?亞馬遜給出了肯定的答案,也介紹了Graviton極快的普及速度。
從亞馬遜給出的合作伙伴中,我們可以看到大宇無限、Epic、Lyft、Zoom等公司,都選了圍繞Graviton芯片來構(gòu)造他們的產(chǎn)品服務(wù)。比如美國電視串流服務(wù)DirectTV在使用Graviton 3的實(shí)例后,成本減少了20%的同時(shí),延遲也有了最高50%的降低,使得他們能在訪問流量變化巨大的同時(shí)靈活擴(kuò)展容量,還能保證性能不受影響。
加劇DPU和AI芯片內(nèi)卷的Nitro和Inferentia
對于多數(shù)超大規(guī)模數(shù)據(jù)中心和云服務(wù)廠商來說,他們的DPU往往來自第三方,比如英偉達(dá)的BlueField、AMD的Pensando等,而亞馬遜旗下的Annapurna Labs,則成了AWS DPU產(chǎn)品的Nitro的幕后功臣。
Nitro v5芯片 / 亞馬遜
而這次Annapurna Labs設(shè)計(jì)的Nitro v5在性能上再度實(shí)現(xiàn)了飛躍,亞馬遜展示的數(shù)據(jù)上提到,Nitro v5相較上一代集成了兩倍的晶體管數(shù)目,在算力上提升近兩倍,擁有快上50%的DRAM速度,PCIe帶寬也提升至兩倍。由此可以看出,Nitro v5應(yīng)該選擇了更先進(jìn)的工藝,DRAM和PCIe也換成了最新一代。
在實(shí)際測試中,Nitro v5可以提高最多60%的吞吐量,降低30%的延遲,在能效比上也有了40%的提升。正是因?yàn)橛兄@樣強(qiáng)大的性能,AWS選擇了將其集成到C7gn、HPC7g實(shí)例中去,與Graviton3和Graviton3E一起實(shí)現(xiàn)200Gbps的超高網(wǎng)絡(luò)性能。
大型語言模型的出現(xiàn)推動深度學(xué)習(xí)進(jìn)入了下一個階段,但龐大的參數(shù)量加大了推理所需的算力和成本。2019年,AWS的Inferentia芯片第一代出現(xiàn)在Inf1實(shí)例上,為用戶提供了性價(jià)比優(yōu)于GPU實(shí)例的選項(xiàng),但彼時(shí)的深度學(xué)習(xí)模型還大多數(shù)停留在數(shù)百萬個,如今某些深度學(xué)習(xí)模型的參數(shù)已經(jīng)超過了數(shù)百億,比如百度的PLATO-XL對話生成模型、亞馬遜的AlexaTM等。
為此,Annapurna Labs拿出了全新的Inferentia2芯片,最高可支持到1750億參數(shù)的大型深度學(xué)習(xí)模型?;贗nferentia2芯片的Inf2實(shí)例也首次支持到分布式推理,將大型模型分布到多個芯片上進(jìn)行推理。與上一代Inf1實(shí)例相比,Inf2可以提供高達(dá)4倍的吞吐量和10分之一的延遲,與GPU實(shí)例相比更是將能效提高了50%之多。
小結(jié)
這樣頻繁的芯片發(fā)布節(jié)奏,足以看出亞馬遜在自研服務(wù)器芯片上已經(jīng)到了一個新的高度。不得不承認(rèn),亞馬遜早在2016年就收購Annapurna Labs是一個多么具有前瞻性的戰(zhàn)略決策,在云服務(wù)廠商競爭愈演愈烈的當(dāng)下,擁有自研可控的服務(wù)器芯片無疑是殺手锏。雖然谷歌、阿里巴巴等廠商也都加入到了自研服務(wù)器芯片的行列中來,但與亞馬遜的AWS相比,在產(chǎn)品陣容和布局時(shí)間上還是有所差距。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
-
亞馬遜
+關(guān)注
關(guān)注
8文章
2666瀏覽量
83368
發(fā)布評論請先 登錄
相關(guān)推薦
蘋果自研AI芯片,或終結(jié)與英偉達(dá)多年合作
的實(shí)現(xiàn)提供支持,但雙方的合作并不涉及直接的芯片購買。蘋果選擇從亞馬遜和微軟等云服務(wù)提供商處租用訪問權(quán)限,以獲取所需的技術(shù)支持。然而,這一合作模式可能即將迎來重大變革。 據(jù)最新報(bào)道,蘋果正與博通攜手設(shè)計(jì)自家的AI
亞馬遜啟動“登月”計(jì)劃,目標(biāo)部署10萬顆自研AI芯片
:Trainium2,目標(biāo)是在亞馬遜自己的數(shù)據(jù)中心里部署10萬顆Trainium2,以提高數(shù)據(jù)處理效率并降低AI芯片采購成本。 ? 近幾年,亞馬遜一直都在致力于自
蘋果自研5G芯片或于明年亮相
蘋果公司正加速推進(jìn)其自研5G芯片的研發(fā)進(jìn)程,有望最快在明年推出首款自研5G調(diào)制解調(diào)器。這一舉措對
比亞迪最快于11月實(shí)現(xiàn)自研算法量產(chǎn),推進(jìn)智駕芯片自研進(jìn)程
10月21日市場傳出消息,比亞迪正計(jì)劃整合其新技術(shù)院下的自研智能駕駛團(tuán)隊(duì),目標(biāo)是在今年11月實(shí)現(xiàn)自研智能駕駛算法的量產(chǎn),并持續(xù)推進(jìn)智能駕駛芯片
獨(dú)立服務(wù)器與云服務(wù)器的區(qū)別
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,企業(yè)對于服務(wù)器的需求日益增加,而服務(wù)器市場也隨之出現(xiàn)了多種類型的產(chǎn)品,其中最常見的是獨(dú)立服務(wù)器和云服務(wù)器。這兩種服務(wù)器
亞馬遜AWS自研AI芯片崛起,挑戰(zhàn)英偉達(dá)
近期,據(jù)路透社獨(dú)家報(bào)道披露,在德克薩斯州奧斯汀市一處緊密防守的芯片實(shí)驗(yàn)室中,六位來自亞馬遜AWS的工程師正在對一種尚未公開透露名稱及詳細(xì)參數(shù)的新型服務(wù)器展開深入測試。這一關(guān)鍵事件引人注
亞馬遜正測試一款融入AI芯片的新型服務(wù)器設(shè)計(jì)
在得克薩斯州奧斯汀的秘密芯片實(shí)驗(yàn)室中,亞馬遜正緊鑼密鼓地測試一款高度保密的新型服務(wù)器設(shè)計(jì),該設(shè)計(jì)融入了亞馬遜自主研發(fā)的AI芯片,旨在與業(yè)界巨
云服務(wù)器和虛擬服務(wù)器的區(qū)別是什么
云服務(wù)器和虛擬服務(wù)器是兩種常見的服務(wù)器類型,它們在很多方面有相似之處,但也有一些關(guān)鍵的區(qū)別。本文將詳細(xì)介紹云服務(wù)器和虛擬服務(wù)器的區(qū)別,包括它
蘋果計(jì)劃搭建自研芯片驅(qū)動的AI數(shù)據(jù)中心
據(jù)內(nèi)部人士透露,蘋果已將自研芯片應(yīng)用于云計(jì)算服務(wù)器,用以支持其設(shè)備未來的高級AI服務(wù)。目前我們尚未收到蘋果方面對此事的回應(yīng)。
高通自研服務(wù)器芯片"SD1"揭曉,核心搭載Oryon
據(jù)國外科技媒體Android Authority透露,高通公司在公布驍龍X Elite / Plus芯片之后,內(nèi)部正在研發(fā)代號為“SD1”、內(nèi)置Oryon處理器的服務(wù)器芯片。
蘋果自研AI服務(wù)器芯片,預(yù)計(jì)2025年臺積電3nm工藝
4 月 24 日,知名數(shù)碼博主@手機(jī)晶片達(dá)人發(fā)布動態(tài),爆料蘋果正研發(fā)自家 AI 服務(wù)器芯片,預(yù)計(jì) 2025 年下半年量產(chǎn),采用臺積電 3nm 制程。
服務(wù)器遠(yuǎn)程不上服務(wù)器怎么辦?服務(wù)器無法遠(yuǎn)程的原因是什么?
產(chǎn)生問題的原因,檢查硬盤和服務(wù)器系統(tǒng)。通過日志和檢查數(shù)據(jù)來確認(rèn)問題出
現(xiàn)的原因以及如何解決。
三、端口問題
1.端口錯誤
找回正確的端口或更換遠(yuǎn)程端口
2.端口被掃爆
更改端口,并在防火墻禁止掃爆的IP
發(fā)表于 02-27 16:21
linux服務(wù)器和windows服務(wù)器
Linux服務(wù)器和Windows服務(wù)器是目前應(yīng)用最廣泛的兩種服務(wù)器操作系統(tǒng)。兩者各有優(yōu)劣,也適用于不同的應(yīng)用場景。本文將
對Linux服務(wù)器和Windows
發(fā)表于 02-22 15:46
微軟正在研發(fā)新型網(wǎng)卡,旨在提升自研AI芯片性能
微軟近日被曝正在秘密研發(fā)一款高性能的新型網(wǎng)卡,這一創(chuàng)新旨在增強(qiáng)其自研的Maia AI服務(wù)器芯片的功能,并可能大幅度降低對外部芯片設(shè)計(jì)廠商如英
獨(dú)立服務(wù)器和云服務(wù)器的區(qū)別
獨(dú)立服務(wù)器和云服務(wù)器的區(qū)別是很多用戶在選擇服務(wù)器時(shí)要做的課程,那么獨(dú)立服務(wù)器和云服務(wù)器的區(qū)別有哪些呢?
評論