電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)日前,彭博社發(fā)文稱,為減少對(duì)英偉達(dá)芯片的依賴,亞馬遜已經(jīng)秘密啟動(dòng)了“登月”(moonshot)的計(jì)劃,目前正在其位于得克薩斯州奧斯汀的工程實(shí)驗(yàn)室加緊研發(fā)一款新的AI芯片:Trainium2,目標(biāo)是在亞馬遜自己的數(shù)據(jù)中心里部署10萬(wàn)顆Trainium2,以提高數(shù)據(jù)處理效率并降低AI芯片采購(gòu)成本。
近幾年,亞馬遜一直都在致力于自研芯片以降低數(shù)據(jù)中心成本,根據(jù)云成本管理和優(yōu)化平臺(tái)Vantage此前的一項(xiàng)調(diào)查數(shù)據(jù),在Amazon EC2 M7系列通用實(shí)例的成本支出方面,采用Amazon Graviton的M7g系列已經(jīng)超過(guò)三分之一(34.5%)。
亞馬遜自研芯片第一次亮相始于2016年,在當(dāng)年的re:Invent大會(huì)上,亞馬遜云傳奇工程師James Hamilton展示了該公司第一顆自研芯片,這便是第一代Graviton芯片。和英特爾、AMD的芯片不同,第一代Graviton芯片便是基于Arm架構(gòu)的Neoverse內(nèi)核打造,可以支持2x25G以太網(wǎng)的數(shù)據(jù)包處理。隨后,亞馬遜在2019年推出了Graviton2、2021年推出了Graviton3、2023年推出了Graviton4。
作為最新版本的Graviton芯片,Graviton4采用了最先進(jìn)的Arm架構(gòu) Neoverse V2 核心,具有更高的計(jì)算核心數(shù)量和更快的內(nèi)存帶寬。7月15日,亞馬遜發(fā)布了基于自研芯片Graviton4的Amazon EC2 R8g實(shí)例。根據(jù)phoronix測(cè)試的結(jié)果,和上一代芯片Graviton3相比,Graviton4性能提升達(dá)30%以上,內(nèi)核數(shù)增加50%,內(nèi)存帶寬增加75%。
同時(shí),根據(jù)測(cè)試結(jié)果,Graviton4處理器的性能略優(yōu)于英特爾至強(qiáng)處理器約5%,但AMD的EPYC處理器在整體性能上仍領(lǐng)先約25%。有評(píng)測(cè)報(bào)告認(rèn)為,Graviton4搭載的Neoverse-V2內(nèi)核與英特爾Sapphire Rapids內(nèi)核在性能上旗鼓相當(dāng),在某些工作負(fù)載下甚至優(yōu)于AMD第四代EPYC。
Graviton4處理器發(fā)布于2023年11月28日,與其同時(shí)發(fā)布的還有升級(jí)款處理器Trainium2。AWS首席執(zhí)行官Adam Selipsky在re:Invent主題演講中透露,亞馬遜已經(jīng)購(gòu)買了數(shù)百萬(wàn)個(gè)英偉達(dá)的A100和H100產(chǎn)品,在此方面投入了巨大的成本。而業(yè)界人士預(yù)測(cè),Trainium2是一顆有望正面和英偉達(dá)H100芯片競(jìng)爭(zhēng)的AI芯片。
Trainium2是多年磨一劍的產(chǎn)品,據(jù)悉在亞馬遜2015年收購(gòu)Annapurna Labs之后,這個(gè)項(xiàng)目就在秘密研發(fā)。根據(jù)亞馬遜方面的數(shù)據(jù),Trainium2相較于上一代產(chǎn)品,訓(xùn)練速度提升多達(dá)4倍,能效提升多達(dá)2倍,內(nèi)存容量則達(dá)此前3倍,能在EC2 UltraClusters中擴(kuò)展至多達(dá)10萬(wàn)個(gè)芯片,可以在極短的時(shí)間內(nèi)訓(xùn)練基礎(chǔ)模型和大語(yǔ)言模型。目前,該芯片已經(jīng)在接受包括Anthropic、Databricks、Stockmark三家AI創(chuàng)企以及德國(guó)電信、日本理光在內(nèi)的多個(gè)客戶的測(cè)試。
同時(shí),亞馬遜方面表示,Trainium2芯片已在數(shù)據(jù)中心部署,預(yù)計(jì)將在俄亥俄州等多個(gè)核心數(shù)據(jù)中心推廣,目標(biāo)是形成多達(dá)100000個(gè)芯片的集群。而這正是亞馬遜秘密計(jì)劃——“登月”計(jì)劃的一部分。按照規(guī)劃,Trainium2芯片先期主要承擔(dān)亞馬遜內(nèi)部的AI訓(xùn)練項(xiàng)目,并在初創(chuàng)企業(yè)客戶方面得到測(cè)試,隨著項(xiàng)目成熟將陸續(xù)有大客戶導(dǎo)入到基于Trainium2芯片的算力平臺(tái)上,一旦大客戶有項(xiàng)目使用,亞馬遜Trainium2芯片的任務(wù)便被視為取得成功。
不過(guò),業(yè)內(nèi)人士認(rèn)為,亞馬遜Trainium2芯片也面臨諸多方面的挑戰(zhàn),其中最顯著的兩大挑戰(zhàn)是自研芯片本身和軟件生態(tài)。在自研芯片方面,由于英偉達(dá)在通用計(jì)算GPU領(lǐng)域已經(jīng)積累了深厚的研發(fā)經(jīng)驗(yàn),單芯片的優(yōu)化已經(jīng)接近了極限,要想實(shí)現(xiàn)超越,尤其是在核心指標(biāo)PPA方面實(shí)現(xiàn)超越,可能需要更加前沿的工藝平臺(tái)進(jìn)行芯片實(shí)現(xiàn),或者在芯片設(shè)計(jì)過(guò)程中導(dǎo)入工程設(shè)計(jì)的“know how”,但無(wú)論怎樣的技術(shù)路徑,背后面臨的挑戰(zhàn)都是巨大的,且可能會(huì)由于先期用量低而導(dǎo)致高昂的成本,再加上本就客觀存在的研發(fā)成本,這對(duì)公司內(nèi)部推進(jìn)自研芯片的決心會(huì)有挑戰(zhàn)。
在軟件方面的挑戰(zhàn)就更大了,目前全球主要的GPGPU基本是依存于英偉達(dá)的CUDA生態(tài)生存,如果不兼容基本很難部署落地,這就導(dǎo)致英偉達(dá)在軟硬件結(jié)合方面具有巨大的先發(fā)優(yōu)勢(shì)。重新部署軟件生態(tài)當(dāng)然也是有效的途徑,一旦成功會(huì)獲得巨大的商業(yè)回報(bào)。但分析人士認(rèn)為,目前亞馬遜提供的Neural SDK軟件工具尚處于初期階段,無(wú)法與英偉達(dá)的解決方案相匹敵。
近幾年,亞馬遜一直都在致力于自研芯片以降低數(shù)據(jù)中心成本,根據(jù)云成本管理和優(yōu)化平臺(tái)Vantage此前的一項(xiàng)調(diào)查數(shù)據(jù),在Amazon EC2 M7系列通用實(shí)例的成本支出方面,采用Amazon Graviton的M7g系列已經(jīng)超過(guò)三分之一(34.5%)。
亞馬遜自研芯片第一次亮相始于2016年,在當(dāng)年的re:Invent大會(huì)上,亞馬遜云傳奇工程師James Hamilton展示了該公司第一顆自研芯片,這便是第一代Graviton芯片。和英特爾、AMD的芯片不同,第一代Graviton芯片便是基于Arm架構(gòu)的Neoverse內(nèi)核打造,可以支持2x25G以太網(wǎng)的數(shù)據(jù)包處理。隨后,亞馬遜在2019年推出了Graviton2、2021年推出了Graviton3、2023年推出了Graviton4。
作為最新版本的Graviton芯片,Graviton4采用了最先進(jìn)的Arm架構(gòu) Neoverse V2 核心,具有更高的計(jì)算核心數(shù)量和更快的內(nèi)存帶寬。7月15日,亞馬遜發(fā)布了基于自研芯片Graviton4的Amazon EC2 R8g實(shí)例。根據(jù)phoronix測(cè)試的結(jié)果,和上一代芯片Graviton3相比,Graviton4性能提升達(dá)30%以上,內(nèi)核數(shù)增加50%,內(nèi)存帶寬增加75%。
同時(shí),根據(jù)測(cè)試結(jié)果,Graviton4處理器的性能略優(yōu)于英特爾至強(qiáng)處理器約5%,但AMD的EPYC處理器在整體性能上仍領(lǐng)先約25%。有評(píng)測(cè)報(bào)告認(rèn)為,Graviton4搭載的Neoverse-V2內(nèi)核與英特爾Sapphire Rapids內(nèi)核在性能上旗鼓相當(dāng),在某些工作負(fù)載下甚至優(yōu)于AMD第四代EPYC。
Graviton4處理器發(fā)布于2023年11月28日,與其同時(shí)發(fā)布的還有升級(jí)款處理器Trainium2。AWS首席執(zhí)行官Adam Selipsky在re:Invent主題演講中透露,亞馬遜已經(jīng)購(gòu)買了數(shù)百萬(wàn)個(gè)英偉達(dá)的A100和H100產(chǎn)品,在此方面投入了巨大的成本。而業(yè)界人士預(yù)測(cè),Trainium2是一顆有望正面和英偉達(dá)H100芯片競(jìng)爭(zhēng)的AI芯片。
Trainium2是多年磨一劍的產(chǎn)品,據(jù)悉在亞馬遜2015年收購(gòu)Annapurna Labs之后,這個(gè)項(xiàng)目就在秘密研發(fā)。根據(jù)亞馬遜方面的數(shù)據(jù),Trainium2相較于上一代產(chǎn)品,訓(xùn)練速度提升多達(dá)4倍,能效提升多達(dá)2倍,內(nèi)存容量則達(dá)此前3倍,能在EC2 UltraClusters中擴(kuò)展至多達(dá)10萬(wàn)個(gè)芯片,可以在極短的時(shí)間內(nèi)訓(xùn)練基礎(chǔ)模型和大語(yǔ)言模型。目前,該芯片已經(jīng)在接受包括Anthropic、Databricks、Stockmark三家AI創(chuàng)企以及德國(guó)電信、日本理光在內(nèi)的多個(gè)客戶的測(cè)試。
同時(shí),亞馬遜方面表示,Trainium2芯片已在數(shù)據(jù)中心部署,預(yù)計(jì)將在俄亥俄州等多個(gè)核心數(shù)據(jù)中心推廣,目標(biāo)是形成多達(dá)100000個(gè)芯片的集群。而這正是亞馬遜秘密計(jì)劃——“登月”計(jì)劃的一部分。按照規(guī)劃,Trainium2芯片先期主要承擔(dān)亞馬遜內(nèi)部的AI訓(xùn)練項(xiàng)目,并在初創(chuàng)企業(yè)客戶方面得到測(cè)試,隨著項(xiàng)目成熟將陸續(xù)有大客戶導(dǎo)入到基于Trainium2芯片的算力平臺(tái)上,一旦大客戶有項(xiàng)目使用,亞馬遜Trainium2芯片的任務(wù)便被視為取得成功。
不過(guò),業(yè)內(nèi)人士認(rèn)為,亞馬遜Trainium2芯片也面臨諸多方面的挑戰(zhàn),其中最顯著的兩大挑戰(zhàn)是自研芯片本身和軟件生態(tài)。在自研芯片方面,由于英偉達(dá)在通用計(jì)算GPU領(lǐng)域已經(jīng)積累了深厚的研發(fā)經(jīng)驗(yàn),單芯片的優(yōu)化已經(jīng)接近了極限,要想實(shí)現(xiàn)超越,尤其是在核心指標(biāo)PPA方面實(shí)現(xiàn)超越,可能需要更加前沿的工藝平臺(tái)進(jìn)行芯片實(shí)現(xiàn),或者在芯片設(shè)計(jì)過(guò)程中導(dǎo)入工程設(shè)計(jì)的“know how”,但無(wú)論怎樣的技術(shù)路徑,背后面臨的挑戰(zhàn)都是巨大的,且可能會(huì)由于先期用量低而導(dǎo)致高昂的成本,再加上本就客觀存在的研發(fā)成本,這對(duì)公司內(nèi)部推進(jìn)自研芯片的決心會(huì)有挑戰(zhàn)。
在軟件方面的挑戰(zhàn)就更大了,目前全球主要的GPGPU基本是依存于英偉達(dá)的CUDA生態(tài)生存,如果不兼容基本很難部署落地,這就導(dǎo)致英偉達(dá)在軟硬件結(jié)合方面具有巨大的先發(fā)優(yōu)勢(shì)。重新部署軟件生態(tài)當(dāng)然也是有效的途徑,一旦成功會(huì)獲得巨大的商業(yè)回報(bào)。但分析人士認(rèn)為,目前亞馬遜提供的Neural SDK軟件工具尚處于初期階段,無(wú)法與英偉達(dá)的解決方案相匹敵。
結(jié)語(yǔ)
就像人類登月一樣,亞馬遜Trainium2芯片的野心是巨大的,一旦成功帶來(lái)的商業(yè)回報(bào)也是非??捎^的。但登月本就兇險(xiǎn)萬(wàn)分,Trainium2芯片離成功替代英偉達(dá)H100還有很長(zhǎng)很長(zhǎng)的路要走。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
亞馬遜
+關(guān)注
關(guān)注
8文章
2663瀏覽量
83345 -
AI芯片
+關(guān)注
關(guān)注
17文章
1886瀏覽量
35015 -
登月
+關(guān)注
關(guān)注
0文章
5瀏覽量
1934
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
蘋果計(jì)劃2025年起采用自研藍(lán)牙Wi-Fi芯片
近日,據(jù)最新報(bào)道,蘋果公司為了減少對(duì)博通(Broadcom)的依賴,并進(jìn)一步提升其設(shè)備的性能和能效,已經(jīng)制定了一項(xiàng)重要的芯片自研計(jì)劃。據(jù)悉,從2025年開(kāi)始,蘋果將正式啟用
亞馬遜轉(zhuǎn)向Trainium芯片,全力投入AI模型訓(xùn)練
近日,亞馬遜宣布了一項(xiàng)重大決策,決定停止Inferentia AI芯片的開(kāi)發(fā),轉(zhuǎn)而將全部精力投入到Trainium芯片的研發(fā)上,以此作為與英偉達(dá)競(jìng)爭(zhēng)的新策略。
劍指英偉達(dá)!報(bào)道:亞馬遜正部署10萬(wàn)顆二代自研芯片,挑戰(zhàn)行業(yè)壟斷
行業(yè)資訊
北京中科同志科技股份有限公司
發(fā)布于 :2024年11月26日 10:15:16
比亞迪最快于11月實(shí)現(xiàn)自研算法量產(chǎn),推進(jìn)智駕芯片自研進(jìn)程
10月21日市場(chǎng)傳出消息,比亞迪正計(jì)劃整合其新技術(shù)院下的自研智能駕駛團(tuán)隊(duì),目標(biāo)是在今年11月實(shí)現(xiàn)自
三星或?qū)BM產(chǎn)能目標(biāo)下調(diào)至每月17萬(wàn)顆
據(jù)業(yè)內(nèi)人士透露,三星電子已對(duì)其2025年底的高帶寬內(nèi)存(HBM)最大產(chǎn)能目標(biāo)進(jìn)行了調(diào)整,下調(diào)幅度超過(guò)10%,從原先計(jì)劃的每月20萬(wàn)顆減至17
今日看點(diǎn)丨小鵬自研芯片流片!算力是同行三倍;加拿大將對(duì)中國(guó)電動(dòng)汽車征收100%關(guān)稅
算力接近3顆主流智駕芯片的水平”。 ? 此外,消息稱,8月27日,小鵬10周年及M03上市活動(dòng)中,小鵬汽車將正式發(fā)布自研
發(fā)表于 08-27 11:22
?1173次閱讀
亞馬遜云科技啟動(dòng)“智能家居與智能產(chǎn)品創(chuàng)新加速計(jì)劃”
上海 ——2024 年 7 月 31 日 在“亞馬遜云科技汽車暨制造與消費(fèi)電子行業(yè)峰會(huì)”上,亞馬遜云科技宣布正式啟動(dòng)“智能家居與智能產(chǎn)品創(chuàng)新加速計(jì)劃”,該
發(fā)表于 07-31 16:56
?1749次閱讀
亞馬遜AWS自研AI芯片崛起,挑戰(zhàn)英偉達(dá)
近期,據(jù)路透社獨(dú)家報(bào)道披露,在德克薩斯州奧斯汀市一處緊密防守的芯片實(shí)驗(yàn)室中,六位來(lái)自亞馬遜AWS的工程師正在對(duì)一種尚未公開(kāi)透露名稱及詳細(xì)參數(shù)的新型服務(wù)器展開(kāi)深入測(cè)試。這一關(guān)鍵事件引人注目,因?yàn)槲覀?/div>
OpenAI自研芯片計(jì)劃調(diào)整,傳交臺(tái)積電生產(chǎn)
近日,全球領(lǐng)先的生成式AI應(yīng)用大廠OpenAI在自研芯片領(lǐng)域迎來(lái)了重大戰(zhàn)略調(diào)整。為降低對(duì)外部AI芯片
蘋果將通過(guò)自研芯片在云端推出AI功能
近日,科技界傳來(lái)一則令人振奮的消息。據(jù)可靠報(bào)道,蘋果公司即將在云端推出強(qiáng)大的人工智能(AI)功能,而這一切將依托于自研的高端芯片。
蘋果計(jì)劃搭建自研芯片驅(qū)動(dòng)的AI數(shù)據(jù)中心
據(jù)內(nèi)部人士透露,蘋果已將自研芯片應(yīng)用于云計(jì)算服務(wù)器,用以支持其設(shè)備未來(lái)的高級(jí)AI服務(wù)。目前我們尚未收到蘋果方面對(duì)此事的回應(yīng)。
蘋果自研數(shù)據(jù)中心芯片/Open AI計(jì)劃出谷歌搜索競(jìng)爭(zhēng)對(duì)手/全球Q1智能手機(jī)市場(chǎng)出貨量增長(zhǎng) 熱點(diǎn)科技新聞點(diǎn)評(píng)
據(jù)悉,蘋果將在今年用自研數(shù)據(jù)中心芯片,透過(guò)硬設(shè)備和云端兩種方式來(lái)支持 AI 功能。將在今年用自研
Meta計(jì)劃今年部署自研定制芯片,以加速AI研發(fā)
Meta公司近日宣布計(jì)劃在今年內(nèi)為其數(shù)據(jù)中心部署一款自研定制芯片,以支持其人工智能(AI)的研發(fā)工作。這一舉措旨在提高M(jìn)eta在
江波龍首顆自研NAND閃存問(wèn)世
江波龍首顆自研32Gb 2D MLC NAND Flash于近日問(wèn)世。該產(chǎn)品采用BGA132封裝,支持Toggle DDR模式,數(shù)據(jù)訪問(wèn)帶寬可達(dá)400MB/s,將有望應(yīng)用于eMMC、SSD等產(chǎn)品上。
英偉達(dá)缺貨?OpenAI選擇自研芯片
勢(shì)在必行。然而掀起這股AI洪流,或者說(shuō)將其推向浪尖的“始作俑者”,OpenAI,卻也已經(jīng)在計(jì)劃著自研芯片。 ? 有了英偉達(dá)供應(yīng)的前提下為何要
評(píng)論