雖然訓(xùn)練 AI 需要超強(qiáng)大的 GPU 算力,但 AI 算法的執(zhí)行首先需要超高效的芯片。就像 AmpereCPU,未來(lái)的 AmpereOne 將擁有不少于256個(gè)內(nèi)核,其功率僅為350W。(原文轉(zhuǎn)自 Adrian Branco 發(fā)表于2024年6月10日)
Adrian Branco pour les Numériques - AmpereOne 256
或許你永遠(yuǎn)無(wú)需自己購(gòu)買(mǎi)處理器,但毫無(wú)疑問(wèn),你每天都會(huì)在不知不覺(jué)中使用。Ampere Computing 是一家美國(guó)公司,由英特爾前高管 Renée James 創(chuàng)立。Ampere 的使命是設(shè)計(jì)和銷(xiāo)售用于數(shù)據(jù)中心和超級(jí)計(jì)算機(jī)的基于 ARM 架構(gòu)的CPU,其最新一代 AmpereOne 不久前剛剛亮相。 這與我們的應(yīng)用程序和使用有什么關(guān)系呢?隨著基于云的 AI 助手的不斷發(fā)展,行業(yè)玩家們正在努力尋求降低購(gòu)買(mǎi)和消費(fèi)方面的使用費(fèi)用。在這個(gè)游戲中,Ampere 基于A(yíng)RM 架構(gòu)的 CPU 具有很多優(yōu)勢(shì)。
首先讓我們來(lái)談?wù)勑酒弘m然192核5nm版本的 AmpereOne 已經(jīng)上市,并集成到法國(guó) Scaleway 公司(我們?nèi)ツ?2月訪(fǎng)問(wèn)過(guò)其后臺(tái))等數(shù)據(jù)中心,但 Ampere 未來(lái)的芯片將走得更遠(yuǎn)。得益于迄今為止蘋(píng)果芯片獨(dú)有的3nm工藝,Ampere 能夠?qū)?nèi)核數(shù)量增加33%,將 CPU 核心數(shù)量提高到256個(gè)。 但是,面對(duì)越來(lái)越耗電的芯片,英特爾正在積極研發(fā)從1KW到2KW的散熱芯片,英偉達(dá)毫不掩飾自己也在走同樣的道路 —— Ampere 正在做戰(zhàn)略性的押注,以不斷散熱的方式尋求性能提升。通過(guò)添加越來(lái)越多的內(nèi)核來(lái)實(shí)現(xiàn)這一點(diǎn),即創(chuàng)造更加高效的“心”。
恒定功耗下的更多內(nèi)核
Jeff Wittich, Chief Product Officer at Ampere
根據(jù) Ampere 的路線(xiàn)圖,該公司計(jì)劃于2025年推出的下一代旗艦產(chǎn)品 AmpereOne 將擁有256個(gè)內(nèi)核。但正如 Ampere 首席產(chǎn)品官 Jeff Wittich 所解釋的那樣,這種芯片與 GPU 和其他高功率加速器相反?!皵?shù)據(jù)中心行業(yè)的能源消耗增長(zhǎng)速度是不可持續(xù)的,你不可能總是消耗更多的電力,你必須盡可能優(yōu)化消耗。我們?cè)谑袌?chǎng)上的優(yōu)勢(shì)在于,我們?cè)O(shè)計(jì)了一種專(zhuān)門(mén)用于云計(jì)算的芯片架構(gòu)。盡管我們的競(jìng)爭(zhēng)對(duì)手擁有云前和 AI 前的核心設(shè)計(jì),但我們的 CPU 內(nèi)核和芯片完全是為滿(mǎn)足這一需求而設(shè)計(jì)的”, Jeff 說(shuō)。
Ampere 的第一個(gè)武器是其芯片中嵌入的內(nèi)核數(shù)量驚人?!澳壳?,我們最密集的芯片有192個(gè) CPU 內(nèi)核。但到2025年,我們的3nm AmpereOne 將提供不少于256個(gè)內(nèi)核?!?這就是 Ampere 的第二個(gè)武器。新芯片的功耗將與當(dāng)前芯片完全相同,也就是說(shuō) “在300W到350W之間”,Jeff解釋道,“我們不想消耗更多的能源,我們總是想用同樣的功率做更多的事情。Ampere 的架構(gòu)是可擴(kuò)展的,特別適合 AI ”。等一下,AI不是 GPU 的領(lǐng)域嗎?
85%的AI與訓(xùn)練無(wú)關(guān)
Victor Jakubiuk, Head of AI at Ampere
面對(duì)如今市值達(dá)30000億美元的英偉達(dá),一個(gè)小玩家如何撼動(dòng)這樣一個(gè)龐然大物呢?Ampere AI 主管 Victor Jakubiuk 解釋道:“這不是一回事。強(qiáng)大的 GPU 是用來(lái)訓(xùn)練 AI 的。我們談?wù)摰氖敲芗陀?jì)算,這需要高性能的芯片。但 AI 訓(xùn)練只占該領(lǐng)域相關(guān)計(jì)算的15%。剩下的85%用于推理,即使用這些 AI。因?yàn)橐坏┮粋€(gè)模型經(jīng)過(guò)訓(xùn)練,需要數(shù)周或數(shù)月的時(shí)間,它就會(huì)被數(shù)百萬(wàn)用戶(hù)大量使用。這就是 Ampere 處理器的用武之地” 。
以最優(yōu)化的方式運(yùn)行模型的處理器,它們是什么型號(hào)?Jeff Wittich 回答說(shuō):“除了 CPU 的經(jīng)典用途(如MongoDB等數(shù)據(jù)庫(kù))外,我們的 CPU 核心還用于許多日常任務(wù)。當(dāng)您觀(guān)看視頻時(shí),我們的 CPU 負(fù)責(zé)生成自動(dòng)字幕并翻譯這些字幕。當(dāng)您在銀行應(yīng)用程序中使用聊天機(jī)器人時(shí),我們的 CPU 可能也在運(yùn)行并提供支持”。
真正的節(jié)省,而不僅僅是在A(yíng)I方面
Damien Lucas, CEO of Scaleway
為了驗(yàn)證 Ampere 團(tuán)隊(duì)的說(shuō)法,我們回到了去年我們見(jiàn)過(guò)的 Scaleway 首席執(zhí)行官 Damien Lucas 那里。他面帶微笑,非常直接地說(shuō):“Ampere 芯片的節(jié)能是真實(shí)的”。他說(shuō),雖然 ARM CPU 在數(shù)據(jù)中心的發(fā)展之路并不總是一帆風(fēng)順, 但“自從 Scaleway 幾年前提出并停止使用ARM以來(lái)”,該指令集正在強(qiáng)勢(shì)回歸,“這要?dú)w功于客戶(hù)的需求。我認(rèn)為,一方面,壟斷對(duì)市場(chǎng)來(lái)說(shuō)從來(lái)都不是一件好事,但另一方面,Ampere CPU 可以顯著節(jié)省能源”。根據(jù) Ampere 的說(shuō)法,在 AI 中,這意味著 “與英偉達(dá) GPU 相比,推理的增益從 x3到x5”。
An Ampere server from Scaleway
效率的提高并不局限于 AI 推理領(lǐng)域。Damien Lucas 表示:“雖然我們將所有技術(shù)和芯片都投放市場(chǎng),為客戶(hù)服務(wù),但由于我們與每個(gè)人合作,我們?cè)赟caleway 也有自己的基礎(chǔ)設(shè)施。事實(shí)是,我們已經(jīng)將所有內(nèi)部服務(wù)器從 x86切換到了Ampere。我們的能源費(fèi)用減少了30%” 他非常興奮地說(shuō)。
但是,不要被云玩家的責(zé)任沖昏頭腦:盡管那些有推理需求的人可能會(huì)集體轉(zhuǎn)向 Ampere 這樣的芯片,但與能耗這個(gè)龐然大物對(duì)抗仍有很長(zhǎng)的路要走。 “目前這是一場(chǎng)與時(shí)間的賽跑??捎玫?GPU 永遠(yuǎn)不夠。在 Scaleway,我們?yōu)樗蓄?lèi)型的客戶(hù)提供服務(wù)。我們可以清楚地看到雙重趨勢(shì):一方面,我們稱(chēng)之為超密集型計(jì)算,另一方面是超高效計(jì)算”。能效,是Ampere的強(qiáng)項(xiàng)。
2030年將推出1000核處理器?
處理器計(jì)算能力的提高面臨著巨大的挑戰(zhàn),比如進(jìn)一步降低雕刻技巧的困難。然而,Jeff Wittich 似乎并不擔(dān)心芯片每瓦性能的未來(lái)改進(jìn)。他向我們保證:“即使制造工藝多年來(lái)一直停留在3nm,即使使用350W的封裝,我們?nèi)匀豢梢宰龅酶??!?在同意做出預(yù)測(cè)之前,他承諾:“即使有這些限制,到2030年,我們也可以擁有1000核芯片。我們的架構(gòu)仍有很大的空間”。 最后他總結(jié)道:“因?yàn)樵谖覀兊氖澜缋?,我們不再浪費(fèi)能源?!?/p>
關(guān)于 Ampere Computing
Ampere Computing 是一家現(xiàn)代化半導(dǎo)體企業(yè),致力于塑造云計(jì)算的未來(lái),并推出了世界上首款云原生處理器。為可持續(xù)云而生,Ampere 云原生處理器兼具最高性能和最佳每瓦性能,助力加速多種云計(jì)算應(yīng)用的交付,為云提供行業(yè)領(lǐng)先的性能、能效和可擴(kuò)展性。
-
處理器
+關(guān)注
關(guān)注
68文章
19293瀏覽量
229958 -
cpu
+關(guān)注
關(guān)注
68文章
10870瀏覽量
211896 -
Ampere
+關(guān)注
關(guān)注
1文章
66瀏覽量
4544
原文標(biāo)題:256核 AI 動(dòng)力:一款能實(shí)時(shí)翻譯視頻并為聊天機(jī)器人提供動(dòng)力的處理器
文章出處:【微信號(hào):AmpereComputing,微信公眾號(hào):安晟培半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論