無論是移動應(yīng)用程序或數(shù)字商務(wù)等可見應(yīng)用程序,還是航空公司定價算法或每次刷卡時激活的欺詐檢測系統(tǒng)等幕后流程,AI 都已成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧S绕涫巧墒?AI,預(yù)計未來十年將以兩位數(shù)的速度持續(xù)增長,到 2032 年市場規(guī)??赡苓_到1 萬億美元以上。
AI 技術(shù)的發(fā)展推動了對更強大的處理器的需求,尤其是 GPU,是構(gòu)建 AI 基礎(chǔ)設(shè)施的重要組成部分。NVIDIA 在行業(yè)和市場占據(jù)著主導(dǎo)地位,AMD 也越來越受歡迎,但企業(yè)必須面對GPU 持續(xù)增加的功耗,部分型號甚至已經(jīng)超過1kW,這一趨勢也導(dǎo)致全球數(shù)據(jù)中心功耗大幅增加。預(yù)計在 2022 年至 2026 年間還將翻一番,容量已然成為公共事業(yè)提供商和企業(yè)面臨的主要挑戰(zhàn)。
目前,大約80% 的數(shù)據(jù)中心運營商面臨功率限制,許多運營商對每機架功率限制在 10-20 kW的范圍內(nèi)。雖然傳統(tǒng)方法證明,提高處理器性能和效率可以提高總功耗,但很多數(shù)據(jù)中心運營商已經(jīng)達到功率上限,這也對企業(yè)的持續(xù)創(chuàng)新和增長造成了阻礙。此外,擴展機架空間或適應(yīng)特殊的冷卻方法通常成本高昂或受到空間和法規(guī)的限制;老化的服務(wù)器基礎(chǔ)設(shè)施(許多服務(wù)器使用時間超過 5 年)也不斷增加維護成本和安全風(fēng)險。
對此,最實用的解決方案是升級現(xiàn)有的基礎(chǔ)設(shè)施。及時的服務(wù)器更新能夠大幅整合機架空間,從而降低運營成本,回收電力預(yù)算,并支持部署能夠處理 AI 工作負載的現(xiàn)代服務(wù)器。在評估服務(wù)器更新時,運營商需要用新的方式來思考,只要新一代處理器的每瓦性能(即效率)提高,處理器功耗的增加就可以被接受,這意味著新服務(wù)器比舊服務(wù)器 “里程更長”。盡管最大機架功率預(yù)算有限并開始接近極限,通過專注于每機架的性能,企業(yè)可以優(yōu)化現(xiàn)有的電力和空間,使他們能夠從數(shù)據(jù)中心的局限性轉(zhuǎn)為更加專注于業(yè)務(wù)的增長和創(chuàng)新。
Ampere 的云原生處理器旨在提供橫向擴展性能和領(lǐng)先的效率。AmpereOne 自研核是替代老舊服務(wù)器的最佳 CPU 選擇。在AmpereOne 效率白皮書中,詳細闡述了 AmpereOne 的效率優(yōu)勢,相較 AMD EPYC 9004 系列處理器,如何使云原生和 AI 工作負載的每機架性能提高 67%。
以下是 7 個開源工作負載,從 Web 服務(wù)器和負載均衡器到數(shù)據(jù)庫,再到緩存和內(nèi)存中數(shù)據(jù)存儲。它們在許多現(xiàn)代 Web 服務(wù)中頗受歡迎,因為它們通過緩存處理 web 流量管理、數(shù)據(jù)存儲和性能優(yōu)化。
在AI 計算時代,通過將 AI 推理工作負載添加到上述通用工作負載中,可以增強各個行業(yè)的產(chǎn)品和服務(wù)。下表展示了 AmpereOne 在機架級別的性能和效率,適用于推理工作負載,如推薦引擎(DLRM)、圖像處理(ResNet-50)以及以語言為中心的工作負載(Whisper和Llama3)。這些工作負載支持現(xiàn)代設(shè)施,例如聊天機器人、在電子商務(wù)網(wǎng)站上查看推薦的產(chǎn)品、在流媒體平臺上呈現(xiàn)“您可能喜歡的節(jié)目”,或者為直播電視流提供實時隱藏字幕。
對于前面提到的每機架可用功率有限的企業(yè)和服務(wù)提供商來說,實現(xiàn)每機架的最大性能尤為重要。即使是中等規(guī)模的企業(yè),由 AI 驅(qū)動的 web 服務(wù)也可以從 AmpereOne 中受益。與 AMD EPYC Genoa 8 個機架的輸出相比,AmpereOne 可以在不犧牲性能水平的情況下,將機架空間減少 38%,將功率預(yù)算降低 37%,并將購置成本降低 49%。以下代理 web 服務(wù)包括作為前端 Web 服務(wù)器的 NGINX、作為鍵值存儲的 Redis、作為內(nèi)存數(shù)據(jù)庫的 Memcached、作為關(guān)系數(shù)據(jù)庫的 MySQL,以及分別作為推薦引擎和聊天機器人的 AI 組件 DLRM 和 Llama3。
AmpereOne 可以通過更新老化的服務(wù)器來重新利用預(yù)算、空間和功率。我們展示了如何節(jié)約資本支出,如何通過降低功耗和管理開銷而實現(xiàn)運營支出的節(jié)省,在三年內(nèi)為企業(yè)節(jié)省大量 TCO。相較 AMD EPYC Bergamo,運營商可以節(jié)省 33% 的成本;與 AMD EPYC Genoa 相比,可節(jié)省高達 41% 的成本,這都歸功于AmpereOne。
無論公司規(guī)模大小,“AI 海嘯” 將繼續(xù)降低企業(yè)大規(guī)模實施 AI 的準(zhǔn)入門檻。即使沒有資源去雇傭?qū)iT的 AI 團隊,企業(yè)也可以通過服務(wù)提供商來開啟 AI 之旅,并迅速投入生產(chǎn)。因此,整合傳統(tǒng)基礎(chǔ)設(shè)施為 AI 擴展釋放空間尤其重要。
關(guān)于 Ampere Computing
Ampere Computing 是一家現(xiàn)代化半導(dǎo)體企業(yè),致力于塑造云計算的未來,并推出了世界上首款云原生處理器。為可持續(xù)云而生,Ampere 云原生處理器兼具最高性能和最佳每瓦性能,助力加速多種云計算應(yīng)用的交付,為云提供行業(yè)領(lǐng)先的性能、能效和可擴展性。
-
處理器
+關(guān)注
關(guān)注
68文章
19382瀏覽量
230461 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9253瀏覽量
85742 -
Ampere
+關(guān)注
關(guān)注
1文章
69瀏覽量
4551 -
生成式AI
+關(guān)注
關(guān)注
0文章
509瀏覽量
509
原文標(biāo)題:技術(shù)文章 | 為AI計算釋放空間
文章出處:【微信號:AmpereComputing,微信公眾號:安晟培半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論