0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

當(dāng)AI遇上云原生,綠色算力助力開啟AI新時(shí)代

安晟培半導(dǎo)體 ? 來源:安晟培半導(dǎo)體 ? 2023-02-24 11:23 ? 次閱讀

撰寫文章、編寫代碼、譜寫 Rap,上知天文,下知地理,十八般武藝樣樣精通……從 2022 年底開始,一款由美國人工智能研究實(shí)驗(yàn)室 OpenAI 發(fā)布的自然語言處理工具 ChatGPT 備受關(guān)注,成為現(xiàn)象級的 AI 產(chǎn)品,掀起全球的 AI 浪潮。

在以 ChatGPT 為代表的 AI 應(yīng)用蓬勃發(fā)展的背后,離不開數(shù)據(jù)中心提供的算力支撐。而隨著相關(guān)應(yīng)用的不斷發(fā)展,它們所需的算力將呈指數(shù)級增長,所需的能耗也不容小覷。根據(jù) 2021 年國外研究人員年發(fā)表的研究結(jié)果,部分基于 GPT-3 模型的訓(xùn)練共消耗1,287 兆瓦時(shí)電力,并產(chǎn)生了超過550 噸二氧化碳當(dāng)量的排放,這相當(dāng)于一個(gè)人往返紐約和舊金山550 次所消耗的二氧化碳量[1]。

Ampere Computing 一直致力于為數(shù)據(jù)中心帶來高性能、高能效的云原生處理器,助力減少環(huán)境足跡,構(gòu)建綠色數(shù)據(jù)中心,降低總體擁有成本(TCO),以更可持續(xù)的方式為用戶提供更多的綠色算力。在 AI 領(lǐng)域,Ampere 提供的 AI 解決方案具備卓越的推理性能和優(yōu)越的能效,幫助用戶輕松應(yīng)對算力及能耗的挑戰(zhàn)。

想知道 ChatGPT 如何看待AI 在“減碳”方面的作用嗎?快來參與文末的趣味互動(dòng)吧!

云原生設(shè)計(jì),強(qiáng)力賦能 AI 推理

Ampere Altra Max 基于高性能、高能效及可預(yù)測的創(chuàng)新架構(gòu),非常適合在云中執(zhí)行 AI 推理工作,不僅可以滿足延遲和吞吐量的要求,而且性能優(yōu)于基于 x86 架構(gòu)的 CPU。讓我們一起來看一下在 Ampere Altra Max 處理器上運(yùn)行 AI 推理的收益吧!

開箱即用,暢享便捷體驗(yàn)

在 Ampere Altra Max 上運(yùn)行 AI 推理不需要修改或轉(zhuǎn)換已有神經(jīng)網(wǎng)絡(luò),即可在 TensorFlow、PyTorch 或 ONNX 框架上開發(fā)和運(yùn)行 AI 推理的工作負(fù)載。用戶可從 Ampere 或 Ampere 云服務(wù)合作伙伴處免費(fèi)獲得優(yōu)化框架,高效地部署和運(yùn)行應(yīng)用程序。同時(shí),Ampere Altra Max 是目前唯一支持 fp16 數(shù)據(jù)格式,并已廣泛可用的云原生處理器,將 fp32 訓(xùn)練的網(wǎng)絡(luò)量化為 fp16 極為簡單,且不會(huì)導(dǎo)致明顯的精度損失。

此外,Ampere 還提供一系列不斷優(yōu)化、預(yù)訓(xùn)練的模型,供用戶下載用于演示或在實(shí)際應(yīng)用程序中進(jìn)行調(diào)整并使用。并且,Ampere Altra Max CPU 還可與 NVIDIA GPU 協(xié)同工作,滿足用戶的訓(xùn)練需求。

高度可擴(kuò)展,有效抵抗干擾

憑借創(chuàng)新的可橫向擴(kuò)展架構(gòu),Ampere Altra Max 處理器具有更高的核心數(shù)和出色的單線程性能。結(jié)合所有內(nèi)核可同時(shí)一致頻率運(yùn)行的特性,Ampere Altra Max 的單 CPU 整體性能比目前最好的 x86 服務(wù)器更高、更穩(wěn)定,在多租戶的云環(huán)境中對“嘈雜鄰居”的干擾也更具抵抗力。

基準(zhǔn)測試,彰顯卓越推理性能

為展示 Ampere Altra Max CPU 在多個(gè)具有代表性的 AI 推理任務(wù)中的卓越性能,Ampere 按照 MLCommons 指南運(yùn)行了一系列基準(zhǔn)測試(包括計(jì)算機(jī)視覺和 NLP 應(yīng)用),部分測試的結(jié)果如下。

計(jì)算機(jī)視覺方面,使用 SSD ResNet-34 測試典型的對象檢測應(yīng)用,在 fp32 模式下與比較對象相比,Ampere Altra Max 在低延遲方面最高可領(lǐng)先近 4 倍。在 fp16 模式下,Altra Max 將領(lǐng)先優(yōu)勢擴(kuò)大了兩倍,同時(shí)保持了相同的精度。

52ae8e84-b371-11ed-bfe3-dac502259ad0.png

在性能功耗比方面,Ampere Altra Max 也具有顯著優(yōu)勢。在 fp16 分辨率下,Ampere Altra Max 的能效與比較對象相比高約 5 倍。而在 fp32 分辨率下,Ampere Altra Max 則擁有高約 2 倍的領(lǐng)先優(yōu)勢。

52d9a40c-b371-11ed-bfe3-dac502259ad0.png

面對蓬勃發(fā)展的 AI 應(yīng)用,Ampere AI 解決方案將為 AI 應(yīng)用和數(shù)據(jù)中心的發(fā)展提供更可持續(xù)的綠色算力支撐,助力解決不斷升級的算力需求和日益突出的環(huán)境問題。一直以來,Ampere 著眼未來、不斷創(chuàng)新,將卓越性能和能效融入到為云定制的解決方案中,助力釋放數(shù)字經(jīng)濟(jì)生產(chǎn)力,助推科技產(chǎn)業(yè)在可持續(xù)發(fā)展的道路上一路“狂飆”。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31028

    瀏覽量

    269366
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47373

    瀏覽量

    238860
  • 云原生
    +關(guān)注

    關(guān)注

    0

    文章

    250

    瀏覽量

    7955
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    987

    瀏覽量

    14852
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1563

    瀏覽量

    7787

原文標(biāo)題:創(chuàng)芯課堂|當(dāng) AI 遇上云原生,綠色算力助力開啟 AI 新時(shí)代

文章出處:【微信號:AmpereComputing,微信公眾號:安晟培半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    云原生LLMOps平臺(tái)作用

    云原生LLMOps平臺(tái)是一種基于云計(jì)算基礎(chǔ)設(shè)施和開發(fā)工具,專門用于構(gòu)建、部署和管理大型語言模型(LLM)全生命周期的平臺(tái)。以下,是對云原生LLMOps平臺(tái)作用的梳理,由AI部落小編整理。
    的頭像 發(fā)表于 01-06 10:21 ?27次閱讀

    如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺(tái)因其彈性擴(kuò)展、高效部署、低成本運(yùn)營等優(yōu)勢,逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場上的云原生機(jī)器學(xué)習(xí)平臺(tái)種類繁多,功能各異,如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)呢?下面,
    的頭像 發(fā)表于 12-25 11:54 ?117次閱讀

    企業(yè)AI租賃模式的好處

    構(gòu)建和維護(hù)一個(gè)高效、可擴(kuò)展的AI基礎(chǔ)設(shè)施,不僅需要巨額的初期投資,還涉及復(fù)雜的運(yùn)維管理和持續(xù)的技術(shù)升級。而AI
    的頭像 發(fā)表于 12-24 10:49 ?139次閱讀

    什么是云原生MLOps平臺(tái)

    云原生MLOps平臺(tái),是指利用云計(jì)算的基礎(chǔ)設(shè)施和開發(fā)工具,來構(gòu)建、部署和管理機(jī)器學(xué)習(xí)模型的全生命周期的平臺(tái)。以下,是對云原生MLOps平臺(tái)的介紹,由AI部落小編整理。
    的頭像 發(fā)表于 12-12 13:13 ?118次閱讀

    廣和通開啟端側(cè)AI新時(shí)代

    AI發(fā)展正酣,隨著終端芯片越來越高、端側(cè)模型能力越來越強(qiáng)、實(shí)時(shí)響應(yīng)及隱私保護(hù)的端側(cè)應(yīng)用需求增加,端側(cè)AI已然具備落地的條件。端側(cè)AI離客
    的頭像 發(fā)表于 12-12 10:35 ?213次閱讀

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計(jì)算資源,以滿足其AI應(yīng)用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?725次閱讀

    AI時(shí)代的重要性及現(xiàn)狀:平衡發(fā)展與優(yōu)化配置的挑戰(zhàn)

    AI時(shí)代,扮演著至關(guān)重要的角色。如果說數(shù)據(jù)是AI大模型的“燃料”,那么
    的頭像 發(fā)表于 11-04 11:45 ?452次閱讀

    一體架構(gòu)創(chuàng)新助力國產(chǎn)大AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計(jì)算(HPC)應(yīng)用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《存一體架構(gòu)創(chuàng)新助力國產(chǎn)大
    的頭像 發(fā)表于 10-23 14:48 ?335次閱讀

    KubeCon China 2024全球大會(huì)在香港舉行,京東云受邀參加探討云原生、開源及 AI

    和數(shù)字化大潮一樣,在AI化的革命下,云端也在全面擁抱AI,并在方方面面變得更安全、更高效,讓全球各行各業(yè)受益。2024年8月21日,由云原生計(jì)算基金會(huì)(CNCF)和?Linux?基金會(huì)聯(lián)合主辦
    的頭像 發(fā)表于 08-23 13:42 ?356次閱讀

    大模型時(shí)代需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問題,帶著這個(gè)極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    HDC2024華為發(fā)布鴻蒙原生智能:AI與OS深度融合,開啟全新的AI時(shí)代

    董事長余承東先生表示:全新的Harmony Intelligence鴻蒙原生智能,將開啟全新的AI時(shí)代! ? 軟硬芯云協(xié)同 鴻蒙原生智能深度
    的頭像 發(fā)表于 06-24 09:28 ?628次閱讀
    HDC2024華為發(fā)布鴻蒙<b class='flag-5'>原生</b>智能:<b class='flag-5'>AI</b>與OS深度融合,<b class='flag-5'>開啟</b>全新的<b class='flag-5'>AI</b><b class='flag-5'>時(shí)代</b>

    軟通動(dòng)力亮相2024中國移動(dòng)網(wǎng)絡(luò)大會(huì),共繪網(wǎng)絡(luò)新藍(lán)圖

    4月28日至29日,以“網(wǎng)絡(luò)點(diǎn)亮AI新時(shí)代”為主題的2024中國移動(dòng)網(wǎng)絡(luò)大會(huì)在蘇州隆重舉
    的頭像 發(fā)表于 05-06 10:20 ?485次閱讀
    軟通動(dòng)力亮相2024中國移動(dòng)<b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)大會(huì),共繪<b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)新藍(lán)圖

    一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò),全面釋放AI時(shí)代

    華為中國合作伙伴大會(huì) | 一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò),以網(wǎng)強(qiáng),全面釋放AI時(shí)代
    的頭像 發(fā)表于 03-22 10:28 ?776次閱讀
    一圖看懂星河<b class='flag-5'>AI</b>數(shù)據(jù)中心網(wǎng)絡(luò),全面釋放<b class='flag-5'>AI</b><b class='flag-5'>時(shí)代</b><b class='flag-5'>算</b><b class='flag-5'>力</b>

    云原生是大模型“降本增效”的解藥嗎?

    云原生AI正當(dāng)時(shí)
    的頭像 發(fā)表于 02-20 09:31 ?402次閱讀

    立足,聚焦AI!順網(wǎng)科技全面走進(jìn)AI時(shí)代

    “立足,聚焦AI”,順網(wǎng)科技進(jìn)軍AI時(shí)代的號角已被吹響。 1月18日,順網(wǎng)科技(3001
    的頭像 發(fā)表于 01-19 10:57 ?478次閱讀
    立足<b class='flag-5'>算</b><b class='flag-5'>力</b>,聚焦<b class='flag-5'>AI</b>!順網(wǎng)科技全面走進(jìn)<b class='flag-5'>AI</b>智<b class='flag-5'>算</b><b class='flag-5'>時(shí)代</b>