0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

Carol Li ? 來(lái)源:電子發(fā)燒友 ? 作者:李彎彎 ? 2025-04-12 00:57 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會(huì)上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計(jì)于今年晚些時(shí)候面向 Google Cloud 客戶開放,將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項(xiàng)。


在核心亮點(diǎn)層面,Ironwood 堪稱谷歌首款專門為 AI 推理精心設(shè)計(jì)的 TPU 芯片,能夠有力支持大規(guī)模思考與推理 AI 模型。谷歌方面表示,它代表著 AI 發(fā)展從 “響應(yīng)式” 向 “主動(dòng)式” 的范式轉(zhuǎn)變,未來(lái) AI 代理將能夠主動(dòng)檢索并生成數(shù)據(jù),進(jìn)而提供深度見解,而非僅僅輸出原始數(shù)據(jù)。

在性能與能效表現(xiàn)上,Ironwood 取得了重大突破。其每瓦性能達(dá)到上一代 TPU Trillium 的兩倍,能效近乎首款云 TPU 的 30 倍。單芯片配備 192GB 高帶寬內(nèi)存(HBM),容量為 Trillium 的 6 倍;HBM 帶寬高達(dá) 7.2TB/s,是 Trillium 的 4.5 倍。芯片間互連(ICI)帶寬提升至 1.2TB/s,為 Trillium 的 1.5 倍,這一提升有力地支持了大規(guī)模分布式訓(xùn)練與推理任務(wù)。

此外,Ironwood 還是谷歌首款支持 FP8 浮點(diǎn)格式的 TPU 芯片。在此之前,TPU 僅支持 INT8(用于推理)和 BF16(用于訓(xùn)練)。采用 FP8 計(jì)算可使 AI 訓(xùn)練吞吐量翻倍,性能相較于 BF16 提升 10 倍。

Ironwood 還配備了增強(qiáng)版 SparseCore 專用加速器,可用于處理高級(jí)排名和推薦任務(wù)中常見的超大嵌入。憑借這一增強(qiáng)版 SparseCore,其能夠加速更多領(lǐng)域的任務(wù),應(yīng)用范圍從傳統(tǒng)的 AI 任務(wù)拓展至金融和科學(xué)等領(lǐng)域。

在系統(tǒng)架構(gòu)與擴(kuò)展性方面,Ironwood 可擴(kuò)展至 9216 個(gè)液冷芯片,借助突破性的 ICI 網(wǎng)絡(luò)進(jìn)行連接,功率接近 10 兆瓦。它提供 256 芯片和 9216 芯片兩種 Pod 配置,其中 9216 芯片的 Pod 配置整體 AI 算力可達(dá) 42.5 Exaflops。谷歌先進(jìn)的液冷解決方案能夠確保芯片在持續(xù)繁重的 AI 工作負(fù)載下依然保持高性能。

谷歌的 TPU 作為專為機(jī)器學(xué)習(xí)設(shè)計(jì)的定制化加速芯片,自 2015 年首次亮相以來(lái),已成為 AI 硬件領(lǐng)域的重要力量。TPU 主要應(yīng)用于訓(xùn)練和推理大規(guī)模 AI 模型(如 AlphaGo、PaLM、Gemini 等),并深度融入 Google Cloud 以及谷歌內(nèi)部 AI 服務(wù)之中。

截至目前,TPU 已歷經(jīng)多次版本迭代:TPU v1 支持 INT8 精度,主要用于谷歌內(nèi)部項(xiàng)目(如 AlphaGo、RankBrain);TPU v2/v3 面向訓(xùn)練與推理場(chǎng)景,支持浮點(diǎn)運(yùn)算,v3 進(jìn)一步增加了內(nèi)存和互連帶寬;TPU v4 的算力達(dá)到 TPU v3 的 2.7 倍,采用液冷技術(shù),支持 4096 芯片互聯(lián)的 Pod 集群,適用于超大規(guī)模模型(如 PaLM)。

由此可見,谷歌 TPU 憑借其專用化設(shè)計(jì)、高能效比以及與 TensorFlow 的深度集成等優(yōu)勢(shì),成為大規(guī)模 AI 模型訓(xùn)練與推理的核心硬件支撐。如今,Ironwood 的推出不僅將進(jìn)一步鞏固谷歌在 AI 硬件領(lǐng)域的領(lǐng)先地位,也勢(shì)必為生成式 AI 的下一階段發(fā)展提供強(qiáng)大的計(jì)算動(dòng)力。?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6219

    瀏覽量

    107051
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    151

    瀏覽量

    20996
收藏 0人收藏

    評(píng)論

    相關(guān)推薦

    Google推出第七TPU芯片Ironwood

    在 Google Cloud Next 25 大會(huì)上,我們隆重推出第 7 Tensor Processing Unit (TPU) — Ironwood。這不僅是我們迄今為止性能最高、擴(kuò)展性最佳的定制
    的頭像 發(fā)表于 04-16 11:20 ?275次閱讀
    Google推出第七<b class='flag-5'>代</b><b class='flag-5'>TPU</b><b class='flag-5'>芯片</b><b class='flag-5'>Ironwood</b>

    谷歌第七TPU Ironwood深度解讀:AI推理時(shí)代的硬件革命

    谷歌第七TPU Ironwood深度解讀:AI推理時(shí)代的硬件革命 Google 發(fā)布了
    的頭像 發(fā)表于 04-12 11:10 ?1063次閱讀
    <b class='flag-5'>谷歌</b>第七<b class='flag-5'>代</b><b class='flag-5'>TPU</b> <b class='flag-5'>Ironwood</b>深度解讀:<b class='flag-5'>AI</b><b class='flag-5'>推理</b>時(shí)代的硬件革命

    適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    ,成為新一代AI數(shù)據(jù)中心的核心驅(qū)動(dòng)力。 AI時(shí)代的兩大數(shù)據(jù)中心:AI工廠與AIAI時(shí)代
    發(fā)表于 03-25 17:35

    讓大模型訓(xùn)練更高效,奇異摩爾用互聯(lián)創(chuàng)新方案定義下一代AI計(jì)算

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)近段時(shí)間以來(lái),DeepSeek現(xiàn)象級(jí)爆火引發(fā)產(chǎn)業(yè)對(duì)大規(guī)模數(shù)據(jù)中心建設(shè)的思考和爭(zhēng)議。在訓(xùn)練端,DeepSeek以開源模型通過(guò)算法優(yōu)化(如稀疏計(jì)算、動(dòng)態(tài)
    的頭像 發(fā)表于 02-18 09:19 ?891次閱讀
    讓大<b class='flag-5'>模型</b>訓(xùn)練更高效,奇異摩爾用互聯(lián)創(chuàng)新方案定義下<b class='flag-5'>一代</b><b class='flag-5'>AI</b>計(jì)算

    OpenAI發(fā)布新一代推理模型o3及o3-mini

    近日,OpenAI在為期12天的發(fā)布會(huì)上宣布了新一代推理模型o3及其精簡(jiǎn)版o3-mini。這兩款模型被專門設(shè)計(jì)用于在回答問(wèn)題之前進(jìn)行更深入的思考,以期提高答案的準(zhǔn)確性。 據(jù)悉,o3
    的頭像 發(fā)表于 12-24 09:29 ?708次閱讀

    英偉達(dá)新一代AI芯片過(guò)熱問(wèn)題引關(guān)注

    近日,英偉達(dá)新一代Blackwell AI芯片遭遇過(guò)熱問(wèn)題,這消息引發(fā)了業(yè)界的廣泛關(guān)注。據(jù)悉,搭載該芯片的服務(wù)器在運(yùn)行過(guò)程中存在過(guò)熱現(xiàn)象,
    的頭像 發(fā)表于 11-19 16:15 ?497次閱讀

    【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 第、二章學(xué)習(xí)感受

    ,回憶感瞬間拉滿,魂斗羅、赤色要塞、綠色兵團(tuán)……,還有兒時(shí)玩游戲都能“起飛”的小伙伴! 第章最后介紹了算法的新一代引擎Google TPU,它在計(jì)算流程方面,也與CPU、GPU有較大
    發(fā)表于 10-10 10:36

    聯(lián)發(fā)科新一代天璣旗艦芯片針對(duì)谷歌大語(yǔ)言模型Gemini Nano優(yōu)化

    近日,聯(lián)發(fā)科宣布了個(gè)重要的技術(shù)進(jìn)展——新一代天璣旗艦芯片已經(jīng)針對(duì)谷歌的大語(yǔ)言模型Gemini Nano進(jìn)行了深度優(yōu)化。
    的頭像 發(fā)表于 10-09 16:44 ?665次閱讀

    TPU v1到Trillium TPU,蘋果等科技公司使用谷歌TPU進(jìn)行AI計(jì)算

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)7月30日消息,蘋果公司周篇技術(shù)論文中表示,支撐其人工智能系統(tǒng)Apple Intelligence的兩個(gè)人工智能模型是在谷歌設(shè)計(jì)的云端
    的頭像 發(fā)表于 07-31 01:08 ?3662次閱讀

    螞蟻數(shù)科發(fā)布新一代融合AI風(fēng)控引擎“AIR Engine”

    在數(shù)字化浪潮的推動(dòng)下,金融科技領(lǐng)域的風(fēng)控技術(shù)正迎來(lái)新的突破。近日,螞蟻數(shù)科旗下的蟻盾風(fēng)控團(tuán)隊(duì)正式發(fā)布了新一代融合AI風(fēng)控引擎——“AIR Engine(AIFUSERiskEngine)”,該
    的頭像 發(fā)表于 06-26 18:20 ?1593次閱讀

    谷歌發(fā)布新一代TPU芯片,欲挑戰(zhàn)OpenAI,挑戰(zhàn)語(yǔ)音助手市場(chǎng)

    當(dāng)日,谷歌在年度I/O開發(fā)者大會(huì)上展示了系列人工智能產(chǎn)品,包括新增的旗艦級(jí)Gemini AI模型Gemini 1.5 Flash以及AI
    的頭像 發(fā)表于 05-17 09:36 ?575次閱讀

    谷歌發(fā)布第六TPU芯片Trillium,挑戰(zhàn)GPT-4o

    分析人士認(rèn)為,谷歌積極推進(jìn)自主研發(fā)芯片,按照其規(guī)劃,第七和第八產(chǎn)品將分別與聯(lián)發(fā)科、世芯合作生產(chǎn)。此次第六
    的頭像 發(fā)表于 05-16 18:05 ?1745次閱讀

    谷歌將推出第六數(shù)據(jù)中心AI芯片Trillium TPU

    在今日舉行的I/O 2024開發(fā)者大會(huì)上,谷歌公司震撼發(fā)布了其第六數(shù)據(jù)中心AI芯片——Trillium Tensor處理器單元(TPU)。
    的頭像 發(fā)表于 05-15 11:18 ?802次閱讀

    進(jìn)步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    性能,加速模型的訓(xùn)練和推理過(guò)程。 2. 生成式 AI 解決方案 與英偉達(dá) Grace CPU、新一代網(wǎng)絡(luò)芯片等產(chǎn)品
    發(fā)表于 05-13 17:16

    英特爾AI產(chǎn)品助力其運(yùn)行Meta新一代大語(yǔ)言模型Meta Llama 3

    英特爾豐富的AI產(chǎn)品——面向數(shù)據(jù)中心的至強(qiáng)處理器,邊緣處理器及AI PC等產(chǎn)品為開發(fā)者提供最新的優(yōu)化,助力其運(yùn)行Meta新一代大語(yǔ)言模型Me
    的頭像 發(fā)表于 04-28 11:16 ?830次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品