0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

海力士展示AI專用計算內存解決方案AiMX-xPU

SSDFans ? 來源:SSDFans ? 2025-01-09 16:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在Hot Chips 2024上,海力士專注于AI加速器的標準DRAM之外的產品。該公司展示了其在內存計算方面的最新進展,這次是用其AiMX-xPU和LPDDR-AiM進行LLM推理。其理念是,無需將數據從內存移動到計算以執(zhí)行與內存相關的轉換,這些轉換可以直接在內存中完成,而無需遍歷互連。這使得它更節(jié)能,而且可能更快。

海力士在Hot Chips 2024上展示AI專用計算內存解決方案AiMX-xPU

海力士表示,由于LLM的存儲空間有限,因此對LLM非常有用。

d7e6e26c-ce1e-11ef-9310-92fbcf53809c.png

該公司展示了采用Xilinx VirtexFPGA和特殊GDDR6 AiM封裝的GDDR6內存加速器卡。

d80ba584-ce1e-11ef-9310-92fbcf53809c.png

看下AiMX card:

d839c252-ce1e-11ef-9310-92fbcf53809c.png

下面是GDDR6芯片的外觀。

d86a3dec-ce1e-11ef-9310-92fbcf53809c.png

另外,海力士提到了OCP 2023的現場演示。

d88b8a38-ce1e-11ef-9310-92fbcf53809c.png

這是LLM的全連接層、Multi-Head Attention以及計算綁定部分。

d8b47b78-ce1e-11ef-9310-92fbcf53809c.png

下圖展示壓力如何根據批量大小變化。

d8cbb05e-ce1e-11ef-9310-92fbcf53809c.png

海力士將Multi-Head Attention映射到了AiM。

d8e3be60-ce1e-11ef-9310-92fbcf53809c.png

該公司還將內存容量增加了一倍,使用32個AIM軟件包,從16GB增加到32GB。32GB對于一款產品來說可能不夠,但對于一個原型機來說就足夠了。盡管如此,該公司還是展示了這項技術的性能。

d901a182-ce1e-11ef-9310-92fbcf53809c.png

下一代演示將展示像Llama-3這樣的東西,該公司也在考慮將每張卡的容量從32GB擴展到256GB。

d92e47b4-ce1e-11ef-9310-92fbcf53809c.png

除了關注數據中心的AI,該公司還在關注設備上的AI。我們已經看到蘋果、英特爾AMD高通等公司在為人工智能推出NPU。

d950d0a4-ce1e-11ef-9310-92fbcf53809c.png

設備上的AI通常會降低批處理大小,因為這些工作負載受到內存限制。將計算移出SoC意味著它可以更節(jié)能,并且不會占用SoC上的計算芯片面積。

d97950ec-ce1e-11ef-9310-92fbcf53809c.png

目標是在未來針對LPDDR5-AiM的產品中優(yōu)化AiM。我們的目標是不更改現有的LPDDR命令,也不產生負面的性能影響。下表上的規(guī)格是預估的。

d9a00aac-ce1e-11ef-9310-92fbcf53809c.png

通過LPDDR5,它可以集成到移動設備的SoC上。

d9c9815c-ce1e-11ef-9310-92fbcf53809c.png

可能需要針對不同的應用程序進行不同的權衡。

d9e271ee-ce1e-11ef-9310-92fbcf53809c.png

其中一個挑戰(zhàn)是在LPDDR內存的正常使用和計算需求之間進行仲裁。此外,還有可能改變芯片的熱/功率要求。

da013d9a-ce1e-11ef-9310-92fbcf53809c.png

另一個挑戰(zhàn)是如何對AiM進行編程。

da19d594-ce1e-11ef-9310-92fbcf53809c.png

海力士似乎正在擴大AiM/ AiMX的使用范圍和種類。

da32aac4-ce1e-11ef-9310-92fbcf53809c.png

海力士表示,在GDDR6中,AiM占據了約20%的芯片面積。

總結

內存計算在成為主流之前。仍然是一個主要的SoC/芯片供應商必須選擇和集成的東西。在許多方面,內存計算可能是有意義的。我們將拭目以待,看看這款產品能否從原型變成產品。

原文鏈接:

https://www.servethehome.com/sk-hynix-ai-specific-computing-memory-solution-aimx-xpu-at-hot-chips-2024/

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 海力士
    +關注

    關注

    2

    文章

    135

    瀏覽量

    26357
  • soc
    soc
    +關注

    關注

    38

    文章

    4361

    瀏覽量

    222107
  • 內存
    +關注

    關注

    8

    文章

    3115

    瀏覽量

    75100

原文標題:揭秘!海力士的推理和端側大模型加速卡

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    SK海力士HBM技術的發(fā)展歷史

    SK海力士在鞏固其面向AI的存儲器領域領導地位方面,HBM1無疑發(fā)揮了決定性作用。無論是率先開發(fā)出全球首款最高性能的HBM,還是確立并保持其在面向AI的存儲器市場的領先地位,這些成就的背后皆源于SK
    的頭像 發(fā)表于 06-18 15:31 ?382次閱讀

    英偉達供應商SK海力士盈利大增158%

    得益于AI需求的有力推動;高帶寬內存(HBM)需求持續(xù)暴漲,這帶動了英偉達供應商SK海力士盈利大增158%。 據SK海力士公布的財務業(yè)績數據顯示,在2025年第一季度SK
    的頭像 發(fā)表于 04-24 10:44 ?518次閱讀

    SK海力士增產HBM DRAM,應對AI芯片市場旺盛需求

    SK海力士今年計劃大幅提升其高帶寬內存(HBM)的DRAM產能,目標是將每月產能從去年的10萬片增加至17萬片,這一增幅達到了70%。此舉被視為該公司對除最大客戶英偉達外,其他領先人工智能(AI)芯片公司需求激增的積極回應。
    的頭像 發(fā)表于 01-07 16:39 ?627次閱讀

    SK海力士加速16Hi HBM3E內存量產準備

    近日,SK海力士正全力加速其全球首創(chuàng)的16層堆疊(16Hi)HBM3E內存的量產準備工作。這一創(chuàng)新產品的全面生產測試已經正式啟動,為明年初的樣品出樣乃至2025年上半年的大規(guī)模量產與供應奠定了
    的頭像 發(fā)表于 12-26 14:46 ?643次閱讀

    SK海力士新設AI芯片開發(fā)與量產部門

    韓國存儲芯片巨頭SK海力士于近日宣布,為鞏固其在人工智能(AI)內存領域的領先地位,公司決定在年度組織調整中新增兩個專門部門,專注于下一代AI芯片的開發(fā)與量產。 據悉,這兩個新部門將由
    的頭像 發(fā)表于 12-06 10:56 ?696次閱讀

    SK海力士展出全球首款16層HBM3E芯片

    在近日舉行的SK AI峰會上,韓國存儲巨頭SK海力士向全球展示了其創(chuàng)新成果——全球首款48GB 16層HBM3E產品。這一產品的推出,標志著SK海力士在高端存儲技術領域的又一次重大突破
    的頭像 發(fā)表于 11-13 14:35 ?829次閱讀

    SK海力士亮相2024年進博會,以面向AI的半導體存儲器賦能AI時代

    的信心,建立與世界的對話。在今年全球行業(yè)巨頭共襄盛舉的舞臺上,SK集團的重要成員公司——SK海力士攜手SK中國及SK電訊,以“智享幸福”為主題,共同亮相2024年進博會。 ? 新一代存儲解決方案, 引領人工智能發(fā)展 SK海力士
    的頭像 發(fā)表于 11-10 10:29 ?1338次閱讀
    SK<b class='flag-5'>海力士</b>亮相2024年進博會,以面向<b class='flag-5'>AI</b>的半導體存儲器賦能<b class='flag-5'>AI</b>時代

    SK海力士將CXL優(yōu)化解決方案應用于Linux

    近日,SK海力士(SK hynix Inc.)宣布了一項重大技術進展——其異構內存軟件開發(fā)工具包(HMSDK)的核心功能已成功集成至全球最大的開源操作系統(tǒng)Linux平臺,標志著公司在推動高性能計算與人工智能(
    的頭像 發(fā)表于 09-25 15:00 ?617次閱讀

    SK海力士率先展示UFS 4.1通用閃存

    在最近的FMS 2024峰會上,SK 海力士憑借其創(chuàng)新實力,率先向業(yè)界展示了尚未正式發(fā)布規(guī)范的UFS 4.1通用閃存新品,再次引領存儲技術的前沿。此次展示不僅彰顯了SK 海力士在存儲技
    的頭像 發(fā)表于 08-10 16:52 ?2492次閱讀

    SK海力士即將亮相FMS 2024,展示AI存儲器技術新突破

    SK海力士即將在8月6日至8日于美國圣克拉拉舉辦的全球半導體存儲器峰會FMS 2024上大放異彩,向全球業(yè)界展示其在存儲器技術領域的最新進展與對人工智能(AI)未來的深邃洞察。此次參展,SK
    的頭像 發(fā)表于 08-05 09:26 ?805次閱讀

    SK海力士考慮讓Solidigm在美上市融資

    據最新消息,SK海力士正醞釀一項重要財務戰(zhàn)略,考慮推動其NAND與SSD業(yè)務子公司Solidigm在美國進行首次公開募股(IPO)。Solidigm作為SK海力士在2021年底通過收購英特爾相應業(yè)務后成立的獨立美國子公司,承載著SK海力
    的頭像 發(fā)表于 07-30 17:35 ?1462次閱讀

    SK海力士斥資68億美元打造全球AI芯片生產基地

    全球領先的內存芯片制造商SK海力士宣布了一項重大投資決策,計劃投資約9.4萬億韓元(折合美元約68億)在韓國龍仁市興建其國內首座專注于AI芯片生產的超級工廠。此項目標志著SK海力士在應
    的頭像 發(fā)表于 07-29 11:28 ?789次閱讀

    SK海力士攜手臺積電,N5工藝打造高性能HBM4內存

    在半導體技術日新月異的今天,SK海力士再次引領行業(yè)潮流,宣布將采用臺積電先進的N5工藝版基礎裸片來構建其新一代HBM4內存。這一舉措不僅標志著SK海力士在高性能存儲解決方案領域的持續(xù)深
    的頭像 發(fā)表于 07-18 09:47 ?929次閱讀

    SK海力士探索無焊劑鍵合技術,引領HBM4創(chuàng)新生產

    在半導體存儲技術的快速發(fā)展浪潮中,SK海力士,作為全球領先的內存芯片制造商,正積極探索前沿技術,以推動高帶寬內存(HBM)的進一步演進。據最新業(yè)界消息,SK海力士正著手評估將無助焊劑鍵
    的頭像 發(fā)表于 07-17 15:17 ?1467次閱讀

    SK海力士開發(fā)出用于端側AI PC的高性能固態(tài)硬盤PCB01

    (SSD)——PCB01。這款產品的推出,不僅標志著SK海力士在NAND閃存解決方案領域的又一次重大突破,也預示著AI存儲器市場將迎來新的變革。
    的頭像 發(fā)表于 07-01 14:58 ?871次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品