0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

海力士展示AI專用計(jì)算內(nèi)存解決方案AiMX-xPU

SSDFans ? 來源:SSDFans ? 2025-01-09 16:08 ? 次閱讀

在Hot Chips 2024上,海力士專注于AI加速器的標(biāo)準(zhǔn)DRAM之外的產(chǎn)品。該公司展示了其在內(nèi)存計(jì)算方面的最新進(jìn)展,這次是用其AiMX-xPU和LPDDR-AiM進(jìn)行LLM推理。其理念是,無需將數(shù)據(jù)從內(nèi)存移動(dòng)到計(jì)算以執(zhí)行與內(nèi)存相關(guān)的轉(zhuǎn)換,這些轉(zhuǎn)換可以直接在內(nèi)存中完成,而無需遍歷互連。這使得它更節(jié)能,而且可能更快。

海力士在Hot Chips 2024上展示AI專用計(jì)算內(nèi)存解決方案AiMX-xPU

海力士表示,由于LLM的存儲(chǔ)空間有限,因此對(duì)LLM非常有用。

d7e6e26c-ce1e-11ef-9310-92fbcf53809c.png

該公司展示了采用Xilinx VirtexFPGA和特殊GDDR6 AiM封裝的GDDR6內(nèi)存加速器卡。

d80ba584-ce1e-11ef-9310-92fbcf53809c.png

看下AiMX card:

d839c252-ce1e-11ef-9310-92fbcf53809c.png

下面是GDDR6芯片的外觀。

d86a3dec-ce1e-11ef-9310-92fbcf53809c.png

另外,海力士提到了OCP 2023的現(xiàn)場(chǎng)演示。

d88b8a38-ce1e-11ef-9310-92fbcf53809c.png

這是LLM的全連接層、Multi-Head Attention以及計(jì)算綁定部分。

d8b47b78-ce1e-11ef-9310-92fbcf53809c.png

下圖展示壓力如何根據(jù)批量大小變化。

d8cbb05e-ce1e-11ef-9310-92fbcf53809c.png

海力士將Multi-Head Attention映射到了AiM。

d8e3be60-ce1e-11ef-9310-92fbcf53809c.png

該公司還將內(nèi)存容量增加了一倍,使用32個(gè)AIM軟件包,從16GB增加到32GB。32GB對(duì)于一款產(chǎn)品來說可能不夠,但對(duì)于一個(gè)原型機(jī)來說就足夠了。盡管如此,該公司還是展示了這項(xiàng)技術(shù)的性能。

d901a182-ce1e-11ef-9310-92fbcf53809c.png

下一代演示將展示像Llama-3這樣的東西,該公司也在考慮將每張卡的容量從32GB擴(kuò)展到256GB。

d92e47b4-ce1e-11ef-9310-92fbcf53809c.png

除了關(guān)注數(shù)據(jù)中心的AI,該公司還在關(guān)注設(shè)備上的AI。我們已經(jīng)看到蘋果、英特爾、AMD高通等公司在為人工智能推出NPU。

d950d0a4-ce1e-11ef-9310-92fbcf53809c.png

設(shè)備上的AI通常會(huì)降低批處理大小,因?yàn)檫@些工作負(fù)載受到內(nèi)存限制。將計(jì)算移出SoC意味著它可以更節(jié)能,并且不會(huì)占用SoC上的計(jì)算芯片面積。

d97950ec-ce1e-11ef-9310-92fbcf53809c.png

目標(biāo)是在未來針對(duì)LPDDR5-AiM的產(chǎn)品中優(yōu)化AiM。我們的目標(biāo)是不更改現(xiàn)有的LPDDR命令,也不產(chǎn)生負(fù)面的性能影響。下表上的規(guī)格是預(yù)估的。

d9a00aac-ce1e-11ef-9310-92fbcf53809c.png

通過LPDDR5,它可以集成到移動(dòng)設(shè)備的SoC上。

d9c9815c-ce1e-11ef-9310-92fbcf53809c.png

可能需要針對(duì)不同的應(yīng)用程序進(jìn)行不同的權(quán)衡。

d9e271ee-ce1e-11ef-9310-92fbcf53809c.png

其中一個(gè)挑戰(zhàn)是在LPDDR內(nèi)存的正常使用和計(jì)算需求之間進(jìn)行仲裁。此外,還有可能改變芯片的熱/功率要求。

da013d9a-ce1e-11ef-9310-92fbcf53809c.png

另一個(gè)挑戰(zhàn)是如何對(duì)AiM進(jìn)行編程。

da19d594-ce1e-11ef-9310-92fbcf53809c.png

海力士似乎正在擴(kuò)大AiM/ AiMX的使用范圍和種類。

da32aac4-ce1e-11ef-9310-92fbcf53809c.png

海力士表示,在GDDR6中,AiM占據(jù)了約20%的芯片面積。

總結(jié)

內(nèi)存計(jì)算在成為主流之前。仍然是一個(gè)主要的SoC/芯片供應(yīng)商必須選擇和集成的東西。在許多方面,內(nèi)存計(jì)算可能是有意義的。我們將拭目以待,看看這款產(chǎn)品能否從原型變成產(chǎn)品。

原文鏈接:

https://www.servethehome.com/sk-hynix-ai-specific-computing-memory-solution-aimx-xpu-at-hot-chips-2024/

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 海力士
    +關(guān)注

    關(guān)注

    2

    文章

    135

    瀏覽量

    25971
  • soc
    soc
    +關(guān)注

    關(guān)注

    38

    文章

    4180

    瀏覽量

    218492
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    8

    文章

    3037

    瀏覽量

    74144

原文標(biāo)題:揭秘!海力士的推理和端側(cè)大模型加速卡

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    SK海力士新設(shè)AI芯片開發(fā)與量產(chǎn)部門

    韓國存儲(chǔ)芯片巨頭SK海力士于近日宣布,為鞏固其在人工智能(AI)內(nèi)存領(lǐng)域的領(lǐng)先地位,公司決定在年度組織調(diào)整中新增兩個(gè)專門部門,專注于下一代AI芯片的開發(fā)與量產(chǎn)。 據(jù)悉,這兩個(gè)新部門將由
    的頭像 發(fā)表于 12-06 10:56 ?331次閱讀

    SK海力士將CXL優(yōu)化解決方案應(yīng)用于Linux

    近日,SK海力士(SK hynix Inc.)宣布了一項(xiàng)重大技術(shù)進(jìn)展——其異構(gòu)內(nèi)存軟件開發(fā)工具包(HMSDK)的核心功能已成功集成至全球最大的開源操作系統(tǒng)Linux平臺(tái),標(biāo)志著公司在推動(dòng)高性能計(jì)算與人工智能(
    的頭像 發(fā)表于 09-25 15:00 ?360次閱讀

    SK海力士率先展示UFS 4.1通用閃存

    在最近的FMS 2024峰會(huì)上,SK 海力士憑借其創(chuàng)新實(shí)力,率先向業(yè)界展示了尚未正式發(fā)布規(guī)范的UFS 4.1通用閃存新品,再次引領(lǐng)存儲(chǔ)技術(shù)的前沿。此次展示不僅彰顯了SK 海力士在存儲(chǔ)技
    的頭像 發(fā)表于 08-10 16:52 ?2111次閱讀

    SK海力士即將亮相FMS 2024,展示AI存儲(chǔ)器技術(shù)新突破

    SK海力士即將在8月6日至8日于美國圣克拉拉舉辦的全球半導(dǎo)體存儲(chǔ)器峰會(huì)FMS 2024上大放異彩,向全球業(yè)界展示其在存儲(chǔ)器技術(shù)領(lǐng)域的最新進(jìn)展與對(duì)人工智能(AI)未來的深邃洞察。此次參展,SK
    的頭像 發(fā)表于 08-05 09:26 ?572次閱讀

    SK海力士考慮讓Solidigm在美上市融資

    據(jù)最新消息,SK海力士正醞釀一項(xiàng)重要財(cái)務(wù)戰(zhàn)略,考慮推動(dòng)其NAND與SSD業(yè)務(wù)子公司Solidigm在美國進(jìn)行首次公開募股(IPO)。Solidigm作為SK海力士在2021年底通過收購英特爾相應(yīng)業(yè)務(wù)后成立的獨(dú)立美國子公司,承載著SK海力
    的頭像 發(fā)表于 07-30 17:35 ?996次閱讀

    SK海力士斥資68億美元打造全球AI芯片生產(chǎn)基地

    全球領(lǐng)先的內(nèi)存芯片制造商SK海力士宣布了一項(xiàng)重大投資決策,計(jì)劃投資約9.4萬億韓元(折合美元約68億)在韓國龍仁市興建其國內(nèi)首座專注于AI芯片生產(chǎn)的超級(jí)工廠。此項(xiàng)目標(biāo)志著SK海力士在應(yīng)
    的頭像 發(fā)表于 07-29 11:28 ?519次閱讀

    SK海力士攜手臺(tái)積電,N5工藝打造高性能HBM4內(nèi)存

    在半導(dǎo)體技術(shù)日新月異的今天,SK海力士再次引領(lǐng)行業(yè)潮流,宣布將采用臺(tái)積電先進(jìn)的N5工藝版基礎(chǔ)裸片來構(gòu)建其新一代HBM4內(nèi)存。這一舉措不僅標(biāo)志著SK海力士在高性能存儲(chǔ)解決方案領(lǐng)域的持續(xù)深
    的頭像 發(fā)表于 07-18 09:47 ?672次閱讀

    SK海力士展示存儲(chǔ)新品:固態(tài)硬盤和內(nèi)存模組涵蓋消費(fèi)及企業(yè)市場(chǎng)

    近日,SK海力士在北京召開的戴爾科技全球峰會(huì)上展示了旗下多個(gè)存儲(chǔ)產(chǎn)品線中的新款,包括但不限于內(nèi)存及固態(tài)硬盤等類別。
    的頭像 發(fā)表于 05-22 17:24 ?1697次閱讀

    SK海力士推出新一代移動(dòng)端NAND閃存解決方案

    在智能手機(jī)技術(shù)日新月異的今天,SK海力士再次引領(lǐng)行業(yè)潮流,成功推出新一代移動(dòng)端NAND閃存解決方案——ZUFS 4.0。這款專為端側(cè)AI手機(jī)優(yōu)化的閃存產(chǎn)品,無疑將為用戶帶來前所未有的使用體驗(yàn)。
    的頭像 發(fā)表于 05-11 10:14 ?486次閱讀

    SK海力士推出新一代移動(dòng)端NAND閃存解決方案ZUFS 4.0

    今日,SK海力士公司宣布了一項(xiàng)革命性的技術(shù)突破,他們成功研發(fā)出了面向端側(cè)(On-Device)AI應(yīng)用的全新移動(dòng)端NAND閃存解決方案——“ZUFS(Zoned UFS)4.0”。這款產(chǎn)品的推出,標(biāo)志著SK
    的頭像 發(fā)表于 05-09 11:00 ?613次閱讀

    SK海力士發(fā)布NAND閃存解決方案,助力端側(cè)AI手機(jī)發(fā)展

    SK海力士指出,“ZUFS 4.0是新一代移動(dòng)端NAND閃存解決方案,具備行業(yè)內(nèi)最高性能且專門針對(duì)端側(cè)AI手機(jī)進(jìn)行優(yōu)化?!贝送猓具€強(qiáng)調(diào),“借助此產(chǎn)品,我們將在NAND閃存領(lǐng)域引領(lǐng)AI
    的頭像 發(fā)表于 05-09 09:30 ?434次閱讀

    剛剛!SK海力士出局!

    來源:集成電路前沿,謝謝 編輯:感知芯視界 Link 3月25日消息,據(jù)報(bào)道,由于SK海力士部分工程出現(xiàn)問題,英偉達(dá)所需的12層HBM3E內(nèi)存,將由三星獨(dú)家供貨,SK海力士出局! 據(jù)了解,HBM需要
    的頭像 發(fā)表于 03-27 09:12 ?635次閱讀

    SK海力士展示業(yè)界最高標(biāo)準(zhǔn)適于AI應(yīng)用的存儲(chǔ)器產(chǎn)品

    3月18日至21日,SK海力士在圣何塞舉辦的2024年度英偉達(dá)GPU技術(shù)大會(huì)(NVIDIA GTC 2024,NVIDIA GPU Technology Conference 2024)上,展示了公司最新適于AI應(yīng)用的存儲(chǔ)技術(shù)。
    的頭像 發(fā)表于 03-21 09:04 ?616次閱讀

    SK海力士加大對(duì)先進(jìn)芯片封裝投入

    SK海力士作為半導(dǎo)體行業(yè)的領(lǐng)軍企業(yè),正積極響應(yīng)市場(chǎng)需求的變化,并敏銳地把握住了高帶寬內(nèi)存(HBM)市場(chǎng)的增長潛力。隨著數(shù)據(jù)處理速度需求的提升,HBM以其卓越的性能和帶寬特性,正成為AI等高性能
    的頭像 發(fā)表于 03-08 09:16 ?607次閱讀

    SK海力士加大高帶寬內(nèi)存生產(chǎn)投入

    SK海力士近日宣布,將進(jìn)一步擴(kuò)大高帶寬內(nèi)存生產(chǎn)設(shè)施的投資,以滿足高性能AI產(chǎn)品市場(chǎng)的不斷增長需求。
    的頭像 發(fā)表于 01-29 16:54 ?1001次閱讀