0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPT模型推動(dòng)存儲廠商加速PIM進(jìn)程

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2023-04-10 05:09 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))存內(nèi)計(jì)算這個(gè)概念從被提出開始,就選定了AI作為主要應(yīng)用領(lǐng)域,但苦于當(dāng)時(shí)的需求并不算高,技術(shù)也還在完善成熟中,我們更多是在一些學(xué)術(shù)論壇和行業(yè)會議上見到存儲廠商和AI芯片廠商對其高談闊論。

可誰知道2023年我們迎來了消費(fèi)級存儲市場的萎靡,卻又在ChatGPT的應(yīng)援之下帶火了高帶寬內(nèi)存。這不,三星、SK海力士等廠商紛紛迎來了HBM訂單和單價(jià)的瘋漲,也使得他們打算加速推進(jìn)PIM的開發(fā)進(jìn)度。

SK海力士的AiM方案

SK海力士在近期提出了他們的首個(gè)PIM方案,AiM。AiM是一個(gè)基于GDDR6的存內(nèi)計(jì)算方案,專門為了加速內(nèi)存負(fù)載密集的機(jī)器學(xué)習(xí)應(yīng)用而設(shè)計(jì)。而GDDR6作為當(dāng)下GPU產(chǎn)品的主要顯存形式之一,提供了足夠的帶寬,但并沒有提供額外的計(jì)算能力,更別說卸載CPU、GPU的運(yùn)算任務(wù)了。


AiM存內(nèi)加速器方案/ SK海力士


而在機(jī)器學(xué)習(xí)應(yīng)用中,SK海力士的AiM方案可以卸載96%的計(jì)算任務(wù),交由DRAM的存內(nèi)計(jì)算單元來完成,實(shí)現(xiàn)了超高的內(nèi)存bank并行度,顯著減少了CPU與內(nèi)存之間的數(shù)據(jù)移動(dòng),而且相比HBM,GDDR6明顯是一個(gè)成本更低的方案。

正是因?yàn)橛辛诉@些優(yōu)勢,AiM可以說是專為GPT類應(yīng)用打造的,SK海力士也給出了在GPT模型下的性能評估。對于GPT-2和GPT-3乃至現(xiàn)在的GPT-4來說,都屬于內(nèi)存負(fù)載密集型的應(yīng)用,所以也更容易遇到內(nèi)存墻的問題。

SK海力士AiM的另一大優(yōu)勢在于他們已經(jīng)實(shí)現(xiàn)了全套軟件棧,包括設(shè)備驅(qū)動(dòng)、runtime庫、框架和應(yīng)用等,也支持AiM軟件仿真器,支持用戶自行開發(fā)AI應(yīng)用,而無需硬件評估板。

三星的PIM進(jìn)程


其實(shí)其他廠商也早有在PIM上布局,尤其是三星。早在2021年初推出HBM2E后,三星就已經(jīng)開始規(guī)劃如何充分利用這些高帶寬內(nèi)存的性能,其中之一就是PIM。與SK海力士不同的是,三星打造的首個(gè)PIM為HBM-PIM,在內(nèi)存核心中了集成了名為可編程計(jì)算單元的AI引擎,用于處理一部分的邏輯功能。

同年的HotChips大會上,三星展示了將其HBM-PIM集成到Xilinx的AlveoAI加速器系統(tǒng)中。根據(jù)三星提供的數(shù)據(jù),該方案提供了2.5倍的系統(tǒng)性能提升,同時(shí)將功耗降低了60%。從三星半導(dǎo)體的PIM技術(shù)展示也來看,他們也計(jì)劃將這一技術(shù)應(yīng)用到GDDR和LPDDR中,不過這幾年間的主要技術(shù)公開展示都集中在HBM-PIM上。

除了這種將PIM集成到商用AI加速器的方案以外,三星也同時(shí)推出了直接將PIM集成到DRAM模塊中的方案AXDIMM,通過直接在DRAM模塊中對多組內(nèi)存芯片進(jìn)行并行運(yùn)算,減少了CPU和DRAM之間的大量數(shù)據(jù)移動(dòng)。

三星稱在基于AI的推薦應(yīng)用中,AXDIMM可以使得整體系統(tǒng)能效提高40%,不過對于GPT這種生成式AI類的應(yīng)用能夠帶來多少提升我們就不得而知了,畢竟三星的PIM方案推出時(shí)大部分AI應(yīng)用還停留在圖片分類、文字翻譯和語音識別上。

小結(jié)

從這些PIM產(chǎn)品的布局來看,集成式的方案或許對AI加速器廠商來說更有吸引力,不管這些計(jì)算單元是CPU、GPU、FPGA還是ASIC芯片。但無論是三星還是SK海力士,這些方案落地到產(chǎn)品上都需要一定的時(shí)間,所以我們可能得等到下一代產(chǎn)品中,才能看到存內(nèi)計(jì)算的存在。

但不得不說,對于已有布局存內(nèi)計(jì)算的存儲廠商來說,這無疑是一大利好。過去這種和負(fù)責(zé)計(jì)算的邏輯芯片搶活干的設(shè)計(jì)無疑是自砸招牌,但現(xiàn)在看來卻已經(jīng)成了一種趨勢,這類存儲廠商對于市場波動(dòng)的抵抗力也會更強(qiáng)一些。只不過目前看來這類PIM技術(shù)目前還是優(yōu)先針對功耗相對較高的內(nèi)存,未來要想在移動(dòng)市場有所成就,還得看這些存儲廠商后續(xù)會推出怎樣的LPDDR-PIM方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • pim
    pim
    +關(guān)注

    關(guān)注

    0

    文章

    66

    瀏覽量

    20701
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    354

    瀏覽量

    15414
收藏 人收藏

    評論

    相關(guān)推薦

    三星與SK海力士攜手推進(jìn)LPDDR6-PIM產(chǎn)品標(biāo)準(zhǔn)化

    據(jù)外媒最新報(bào)道,韓國兩大存儲芯片巨頭三星電子與SK海力士已正式結(jié)盟,共同致力于推動(dòng)LPDDR6的存內(nèi)計(jì)算(Processing In Memory,簡稱PIM)產(chǎn)品的標(biāo)準(zhǔn)化進(jìn)程。此舉旨
    的頭像 發(fā)表于 12-03 10:42 ?254次閱讀

    深信服發(fā)布安全GPT4.0數(shù)據(jù)安全大模型

    近日,深信服在數(shù)據(jù)安全領(lǐng)域邁出了重要一步,正式發(fā)布了安全GPT4.0數(shù)據(jù)安全大模型。這一創(chuàng)新的大模型技術(shù),旨在為用戶提供更高效、精準(zhǔn)的數(shù)據(jù)安全解決方案。
    的頭像 發(fā)表于 10-29 11:12 ?254次閱讀

    如何尋找PIM源?TS無源互調(diào)PIM排查方案精準(zhǔn)定位與高效尋源

    一、方案背景 PIM問題嚴(yán)重威脅著通信系統(tǒng)的安全、正常工作,同時(shí)也制約著通信技術(shù)的進(jìn)一步發(fā)展。目前,無線網(wǎng)絡(luò)變得更加復(fù)雜。當(dāng)各種信號組合后,便會產(chǎn)生PIM源,很容易對LTE信號造成干擾的失真。PIM
    的頭像 發(fā)表于 08-05 10:29 ?275次閱讀
    如何尋找<b class='flag-5'>PIM</b>源?TS無源互調(diào)<b class='flag-5'>PIM</b>排查方案精準(zhǔn)定位與高效尋源

    OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

    OpenAI推出了GPT-4o mini模型,用來取代GPT-3.5.這是目前市場上最具成本效益的小模型。 ? 該模型在MMLU上得分為82
    的頭像 發(fā)表于 07-21 10:20 ?1066次閱讀
    OpenAI 推出 <b class='flag-5'>GPT</b>-4o mini 取代<b class='flag-5'>GPT</b> 3.5 性能超越<b class='flag-5'>GPT</b> 4 而且更快 API KEY更便宜

    GPT的定義和演進(jìn)歷程

    GPT,全稱Generative Pretrained Transformer,是OpenAI公司在自然語言處理(NLP)領(lǐng)域的一項(xiàng)重大創(chuàng)新。這一模型不僅推動(dòng)了AI技術(shù)的邊界,還深刻影響了我們與機(jī)器交互的方式。本文將從
    的頭像 發(fā)表于 07-10 10:41 ?1120次閱讀

    OpenAI發(fā)布全新GPT-4o模型

    近日,OpenAI宣布推出全新的GPT-4o模型,標(biāo)志著人工智能領(lǐng)域的一大技術(shù)飛躍。這款模型不僅具備強(qiáng)大的生成能力,還能精準(zhǔn)理解用戶意圖,提供智能化的回答。
    的頭像 發(fā)表于 05-17 11:48 ?662次閱讀

    高效能ZR執(zhí)行器:推動(dòng)工業(yè)4.0進(jìn)程加速

    高效能ZR執(zhí)行器:推動(dòng)工業(yè)4.0進(jìn)程加速 在工業(yè)4.0浪潮席卷全球的今天,智能化、自動(dòng)化和高效化成為制造業(yè)轉(zhuǎn)型升級的核心關(guān)鍵詞。在這個(gè)變革的時(shí)代,高效能ZR執(zhí)行器以其卓越的性能和強(qiáng)大的推動(dòng)
    的頭像 發(fā)表于 05-16 10:54 ?416次閱讀

    OpenAI推出面向所有用戶的AI模型GPT-4o

    在周一的直播盛會上,OpenAI揭開了其最新的人工智能模型GPT-4o的神秘面紗。這款新模型旨在為其著名的聊天機(jī)器人ChatGPT提供更強(qiáng)大、更經(jīng)濟(jì)的支持。GPT-4o是此前備受矚目的
    的頭像 發(fā)表于 05-15 09:23 ?406次閱讀

    【大語言模型:原理與工程實(shí)踐】揭開大語言模型的面紗

    的進(jìn)步,大語言模型的應(yīng)用范圍和影響力將持續(xù)擴(kuò)大,成為AI領(lǐng)域的重要推動(dòng)力。其中,GPT系列模型的發(fā)展尤為引人注目,從GPT
    發(fā)表于 05-04 23:55

    蘋果ReALM模型在實(shí)體識別測試中超越OpenAI GPT-4.0

    “我們的模型在識別各種類型實(shí)體方面都有顯著提升,即使是小尺寸模型,在屏幕實(shí)體識別準(zhǔn)確性上也已超過原有的系統(tǒng)5%以上。在與GPT-3.5和GPT-4.0的比較中,小型
    的頭像 發(fā)表于 04-02 11:23 ?485次閱讀

    理想汽車首度備案自研大模型Mind GPT,成為汽車廠商該領(lǐng)域先行者

    另外,理想汽車表示,Mind GPT為業(yè)內(nèi)唯一一款無需依賴輔助指令詞即可實(shí)現(xiàn)應(yīng)用的大模型,更是僅有的專注于車載場景打造的大模型。并且,配合升級后的理想同學(xué)系統(tǒng),該模型還具備方言識別、自
    的頭像 發(fā)表于 03-28 13:42 ?381次閱讀

    澎峰科技加速中國“主權(quán)級”大模型

    人工智能(AI)大模型的發(fā)展日新月異。視頻生成大模型Sora的熱度尚未褪去,號稱超越GPT-4的Claude 3系列大模型等相繼推出。
    的頭像 發(fā)表于 03-27 16:58 ?639次閱讀

    OpenAI有望在年中推出全新GPT-5模型

    近日,人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI傳來了令人振奮的消息。據(jù)悉,他們有望在今年的年中,大約是夏季時(shí)分,推出全新的GPT-5模型。這一消息引發(fā)了業(yè)界的廣泛關(guān)注與期待。
    的頭像 發(fā)表于 03-22 11:29 ?790次閱讀

    微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

    起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級至GPT-4取得顯著進(jìn)步,如今再次更新至性能卓越的GPT-4 Turbo
    的頭像 發(fā)表于 03-13 13:42 ?743次閱讀

    360集團(tuán)和哪吒汽車合作 將共同發(fā)布NETA GPT模型

    360集團(tuán)和哪吒汽車合作 將共同發(fā)布NETA GPT模型 3月1日,360集團(tuán)與哪吒汽車簽署戰(zhàn)略合作協(xié)議,雙方計(jì)劃共同發(fā)布大模型產(chǎn)品NETA GPT,預(yù)計(jì)發(fā)布時(shí)間在4月份。屆時(shí)將會把
    的頭像 發(fā)表于 03-02 15:51 ?968次閱讀