0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

存內計算并不滿足于現有的算力

E4Life ? 來源:電子發(fā)燒友網 ? 作者:周凱揚 ? 2022-05-11 00:08 ? 次閱讀

談到存內計算,大部分人的第一印象就是超低功耗和大算力。存內計算技術打破了馮諾依曼架構的限制,沖破了內存墻,為半導體產業(yè)帶來了新的創(chuàng)新。但你可能會問,存內計算的應用場景到底有哪些呢?

邊緣計算的下一步

邊緣計算可以說是眾多存內計算技術與公司走的第一步,存內計算憑借其低功耗的特性,可穿戴等端側設備可以說是為該技術量身定制的。在其架構的優(yōu)越性之下,存內計算又比一眾傳統(tǒng)邊緣AI芯片有著更加可觀的算力。所以,對于智能手表、智能眼鏡這類對功耗需求高,又有一定AI計算需求的應用來說,存內計算芯片無疑是不二之選。

不過如今的MCU已經將功耗降到了極低的水準,部分也能完成一些簡單的AI運算,如果僅僅是在語音識別、事件檢測這些應用上來競爭的話,即便這些存內計算有優(yōu)勢,可能在實際使用過程中,除了續(xù)航之外,用戶的切身感知到的變化會比較小。

WTM2101存內計算芯片 / 知存科技


但邊緣計算并不只局限于此,還有圖像處理這一老大難亟待解決,這一應用相比上述那些又有著更高的算力要求。國內領先的存內計算公司知存科技近日透露,他們正在打造算力更強的下一代存內計算芯片就是面向超清視頻處理的,根據其給出的演示所示,該芯片主要針對AI插幀、AI超分辨率、AI視頻降噪和AI高動態(tài)分辨率,這些在邊緣端感知更加明顯的AI應用。

而以上這些AI應用,也僅僅只是存內計算往智能手機等消費級邊緣端走的下一步,邊緣AI芯片的終極目標都是自動駕駛。如若能做到更高的算力,存內計算芯片就有機會沖進汽車市場,與自動駕駛芯片的玩家硬碰硬。

超越GPU的算力

既然存內計算已經證實了自己在邊緣端的算力優(yōu)勢,那有沒有機會與GPU這類算力猛禽一決高下呢?我們以波動仿真為例,波動仿真在許多應用中都有普及,比如醫(yī)學影像、石油勘探、減輕地震災害以及國防系統(tǒng)等。然而大部分應用在使用波動仿真時,都要用到超級計算機對波動方程多重求解。雖然這類應用不像可穿戴一樣,對于成本和體積要求不高,但對于速度和能耗還是比較重視的。

目前主導的波動仿真解決方案還是CPU和GPU,但由于本身的并行性缺失,即便是高端的CPU運行再小的問題,也需要大量時間才能完成計算。而GPU憑借其巨大的內存帶寬優(yōu)勢,無疑擁有著更高的速度。即便如此,在實際應用中,波動仿真是一個極端的數據移動過程,GPU依然會遇到瓶頸,即便幾百GB/s的內存帶寬沒法免受影響,最終導致用于數據移動的功耗甚至高于計算的功耗。

而存內計算可以減少處理器之間的數據移動,因為它消除了片外與片內存儲之間的數據移動,但存內之間的數據移動依然是一大問題。埃克森美孚的研究人員就想出了Wave-PIM這種存內計算方案,利用超大規(guī)模集成電路常用的H樹架構,來減少內存區(qū)塊之間數據移動的延遲。他們以900GB/s帶寬的16GB HBM2內存進行模擬,得出了52.8TFLOPS(FP32)的成績,超過了Tesla V100 GPU。這證明了存內計算芯片,即使是在服務器級和HPC級的應用上,也有著獨到的優(yōu)勢。

UPMEM PIM / UPMEM


不過如今GPU內存帶寬已經隨著HBM3和英偉達的H100芯片做到了3TB/s,而業(yè)界目前在內存帶寬上占優(yōu)的存內計算方案,法國公司UPMEM的DDR4 PIM,也只做到了2.5TB/s。哪怕存內計算有著功耗上的巨大優(yōu)勢,但性能上要想進一步超越GPU,還是需要更先進的內存技術和更多的架構創(chuàng)新。好在如今越來越多的公司開始走上存內計算的商業(yè)化嘗試,存儲廠商們雖然還沒有確定走這一方向,但存內計算與其發(fā)展技術并無沖突,而且從生產創(chuàng)新和投資方向來看,他們已經開始布局這一技術了,未來高性能計算上很有可能出現存儲廠商與GPU廠商互卷的情況。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 半導體產業(yè)

    關注

    6

    文章

    510

    瀏覽量

    34610
  • 邊緣計算
    +關注

    關注

    22

    文章

    3202

    瀏覽量

    50176
  • 算力
    +關注

    關注

    1

    文章

    1074

    瀏覽量

    15275
收藏 0人收藏

    評論

    相關推薦

    一體行業(yè)2024年回顧與2025年展望

    2024年,大模型技術的迅猛發(fā)展成為人工智能領域的核心驅動力,其對硬件和存儲效率的極致需求,促使一體技術在全球范圍迎來前所未
    的頭像 發(fā)表于 01-23 11:24 ?695次閱讀

    芯 · 智啟未來 — 2024蘋芯科技產品發(fā)布會盛大召開

    8月8日,國際領先的一體芯片開拓者——蘋芯科技在北京召開“芯智啟未來——2024蘋芯科技產品發(fā)布會”,集中推出兩款革命性產品:PI
    的頭像 發(fā)表于 12-18 15:31 ?849次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>于</b>芯 · 智啟未來 — 2024蘋芯科技產品發(fā)布會盛大召開

    科技啟動首屆計算創(chuàng)新大賽

    計算作為一項打破“內存墻”“功耗墻”的顛覆性技術,消除了的界限,相比CPU或GPU能夠實現更高
    的頭像 發(fā)表于 11-21 10:44 ?460次閱讀

    科技榮獲2024中國AI層創(chuàng)新企業(yè)

    科技入榜【2024中國AI層創(chuàng)新企業(yè)】,憑借在創(chuàng)新計算芯片領域的高能效
    的頭像 發(fā)表于 11-06 15:30 ?699次閱讀

    aic3106作為slave,sclk與Wclk是否可以不滿足sclk=2*wclk*采樣位數?

    I2S作為master,aic3106作為slave,sclk與Wclk是否可以不滿足sclk=2*wclk*采樣位數? 求回復
    發(fā)表于 10-17 07:02

    并重:數據時代的雙刃劍

    在2024年的今天,人工智能(AI)技術已經全面滲透至我們生活的方方面面,從醫(yī)療診斷到智能交通,從金融分析到智能家居,AI正以前所未有的速度重塑我們的世界。這一變革背后,
    的頭像 發(fā)表于 10-08 16:00 ?1150次閱讀

    當運放用作比較器時,虛短特性是不滿足的,為什么還會出現?

    以及示波器顯示): 比較器不是應該不滿足虛短特性嗎?但是在這里卻滿足了,而且輸出電壓的計算公式也只有在虛短滿足時才能達到示波器顯示的效果! 這里實在有些困惑,希望Ti的朋友們能給點指
    發(fā)表于 09-18 06:12

    科技推動新一代計算芯片產品產業(yè)化進程

    ? 6月3日,知科技總部啟航儀式在杭州臨平小鎮(zhèn)正式舉行,標志著公司在計算芯片領域開啟技
    的頭像 發(fā)表于 06-05 17:16 ?1429次閱讀

    計算原理分類——數字計算與模擬計算

    數字計算與模擬計算各有優(yōu)劣,都是
    的頭像 發(fā)表于 05-21 16:26 ?3383次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>內</b><b class='flag-5'>計算</b>原理分類——數字<b class='flag-5'>存</b><b class='flag-5'>內</b><b class='flag-5'>計算</b>與模擬<b class='flag-5'>存</b><b class='flag-5'>內</b><b class='flag-5'>計算</b>

    計算——助力實現28nm等效7nm功效

    當的性能。一體嘗試通過集成存儲和計算在一個芯片甚至一個容器,來突破訪限制,發(fā)揮芯片的最大
    的頭像 發(fā)表于 05-17 15:03 ?2346次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>內</b><b class='flag-5'>計算</b>——助力實現28nm等效7nm功效

    計算WTM2101編譯工具鏈 資料

    計算是突破物理極限的下一代技術- AIGC等人工智能新興產業(yè)的快速發(fā)展離不開
    發(fā)表于 05-16 16:33

    探索計算—基于 SRAM 的計算與基于 MRAM 的一體的探究

    本文深入探討了基于SRAM和MRAM的一體技術在計算領域的應用和發(fā)展。首先,介紹了基于SRAM的邏輯
    的頭像 發(fā)表于 05-16 16:10 ?3739次閱讀
    探索<b class='flag-5'>存</b><b class='flag-5'>內</b><b class='flag-5'>計算</b>—基于 SRAM 的<b class='flag-5'>存</b><b class='flag-5'>內</b><b class='flag-5'>計算</b>與基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b>一體的探究

    生態(tài)構建重要一環(huán)- 計算工具鏈

    本篇文章重點講述計算相關工具鏈,我們將從工具鏈定義出發(fā),依次講述工具鏈研究背景及現有工具鏈、
    的頭像 發(fā)表于 05-16 14:37 ?1420次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>內</b>生態(tài)構建重要一環(huán)- <b class='flag-5'>存</b><b class='flag-5'>內</b><b class='flag-5'>計算</b>工具鏈

    計算技術工具鏈——量化篇

    本篇文章將重點講述計算技術工具鏈之“量化”,我們將從面向計算芯片的深度學習編譯工具鏈、神
    的頭像 發(fā)表于 05-16 12:35 ?1598次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>內</b><b class='flag-5'>計算</b>技術工具鏈——量化篇

    十問:超,通

    鄔賀銓指出,現有測算方法難以精準衡量。國內企業(yè)服務器的出貨量并不等于國內市場的使用量,而且進口國外的服務器未統(tǒng)計在內;服務器出貨量也不等于上架量,更不等于已經加電使用量。通常服務器
    的頭像 發(fā)表于 04-13 11:40 ?5222次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品