0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NPU和AI TOPS是什么?它們有哪些性能?

高通中國 ? 來源:高通中國 ? 2024-06-13 10:33 ? 次閱讀

在當(dāng)今快速發(fā)展的技術(shù)環(huán)境中,AI正在變革各行各業(yè)并推動創(chuàng)新,理解AI性能指標(biāo)的復(fù)雜性至關(guān)重要。過去許多AI模型需要在云端運行。當(dāng)我們走向由終端側(cè)生成式AI處理定義的未來時,我們必須能夠評估計算平臺可運行AI模型的性能、準(zhǔn)確性和效率。如今,TOPS(每秒萬億次運算)是衡量處理器AI性能的主要方式之一。TOPS是基于處理器所需的架構(gòu)和頻率,衡量處理器潛在AI推理峰值性能的方法,比如神經(jīng)網(wǎng)絡(luò)處理器(NPU)。下面我們將深入探討。

NPU是什么?

在深入探討TOPS的具體內(nèi)容之前,讓我們先看看NPU的重要性。對于終端側(cè)AI處理,NPU在提高效率、為個人用戶和企業(yè)提供創(chuàng)新的應(yīng)用體驗方面發(fā)揮著關(guān)鍵作用。評估這些專用處理器的性能需要全面了解其能力背后的關(guān)鍵指標(biāo)。

NPU的演進(jìn)改變了人們處理計算的方式。傳統(tǒng)上,CPU負(fù)責(zé)執(zhí)行AI算法。隨著對處理性能的需求飆升,專用NPU應(yīng)運而生,成為處理AI相關(guān)軟件應(yīng)用的專用解決方案。NPU旨在高效處理AI任務(wù)所需的復(fù)雜數(shù)學(xué)計算,提供出色的效率、性能和能效。

AI TOPS是什么?

TOPS作為展示處理器計算能力的指標(biāo),是衡量NPU性能的核心。

TOPS通過以萬億單位測量一秒鐘內(nèi)執(zhí)行的運算(加法、乘法等)次數(shù)來量化NPU處理能力。

這種標(biāo)準(zhǔn)化測量方式非常明確地顯示了NPU的性能,可作為比較不同處理器和架構(gòu)AI性能的關(guān)鍵指標(biāo)。因為TOPS是針對NPU的基礎(chǔ)性能指標(biāo),探索TOPS的計算參數(shù)以及它們?nèi)绾螞Q定性能至關(guān)重要,這有助于更深入地了解NPU的能力。

乘法累加(MAC)運算執(zhí)行AI工作負(fù)載中的核心數(shù)學(xué)公式。矩陣乘法由兩類基礎(chǔ)運算組成:累加器的乘法和加法。例如,一個MAC單元可在每個時鐘周期內(nèi)運行兩類基礎(chǔ)運算各一次,意味著它在每個時鐘周期內(nèi)執(zhí)行兩個運算。一個給定的NPU有一定數(shù)量的MAC單元,能夠在不同精度級別進(jìn)行運算,這取決于NPU架構(gòu)。

頻率決定NPU及其MAC單元(以及CPU或GPU)運算的時鐘速度(或每秒周期數(shù)),直接影響整體性能。更高的頻率允許在單位時間內(nèi)執(zhí)行更多運算,從而提高處理速度。但是,提高頻率也會導(dǎo)致更高功耗和發(fā)熱,影響電池續(xù)航和用戶體驗。處理器TOPS計算通常使用峰值運行頻率。

精度指計算的顆粒度,通常精度越高模型準(zhǔn)確性就越高,需要的計算強度也越高。最常見的高精度AI模型為32位和16位浮點精度,而速度更快的低精度低功耗模型通常使用8位和4位整數(shù)精度。當(dāng)前行業(yè)標(biāo)準(zhǔn)為以INT8精度評估AI推理性能TOPS。

計算TOPS要從計算OPS開始,OPS等于MAC單元數(shù)乘以運行頻率的兩倍。TOPS數(shù)量是OPS除以一萬億的值,將公式更簡單地列出,即TOPS = 2×MAC單元數(shù)×頻率/1萬億。

TOPS和實際性能

盡管TOPS提供了探索NPU能力的重要信息,我們?nèi)员仨殞⒗碚撝笜?biāo)和實際應(yīng)用聯(lián)系起來。畢竟,僅僅有高TOPS值并不能保證最佳的AI性能;各種因素協(xié)同作用的結(jié)果才能真正決定NPU實力。

因此評估NPU性能時要考慮內(nèi)存帶寬、軟件優(yōu)化和系統(tǒng)集成等方面的因素?;鶞?zhǔn)測試可以幫助我們超越數(shù)字,了解NPU在實際場景中的表現(xiàn),其中時延、吞吐量和能效尤為重要。

Procyon AI基準(zhǔn)測試使用真實工作負(fù)載來幫助將理論性的TOPS評估轉(zhuǎn)化為用戶在使用AI推理的真實應(yīng)用中對響應(yīng)和處理能力的預(yù)期。它以多個精度運行六個模型,提供NPU不同性能表現(xiàn)的詳細(xì)洞察。類似模型在生產(chǎn)力、媒體、創(chuàng)作者和其他應(yīng)用中越來越常見。在Procyon AI和其他基準(zhǔn)測試中有更快的性能表現(xiàn),與實現(xiàn)更快推理和更好用戶體驗息息相關(guān)。

為此,分析實際性能可以為NPU的能力和局限性提供寶貴洞察。必須從可行性和實用性角度檢驗性能指標(biāo)。

未來NPU性能指標(biāo)

隨著技術(shù)不斷快速發(fā)展,數(shù)字化轉(zhuǎn)型需求持續(xù)影響各行各業(yè),NPU性能指標(biāo)格局將進(jìn)一步演進(jìn)。盡管新興趨勢正在更廣泛地定義和評估NPU性能與計算的方式,TOPS仍是很好的性能指標(biāo),將在很長一段時間內(nèi)繼續(xù)作為重要參考。

隨著各種AI新技術(shù)在未來幾年受到關(guān)注并重新定義無數(shù)行業(yè),對能夠反應(yīng)不同技術(shù)獨特特征的可靠性能指標(biāo)的需求將不斷凸顯。適應(yīng)性、可擴展性和實際應(yīng)用相關(guān)性將定義未來的NPU性能指標(biāo)。

根據(jù)用戶需求評估NPU性能

應(yīng)對快速變化的NPU性能評估領(lǐng)域或許會讓人望而生畏,但隨著數(shù)字化轉(zhuǎn)型(尤其是在AI領(lǐng)域)持續(xù)快速發(fā)展,深入了解TOPS對行業(yè)和個人來說都很重要。

最終,選擇合適的系統(tǒng)級芯片(SoC)取決于用戶、客戶或組織的工作負(fù)載和優(yōu)先級,而這一決策很可能需要取決于SoC中的NPU。

無論用戶是優(yōu)先考慮原始算力、能效還是模型準(zhǔn)確度,驍龍X系列平臺面向筆記本電腦,配備高達(dá)45TOPS的NPU,能夠強力賦能PC,并將實際可用的AI體驗引入用戶的工作流程。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 高通
    +關(guān)注

    關(guān)注

    76

    文章

    7467

    瀏覽量

    190623
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30887

    瀏覽量

    269065
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    284

    瀏覽量

    18610

原文標(biāo)題:AI TOPS和NPU性能指標(biāo)指南

文章出處:【微信號:Qualcomm_China,微信公眾號:高通中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Lunar Lake:NPU性能全面提升,能耗也大幅降低,綜合AI算力提升至120TOPS

    英特爾CEO帕特·基辛格在COMPUTEX 2024上發(fā)表主題演講,正式公布了下一代面向AI PC的移動處理器Lunar Lake,不僅CPU、GPU、NPU性能全面提升,能耗也大幅降低,綜合
    的頭像 發(fā)表于 06-05 15:54 ?8393次閱讀
    Lunar Lake:<b class='flag-5'>NPU</b><b class='flag-5'>性能</b>全面提升,能耗也大幅降低,綜合<b class='flag-5'>AI</b>算力提升至120<b class='flag-5'>TOPS</b>

    刷新AI PC NPU算力,AMD銳龍AI 9 HX 375領(lǐng)銜55 TOPS

    NPU性能第一梯隊。而此次推出的Ryzen AI 9 HX 375算力進(jìn)一步提升至55 TOPS。在NPU算力這條路上AMD甚是積極。 ?
    的頭像 發(fā)表于 08-07 00:28 ?3356次閱讀
    刷新<b class='flag-5'>AI</b> PC <b class='flag-5'>NPU</b>算力,AMD銳龍<b class='flag-5'>AI</b> 9 HX 375領(lǐng)銜55 <b class='flag-5'>TOPS</b>

    BananaPi BPI-M2S 是新設(shè)計的一款單板計算機,采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲

    G52 MP4(6EE) GPU,NPU for AI 支持 5.0 TOPS算力,支持?jǐn)z像頭和MIPI-CSI接口,HDMI輸出,2個全千兆接口。板載4G內(nèi)存和16gb eMMC存儲
    發(fā)表于 09-30 12:41

    BananaPi BPI-M2S 采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲

    G52 MP4(6EE) GPU,NPU for AI 支持 5.0 TOPS算力,支持?jǐn)z像頭和MIPI-CSI接口,HDMI輸出,2個全千兆接口。板載4G內(nèi)存和16gb eMMC存儲
    發(fā)表于 09-30 14:37

    基于RKNN程序開發(fā)和模型轉(zhuǎn)換的NPU簡要說明

    /16bit 運算,運算性能高達(dá) 3.0TOPS。相較于 GPU 作為 AI 運算單元的大型芯片方案,功耗不到 GPU 所需要的 1%。可直接加載 Caffe / Mxnet / TensorFlow 模型
    發(fā)表于 05-31 11:10

    AIO-3399ProC NPU開發(fā)相關(guān)資料推薦

    “USB3.0方式連接的NPU”,具體使用方法和注意事項請查看補丁注釋。注意:PCIE-NPU加速補丁默認(rèn)沒有啟用,具體啟用方法和注意事項請查看補丁注釋。NPU特性支持 8bit/16bit 運算,運算
    發(fā)表于 07-01 17:38

    恩智浦最新的應(yīng)用處理器 i.MX 95采用專有NPU IP進(jìn)行片上AI加速

    恩智浦最新的應(yīng)用處理器 i.MX 95 使用恩智浦專有的 NPU IP 進(jìn)行片上 AI 加速,這與之前使用第三方 IP 的 i.MX 系列產(chǎn)品有所不同。實際上,越來越多的嵌入式處理器公司正在使用自己
    發(fā)表于 02-16 11:20

    瑞芯微首款AI芯片RK3399Pro:NPU性能達(dá)2.4TOPs!

    NPU性能達(dá)2.4TOPs! 首先在CES 2018年消費電子展前夜,瑞芯微就宣布,向全球正式推出旗下首款性能超強的AI處理器RK3399
    發(fā)表于 01-11 01:53 ?5290次閱讀
    瑞芯微首款<b class='flag-5'>AI</b>芯片RK3399Pro:<b class='flag-5'>NPU</b><b class='flag-5'>性能</b>達(dá)2.4<b class='flag-5'>TOPs</b>!

    TOPS 與現(xiàn)實世界的性能AI 加速器的基準(zhǔn)性能

    蓬勃發(fā)展的機器學(xué)習(xí)和人工智能新興用例有望通過加速信息處理和提高決策準(zhǔn)確性為行業(yè)創(chuàng)造重大價值。但機器學(xué)習(xí)模型是計算密集型、需要高頻和實時 AI 分析場景,這導(dǎo)致企業(yè)依賴于使用每秒萬億次操作 (TOPS
    的頭像 發(fā)表于 07-14 17:17 ?1898次閱讀

    BananaPi BPI-M2S 采用Amlogic A311D開發(fā)的AI開發(fā)板,NPU AI 支持 5.0 TOPS算力,

    BananaPi BPI-M2S 是香蕉派開源社區(qū)新設(shè)計的一款單板計算機,采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲
    的頭像 發(fā)表于 08-22 16:00 ?1056次閱讀
    BananaPi BPI-M2S 采用Amlogic A311D開發(fā)的<b class='flag-5'>AI</b>開發(fā)板,<b class='flag-5'>NPU</b> <b class='flag-5'>AI</b> 支持 5.0 <b class='flag-5'>TOPS</b>算力,

    npu是什么意思?npu芯片是什么意思?npu到底什么用?

    npu是什么意思?npu芯片是什么意思?npu到底什么用?? NPU的概念 NPU(Neura
    的頭像 發(fā)表于 08-27 17:03 ?4.2w次閱讀

    AI PC市場爭霸:英特爾、AMD、高通芯片算力誰主沉???

    目前英特爾的Meteor Lake處理器NPU只能提供10 TOPS性能,沒有達(dá)到下一代AI PC的標(biāo)準(zhǔn)。而 Lunar Lake 的 NPU
    發(fā)表于 04-18 14:29 ?419次閱讀

    AI PC引發(fā)的NPU大戰(zhàn)?英特爾:僅30%開發(fā)者選擇NPU

    隨著COMPUTEX 2024的日益臨近,關(guān)于人工智能(AI)個人計算機(PC)的話題開始變得愈發(fā)熱門和受關(guān)注。據(jù)微軟公司近期發(fā)布的相關(guān)技術(shù)規(guī)范要求,所有運行Windows操作系統(tǒng)的AI PC必須配備本地運行Copilot的功能機制,并安裝容量至少為40
    的頭像 發(fā)表于 06-03 17:24 ?872次閱讀

    40+TOPS NPUAI PC處理器開卷算力

    的人工智能任務(wù)。同時,微軟還提出,這款全新電腦搭配擁有全新神經(jīng)處理單元NPU的芯片,可實現(xiàn)每秒超過40萬億次即40+TOPS的運算。那么也就是說,若要符合微軟給出的AI PC的定義,NPU
    的頭像 發(fā)表于 07-14 01:11 ?4628次閱讀
    40+<b class='flag-5'>TOPS</b> <b class='flag-5'>NPU</b>,<b class='flag-5'>AI</b> PC處理器開卷算力

    NPU技術(shù)如何提升AI性能

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為AI領(lǐng)域的核心驅(qū)動力,對計算能力的需求日益增長。NPU技術(shù)應(yīng)運而生,為AI性能的提升提供了強大的硬件支持。
    的頭像 發(fā)表于 11-15 09:11 ?440次閱讀