国产亚洲3p无码一区二区,69综合精品国产二区无码

在當(dāng)今快速發(fā)展的技術(shù)環(huán)境中，AI正在變革各行各業(yè)并推動創(chuàng)新，理解AI性能指標(biāo)的復(fù)雜性至關(guān)重要。過去許多AI模型需要在云端運行。當(dāng)我們走向由終端側(cè)生成式AI處理定義的未來時，我們必須能夠評估計算平臺可運行AI模型的性能、準(zhǔn)確性和效率。如今，TOPS(每秒萬億次運算)是衡量處理器AI性能的主要方式之一。TOPS是基于處理器所需的架構(gòu)和頻率，衡量處理器潛在AI推理峰值性能的方法，比如神經(jīng)網(wǎng)絡(luò)處理器(NPU)。下面我們將深入探討。

NPU是什么？

在深入探討TOPS的具體內(nèi)容之前，讓我們先看看NPU的重要性。對于終端側(cè)AI處理，NPU在提高效率、為個人用戶和企業(yè)提供創(chuàng)新的應(yīng)用體驗方面發(fā)揮著關(guān)鍵作用。評估這些專用處理器的性能需要全面了解其能力背后的關(guān)鍵指標(biāo)。

NPU的演進改變了人們處理計算的方式。傳統(tǒng)上，CPU負(fù)責(zé)執(zhí)行AI算法。隨著對處理性能的需求飆升，專用NPU應(yīng)運而生，成為處理AI相關(guān)軟件應(yīng)用的專用解決方案。NPU旨在高效處理AI任務(wù)所需的復(fù)雜數(shù)學(xué)計算，提供出色的效率、性能和能效。

AI TOPS是什么？

TOPS作為展示處理器計算能力的指標(biāo)，是衡量NPU性能的核心。

TOPS通過以萬億單位測量一秒鐘內(nèi)執(zhí)行的運算（加法、乘法等）次數(shù)來量化NPU處理能力。

這種標(biāo)準(zhǔn)化測量方式非常明確地顯示了NPU的性能，可作為比較不同處理器和架構(gòu)AI性能的關(guān)鍵指標(biāo)。因為TOPS是針對NPU的基礎(chǔ)性能指標(biāo)，探索TOPS的計算參數(shù)以及它們?nèi)绾螞Q定性能至關(guān)重要，這有助于更深入地了解NPU的能力。

乘法累加(MAC)運算執(zhí)行AI工作負(fù)載中的核心數(shù)學(xué)公式。矩陣乘法由兩類基礎(chǔ)運算組成：累加器的乘法和加法。例如，一個MAC單元可在每個時鐘周期內(nèi)運行兩類基礎(chǔ)運算各一次，意味著它在每個時鐘周期內(nèi)執(zhí)行兩個運算。一個給定的NPU有一定數(shù)量的MAC單元，能夠在不同精度級別進行運算，這取決于NPU架構(gòu)。

頻率決定NPU及其MAC單元（以及CPU或GPU）運算的時鐘速度（或每秒周期數(shù)），直接影響整體性能。更高的頻率允許在單位時間內(nèi)執(zhí)行更多運算，從而提高處理速度。但是，提高頻率也會導(dǎo)致更高功耗和發(fā)熱，影響電池續(xù)航和用戶體驗。處理器TOPS計算通常使用峰值運行頻率。

精度指計算的顆粒度，通常精度越高模型準(zhǔn)確性就越高，需要的計算強度也越高。最常見的高精度AI模型為32位和16位浮點精度，而速度更快的低精度低功耗模型通常使用8位和4位整數(shù)精度。當(dāng)前行業(yè)標(biāo)準(zhǔn)為以INT8精度評估AI推理性能TOPS。

計算TOPS要從計算OPS開始，OPS等于MAC單元數(shù)乘以運行頻率的兩倍。TOPS數(shù)量是OPS除以一萬億的值，將公式更簡單地列出，即TOPS = 2×MAC單元數(shù)×頻率/1萬億。

TOPS和實際性能

盡管TOPS提供了探索NPU能力的重要信息，我們?nèi)员仨殞⒗碚撝笜?biāo)和實際應(yīng)用聯(lián)系起來。畢竟，僅僅有高TOPS值并不能保證最佳的AI性能；各種因素協(xié)同作用的結(jié)果才能真正決定NPU實力。

因此評估NPU性能時要考慮內(nèi)存帶寬、軟件優(yōu)化和系統(tǒng)集成等方面的因素?；鶞?zhǔn)測試可以幫助我們超越數(shù)字，了解NPU在實際場景中的表現(xiàn)，其中時延、吞吐量和能效尤為重要。

Procyon AI基準(zhǔn)測試使用真實工作負(fù)載來幫助將理論性的TOPS評估轉(zhuǎn)化為用戶在使用AI推理的真實應(yīng)用中對響應(yīng)和處理能力的預(yù)期。它以多個精度運行六個模型，提供NPU不同性能表現(xiàn)的詳細(xì)洞察。類似模型在生產(chǎn)力、媒體、創(chuàng)作者和其他應(yīng)用中越來越常見。在Procyon AI和其他基準(zhǔn)測試中有更快的性能表現(xiàn)，與實現(xiàn)更快推理和更好用戶體驗息息相關(guān)。

為此，分析實際性能可以為NPU的能力和局限性提供寶貴洞察。必須從可行性和實用性角度檢驗性能指標(biāo)。

未來NPU性能指標(biāo)

隨著技術(shù)不斷快速發(fā)展，數(shù)字化轉(zhuǎn)型需求持續(xù)影響各行各業(yè)，NPU性能指標(biāo)格局將進一步演進。盡管新興趨勢正在更廣泛地定義和評估NPU性能與計算的方式，TOPS仍是很好的性能指標(biāo)，將在很長一段時間內(nèi)繼續(xù)作為重要參考。

隨著各種AI新技術(shù)在未來幾年受到關(guān)注并重新定義無數(shù)行業(yè)，對能夠反應(yīng)不同技術(shù)獨特特征的可靠性能指標(biāo)的需求將不斷凸顯。適應(yīng)性、可擴展性和實際應(yīng)用相關(guān)性將定義未來的NPU性能指標(biāo)。

根據(jù)用戶需求評估NPU性能

應(yīng)對快速變化的NPU性能評估領(lǐng)域或許會讓人望而生畏，但隨著數(shù)字化轉(zhuǎn)型（尤其是在AI領(lǐng)域）持續(xù)快速發(fā)展，深入了解TOPS對行業(yè)和個人來說都很重要。

最終，選擇合適的系統(tǒng)級芯片(SoC)取決于用戶、客戶或組織的工作負(fù)載和優(yōu)先級，而這一決策很可能需要取決于SoC中的NPU。

無論用戶是優(yōu)先考慮原始算力、能效還是模型準(zhǔn)確度，驍龍X系列平臺面向筆記本電腦，配備高達45TOPS的NPU，能夠強力賦能PC，并將實際可用的AI體驗引入用戶的工作流程。

阅读全文

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

高通

高通

+關(guān)注

關(guān)注
77

文章
7562

瀏覽量
192236
AI

AI

+關(guān)注

關(guān)注
87

文章
33443

瀏覽量
274021
NPU

NPU

+關(guān)注

關(guān)注
2

文章
311

瀏覽量
19337

原文標(biāo)題：AI TOPS和NPU性能指標(biāo)指南

文章出處：【微信號：Qualcomm_China，微信公眾號：高通中國】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

Lunar Lake:NPU性能全面提升，能耗也大幅降低，綜合AI算力提升至120TOPS

英特爾CEO帕特·基辛格在COMPUTEX 2024上發(fā)表主題演講，正式公布了下一代面向AI PC的移動處理器Lunar Lake，不僅CPU、GPU、NPU性能全面提升，能耗也大幅降低，綜合

發(fā)表于 06-05 15:54 ?8830次閱讀

刷新AI PC NPU算力，AMD銳龍AI 9 HX 375領(lǐng)銜55 TOPS

NPU性能第一梯隊。而此次推出的Ryzen AI 9 HX 375算力進一步提升至55 TOPS。在NPU算力這條路上AMD甚是積極。 ?

發(fā)表于 08-07 00:28 ?4271次閱讀

BananaPi BPI-M2S 是新設(shè)計的一款單板計算機，采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲

G52 MP4(6EE) GPU,NPU for AI 支持 5.0 TOPS算力，支持?jǐn)z像頭和MIPI-CSI接口，HDMI輸出，2個全千兆接口。板載4G內(nèi)存和16gb eMMC存儲

發(fā)表于 09-30 12:41

BananaPi BPI-M2S 采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲

G52 MP4(6EE) GPU,NPU for AI 支持 5.0 TOPS算力，支持?jǐn)z像頭和MIPI-CSI接口，HDMI輸出，2個全千兆接口。板載4G內(nèi)存和16gb eMMC存儲

發(fā)表于 09-30 14:37

基于RKNN程序開發(fā)和模型轉(zhuǎn)換的NPU簡要說明

/16bit 運算，運算性能高達 3.0TOPS。相較于 GPU 作為 AI 運算單元的大型芯片方案，功耗不到 GPU 所需要的 1%。可直接加載 Caffe / Mxnet / TensorFlow 模型

發(fā)表于 05-31 11:10

AIO-3399ProC NPU開發(fā)相關(guān)資料推薦

“USB3.0方式連接的NPU”，具體使用方法和注意事項請查看補丁注釋。注意：PCIE-NPU加速補丁默認(rèn)沒有啟用，具體啟用方法和注意事項請查看補丁注釋。NPU特性支持 8bit/16bit 運算，運算

發(fā)表于 07-01 17:38

恩智浦最新的應(yīng)用處理器 i.MX 95采用專有NPU IP進行片上AI加速

恩智浦最新的應(yīng)用處理器 i.MX 95 使用恩智浦專有的 NPU IP 進行片上 AI 加速，這與之前使用第三方 IP 的 i.MX 系列產(chǎn)品有所不同。實際上，越來越多的嵌入式處理器公司正在使用自己

發(fā)表于 02-16 11:20

瑞芯微首款AI芯片RK3399Pro：NPU性能達2.4TOPs！

：NPU性能達2.4TOPs！首先在CES 2018年消費電子展前夜，瑞芯微就宣布，向全球正式推出旗下首款性能超強的AI處理器RK3399

發(fā)表于 01-11 01:53 ?5470次閱讀

TOPS 與現(xiàn)實世界的性能：AI 加速器的基準(zhǔn)性能

蓬勃發(fā)展的機器學(xué)習(xí)和人工智能新興用例有望通過加速信息處理和提高決策準(zhǔn)確性為行業(yè)創(chuàng)造重大價值。但機器學(xué)習(xí)模型是計算密集型、需要高頻和實時 AI 分析場景，這導(dǎo)致企業(yè)依賴于使用每秒萬億次操作 (TOPS

發(fā)表于 07-14 17:17 ?2136次閱讀

BananaPi BPI-M2S 采用Amlogic A311D開發(fā)的AI開發(fā)板,NPU AI 支持 5.0 TOPS算力,

BananaPi BPI-M2S 是香蕉派開源社區(qū)新設(shè)計的一款單板計算機，采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲

發(fā)表于 08-22 16:00 ?1282次閱讀

npu是什么意思?npu芯片是什么意思？npu到底有什么用？

npu是什么意思?npu芯片是什么意思？npu到底有什么用？? NPU的概念 NPU（Neura

發(fā)表于 08-27 17:03 ?4.4w次閱讀

AI PC市場爭霸：英特爾、AMD、高通芯片算力誰主沉??？

目前英特爾的Meteor Lake處理器NPU只能提供10 TOPS的性能，沒有達到下一代AI PC的標(biāo)準(zhǔn)。而 Lunar Lake 的 NPU

發(fā)表于 04-18 14:29 ?557次閱讀

40+TOPS NPU，AI PC處理器開卷算力

的人工智能任務(wù)。同時，微軟還提出，這款全新電腦搭配擁有全新神經(jīng)處理單元NPU的芯片，可實現(xiàn)每秒超過40萬億次即40+TOPS的運算。那么也就是說，若要符合微軟給出的AI PC的定義，NPU

發(fā)表于 07-14 01:11 ?5574次閱讀

樹莓派新推AI HAT+:26 TOPS高性能版本震撼登場

供了兩種性能配置供用戶選擇。其中，基礎(chǔ)版配備了Hailo-8L加速器，性能達到13 TOPS（每秒萬億次操作），售價為70美元；而更為強大的高端版本則采用了Hailo-8加速器，性能飆

發(fā)表于 11-07 13:44 ?901次閱讀

NPU技術(shù)如何提升AI性能

隨著人工智能技術(shù)的飛速發(fā)展，深度學(xué)習(xí)作為AI領(lǐng)域的核心驅(qū)動力，對計算能力的需求日益增長。NPU技術(shù)應(yīng)運而生，為AI性能的提升提供了強大的硬件支持。

發(fā)表于 11-15 09:11 ?1152次閱讀