成人午夜兔费观看网站,亚洲av无码片区一区二区三区,欧美日韩精品一区二区在线播放蜜臀

隨著機(jī)器學(xué)習(xí)（Machine Learning）領(lǐng)域越來越多地使用現(xiàn)場(chǎng)可編程門陣列（FPGA）來進(jìn)行推理（inference）加速，而傳統(tǒng)FPGA只支持定點(diǎn)運(yùn)算的瓶頸越發(fā)凸顯。Achronix為了解決這一大困境，創(chuàng)新地設(shè)計(jì)了機(jī)器學(xué)習(xí)處理器（MLP）單元，不僅支持浮點(diǎn)的乘加運(yùn)算，還可以支持對(duì)多種定浮點(diǎn)數(shù)格式進(jìn)行拆分。

MLP全稱Machine Learning Processing單元，是由一組至多32個(gè)乘法器的陣列，以及一個(gè)加法樹、累加器、還有四舍五入rounding/飽和saturation/歸一化normalize功能塊。同時(shí)還包括2個(gè)緩存，分別是一個(gè)BRAM72k和LRAM2k，用于獨(dú)立或結(jié)合乘法器使用。MLP支持定點(diǎn)模式和浮點(diǎn)模式。

考慮到運(yùn)算能耗和準(zhǔn)確度的折衷，目前機(jī)器學(xué)習(xí)引擎中最常使用的運(yùn)算格式是FP16和INT8，而Tensor Flow支持的BF16則是通過降低精度，來獲得更大數(shù)值空間。

而且這似乎也成為未來的一種趨勢(shì)。目前已經(jīng)有不少研究表明，更小位寬的浮點(diǎn)或整型可以在保證正確率的同時(shí)，還可以減少大量的計(jì)算量。因此，為了順應(yīng)這一潮流，MLP還支持將大位寬乘法單元拆分成多個(gè)小位寬乘法，包括整數(shù)和浮點(diǎn)數(shù)。

值得注意的是，這里的bfloat16即Brain Float格式，而block float為塊浮點(diǎn)算法，即當(dāng)應(yīng)用Block Float16及更低位寬塊浮點(diǎn)格式時(shí)，指數(shù)位寬不變，小數(shù)位縮減到了16bit以內(nèi)，因此浮點(diǎn)加法位寬變小，并且不需要使用浮點(diǎn)乘法單元，而是整數(shù)乘法和加法樹即可，MLP的架構(gòu)可以使這些格式下的算力倍增。

精彩推薦

至芯科技12年不忘初心、再度起航3月6日西安中心FPGA工程師就業(yè)班開課、線上線下多維教學(xué)、歡迎咨詢！

FPGA 視頻處理中外部SDRAM的作用

英特爾推新款可編程芯片，能否越位AMD？

掃碼加微信邀請(qǐng)您加入FPGA學(xué)習(xí)交流群

歡迎加入至芯科技FPGA微信學(xué)習(xí)交流群，這里有一群優(yōu)秀的FPGA工程師、學(xué)生、老師、這里FPGA技術(shù)交流學(xué)習(xí)氛圍濃厚、相互分享、相互幫助、叫上小伙伴一起加入吧！

點(diǎn)個(gè)在看你最好看

原文標(biāo)題：FPGA運(yùn)算單元對(duì)高算力浮點(diǎn)應(yīng)用

文章出處：【微信公眾號(hào)：FPGA設(shè)計(jì)論壇】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

FPGA

FPGA

+關(guān)注

關(guān)注
1641

文章
21910

瀏覽量
611622

原文標(biāo)題：FPGA運(yùn)算單元對(duì)高算力浮點(diǎn)應(yīng)用

文章出處：【微信號(hào)：gh_9d70b445f494，微信公眾號(hào)：FPGA設(shè)計(jì)論壇】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

算力領(lǐng)域常用名詞解釋

本文系統(tǒng)地整理和解釋了算力領(lǐng)域中常用的數(shù)十個(gè)關(guān)鍵名詞，并按照以下維度進(jìn)行了分類：基礎(chǔ)概念、系統(tǒng)架構(gòu)、硬件架構(gòu)、基礎(chǔ)運(yùn)算類型、計(jì)算模式、相關(guān)軟件架構(gòu)與部署模式、浮點(diǎn)精度格式、

發(fā)表于 04-07 11:21 ?173次閱讀

<b class='flag-5'>算</b><b class='flag-5'>力</b>領(lǐng)域常用名詞解釋

工業(yè)4.0革命利器！明遠(yuǎn)智睿SSD2351核心板：低成本+高算力，破解產(chǎn)線智能化難題

力：算力突破：四核A35主頻1.5GHz，支持Neon/FPU加速，并行處理PLC控制指令與視覺算法； IVE引擎實(shí)現(xiàn)高斯濾波、形態(tài)學(xué)運(yùn)算（膨脹/腐蝕）硬件加速，圖像預(yù)處理效率提升5倍

發(fā)表于 03-21 14:22

從堆算力到用算力，寧暢用精裝算力，助力產(chǎn)業(yè)打造智能化摩天大樓

算力

腦極體

發(fā)布于 :2025年01月22日 00:00:50

算智算中心的算力如何衡量？

作為當(dāng)下科技發(fā)展的重要基礎(chǔ)設(shè)施，其算力的衡量關(guān)乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應(yīng)用的運(yùn)行。以下是對(duì)智算中心算力衡量的詳細(xì)闡述：一、算

發(fā)表于 01-16 14:03 ?1446次閱讀

科技云報(bào)到：要算力更要“算利”，“精裝算力”觸發(fā)大模型產(chǎn)業(yè)新變局？

科技云報(bào)到：要算力更要“算利”，“精裝算力”觸發(fā)大模型產(chǎn)業(yè)新變局？

發(fā)表于 01-16 10:24 ?294次閱讀

FPGA中的浮點(diǎn)四則運(yùn)算是什么

由于定點(diǎn)的四則運(yùn)算比較簡(jiǎn)單，如加減法只要注意符號(hào)擴(kuò)展，小數(shù)點(diǎn)對(duì)齊等問題即可。在本文中，運(yùn)用在前一節(jié)中描述的自定義浮點(diǎn)格式FPGA中數(shù)的表示方法（下），完成浮點(diǎn)四則

發(fā)表于 11-16 12:51 ?693次閱讀

FPGA中浮點(diǎn)四則運(yùn)算的實(shí)現(xiàn)過程

由于定點(diǎn)的四則運(yùn)算比較簡(jiǎn)單，如加減法只要注意符號(hào)擴(kuò)展，小數(shù)點(diǎn)對(duì)齊等問題即可。在本文中，運(yùn)用在前一節(jié)中描述的自定義浮點(diǎn)格式FPGA中數(shù)的表示方法（下），完成浮點(diǎn)四則

發(fā)表于 11-16 11:19 ?1095次閱讀

算力基礎(chǔ)篇：從零開始了解算力

算力即計(jì)算能力（Computing Power），狹義上指對(duì)數(shù)字問題的運(yùn)算能力，而廣義上指對(duì)輸入信息處理后實(shí)現(xiàn)結(jié)果輸出的一種能力。雖然處理的內(nèi)容不同，但處理過程的能力都可抽象為算

發(fā)表于 11-15 14:22 ?1605次閱讀

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片CPU

。 █在算力芯片設(shè)計(jì)中，芯片拓?fù)?Topology)結(jié)構(gòu)非常重要。 ●環(huán)形(Ring)拓?fù)浞绞绞且环N將多個(gè)處理單元連接成環(huán)形結(jié)構(gòu)的片上總線技術(shù)結(jié)構(gòu)中，每個(gè)處理單元都與環(huán)上的兩個(gè)相鄰處理

發(fā)表于 10-20 12:03

《算力芯片高性能 CPU/GPU/NPU 微架構(gòu)分析》第1-4章閱讀心得——算力之巔：從基準(zhǔn)測(cè)試到CPU微架構(gòu)的深度探索

。浮點(diǎn)數(shù)單元則專門處理浮點(diǎn)運(yùn)算，其中加法器和乘法器的設(shè)計(jì)直接影響了CPU的浮點(diǎn)性能。SIMD（單指令多數(shù)據(jù)）技術(shù)如MMX、SSE、AVX等指

發(fā)表于 10-19 01:21

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯感謝平臺(tái)提供的書籍，厚厚的一本，很有分量，感謝作者的傾力付出成書。本書主要講算力芯片CPU

發(fā)表于 10-15 22:08

請(qǐng)問AURIX TC3xx tricore架構(gòu)下浮點(diǎn)運(yùn)算和將浮點(diǎn)數(shù)小數(shù)點(diǎn)去掉變成整數(shù)來計(jì)算哪種方式更加節(jié)省算力？

AURIX TC3xx tricore架構(gòu)下浮點(diǎn)運(yùn)算和將浮點(diǎn)數(shù)小數(shù)點(diǎn)去掉變成整數(shù)來計(jì)算哪種方式更加節(jié)省算力？比如一個(gè)

發(fā)表于 08-26 06:54

算力系列基礎(chǔ)篇——算力與計(jì)算機(jī)性能：解鎖超能力的神秘力量！

的？要想提高算力，都有哪些方法？一、算力的關(guān)鍵因素從算力的常見計(jì)量單位FPOPS（Floatin

發(fā)表于 07-11 08:04 ?104次閱讀

請(qǐng)問esp32 wroom 32u默認(rèn)開啟硬件浮點(diǎn)運(yùn)算單元了嗎？

請(qǐng)問esp32 wroom 32u 默認(rèn)開啟硬件浮點(diǎn)運(yùn)算單元了嗎？感謝

發(fā)表于 06-21 11:08

優(yōu)秀的Verilog/FPGA開源項(xiàng)目-浮點(diǎn)運(yùn)算器（FPU）介紹

浮點(diǎn)運(yùn)算器（英文：floating point unit，簡(jiǎn)稱FPU）是計(jì)算機(jī)系統(tǒng)的一部分，它是專門用來進(jìn)行浮點(diǎn)數(shù)運(yùn)算的（CPU中也叫ALU）。

發(fā)表于 04-26 11:27 ?4880次閱讀