0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于STM32浮點(diǎn)運(yùn)算單元FPU的應(yīng)用示例

茶話MCU ? 來(lái)源:ST MCU 信息交流 ? 作者:ST MCU 信息交流 ? 2021-01-02 18:09 ? 次閱讀

有人利用STM32芯片做些DSP處理,在啟用FPU單元進(jìn)行調(diào)試、驗(yàn)證過(guò)程中可能會(huì)遇到些小問(wèn)題、小困惑,這里通過(guò)STM32F4芯片一個(gè)具體的應(yīng)用示例簡(jiǎn)單分享下,希望順便能給同仁提供些幫助或提醒。

我這里通過(guò)調(diào)用DSP庫(kù)里的FFT相關(guān)函數(shù)實(shí)現(xiàn)1024點(diǎn)的FFT運(yùn)算,樣點(diǎn)數(shù)據(jù)及運(yùn)算結(jié)果均為浮點(diǎn)數(shù)。

cf4aaab0-445e-11eb-8b86-12bb97331649.png

上圖中A區(qū)代碼是做樣點(diǎn)數(shù)據(jù)準(zhǔn)備,B區(qū)代碼完成FFT運(yùn)算。我們來(lái)一起看看基本的配置以及不啟用硬件浮點(diǎn)單元和啟用硬件浮點(diǎn)單元執(zhí)行B區(qū)代碼的時(shí)間上的差別。

程序里要調(diào)用一些數(shù)學(xué)函數(shù),而這些數(shù)學(xué)函數(shù)往往集成在相應(yīng)的數(shù)學(xué)函數(shù)庫(kù)里。我們選用ARM公司的DSP數(shù)學(xué)庫(kù),該庫(kù)系專門針對(duì)AMR核芯片及指令系統(tǒng)而組織的代碼,相比IDE自帶的通用數(shù)學(xué)函數(shù)庫(kù)會(huì)更優(yōu)化、高效。

目前該DSP數(shù)學(xué)庫(kù)包括基本數(shù)學(xué)函數(shù)、復(fù)數(shù)數(shù)學(xué)函數(shù)、濾波函數(shù)、矩陣函數(shù)等幾大塊,詳細(xì)內(nèi)容可以去ARM網(wǎng)站閱讀比較方便。【可點(diǎn)擊左下方原文鏈接前往】

cfc025ce-445e-11eb-8b86-12bb97331649.png

我們開(kāi)發(fā)時(shí),這些文件具體在哪里呢?在各個(gè)編譯環(huán)境的安裝目錄下都不難找到。不妨看看ARM keil MDK環(huán)境下它們所在位置。

d00fcdb8-445e-11eb-8b86-12bb97331649.png

上面我們看到的是DSP庫(kù)源文件所在目錄,在另一個(gè)目錄存放著基于不同內(nèi)核、不同存儲(chǔ)端格式以及是否支持硬件浮點(diǎn)單元而編譯出來(lái)的庫(kù)文件。我們?cè)陂_(kāi)發(fā)時(shí),直接添加合適的庫(kù)文件進(jìn)工程即可,不必逐個(gè)查找源文件來(lái)添加。下圖就是可以用于ARM MDK環(huán)境的庫(kù)文件?!緦?duì)于不同IDE,庫(kù)文件名后綴略有差異】

d0591e1e-445e-11eb-8b86-12bb97331649.png

這里以用于M4內(nèi)核的DSP數(shù)學(xué)函數(shù)庫(kù)稍作解釋,詳見(jiàn)下面表格。

d0c45cc4-445e-11eb-8b86-12bb97331649.png

從上表可以看出,基于Cortex M4內(nèi)核芯片進(jìn)行DSP運(yùn)算可以能用到的庫(kù)有四個(gè),但具體到STM32 基于M4內(nèi)核的芯片可以選用的只有兩個(gè),即xxxM4l_math.lib或xxxM4lf_math.lib,因?yàn)镾TM32芯片的存儲(chǔ)設(shè)計(jì)都是小端模式。所謂小端模式,簡(jiǎn)單點(diǎn)說(shuō)就是指多字節(jié)數(shù)據(jù)在內(nèi)存中存儲(chǔ)時(shí),按照低位字節(jié)對(duì)應(yīng)地址低位來(lái)存放,反之則為大端模式。

在上面截圖中,我還截取了對(duì)應(yīng)M0內(nèi)核可用的DSP數(shù)學(xué)庫(kù),它為什么只有兩個(gè)?這是因?yàn)镸0內(nèi)核沒(méi)有FPU硬件單元,不存在FPU是否啟用的可選情況。

現(xiàn)在就利用STM32F429開(kāi)發(fā)板,基于開(kāi)篇的截圖代碼進(jìn)行測(cè)試,并用定時(shí)器測(cè)量下面執(zhí)行代碼在不使用FPU和使用FPU分別所花費(fèi)的時(shí)間,并計(jì)算二者的時(shí)間比?!咀ⅲ篠TM32F429芯片自身是帶硬件FPU的】

d10e74ee-445e-11eb-8b86-12bb97331649.png

必要的配置和文件包含及添加,如下表所示:

d149fb18-445e-11eb-8b86-12bb97331649.png

基于上面條件執(zhí)行FFT運(yùn)算代碼,不使用FPU和使用FPU的時(shí)間比為16。

采用相似的條件,基于IAR環(huán)境對(duì)相同功能代碼段進(jìn)行測(cè)試,不使用FPU和使用FPU的時(shí)間比為11。

關(guān)于這個(gè)時(shí)間比,除了跟是否使用微庫(kù)、優(yōu)化等級(jí)、浮點(diǎn)精度等有關(guān)外,跟你所選取的測(cè)試代碼也有很大關(guān)系,因?yàn)橛行┐a只能靠CPU執(zhí)行的話,開(kāi)不開(kāi)FPU硬件單元對(duì)這部分時(shí)間是沒(méi)有影響的。不難理解,被測(cè)試代碼里只能靠CPU運(yùn)行的代碼占比越多,上面的這個(gè)比值就會(huì)越小。一般來(lái)說(shuō),我們不必太過(guò)糾結(jié)這個(gè)值的大小,知道有這個(gè)硬件浮點(diǎn)單元,既減輕了CPU負(fù)荷,又可以提升計(jì)算速度就好。

另外,我們?cè)谧鯠SP相關(guān)應(yīng)用時(shí),注意添加的DSP庫(kù)既要跟所用芯片匹配,還要跟IDE里的配置匹配。還是以上面測(cè)試代碼為例,本意是想啟用FPU,結(jié)果添加的DSP庫(kù)卻是基于不使用FPU硬件的數(shù)學(xué)庫(kù),那會(huì)怎么樣呢?

d199418c-445e-11eb-8b86-12bb97331649.png

本應(yīng)該添加arm_cortexM4lf_math.h的,結(jié)果弄錯(cuò)了。如果按照上面條件構(gòu)建ARM MDK工程,一路編譯下來(lái)沒(méi)有任何警告或錯(cuò)誤提示。程序也能流暢運(yùn)行,F(xiàn)FT運(yùn)算結(jié)果似乎也出來(lái)了。

d1fd51ae-445e-11eb-8b86-12bb97331649.png

但仔細(xì)查看結(jié)果,跟之前正確配置的運(yùn)行結(jié)果明顯不一樣。經(jīng)驗(yàn)證核對(duì),這次運(yùn)算結(jié)果是錯(cuò)的。為此我特意添加一行計(jì)算90°的正弦值代碼,它算出來(lái)結(jié)果竟然是1.5!逆天了。

d236a81e-445e-11eb-8b86-12bb97331649.png

如果說(shuō)在不知情的情況下這一路下來(lái),估計(jì)要被摧殘一頓了。畢竟很多數(shù)學(xué)函數(shù)結(jié)果常人是無(wú)法一眼能看出對(duì)錯(cuò)的,即使看出錯(cuò)了若沒(méi)未及時(shí)想到庫(kù)問(wèn)題的話,恐怕還得折騰折騰。

針對(duì)這種情形,基于同樣代碼于IAR環(huán)境下測(cè)試,情況相比ARM MDK貌似要好點(diǎn)。至少編譯時(shí)有警告提示,提示引用沖突之類的。計(jì)算結(jié)果沒(méi)有MDK的那么具有隱蔽性【至少對(duì)于本次測(cè)試是這樣】,基本是清一色的0,頗有沖擊效果!當(dāng)然,此時(shí)讓它計(jì)算90°的正弦值結(jié)果也是明顯錯(cuò)的。

d2617c24-445e-11eb-8b86-12bb97331649.png

感覺(jué)上,這種情形下,使用IAR時(shí)挖的坑似乎稍微淺些,更容易讓人警醒懷疑哪里出問(wèn)題了。

好,就分享到這里,祝君好運(yùn)!

原文標(biāo)題:關(guān)于STM32浮點(diǎn)運(yùn)算單元FPU的小話題

文章出處:【微信公眾號(hào):ST MCU 信息交流】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    51601

    瀏覽量

    429921
  • STM32
    +關(guān)注

    關(guān)注

    2277

    文章

    10952

    瀏覽量

    359242
  • FPU
    FPU
    +關(guān)注

    關(guān)注

    0

    文章

    42

    瀏覽量

    21469

原文標(biāo)題:關(guān)于STM32浮點(diǎn)運(yùn)算單元FPU的小話題

文章出處:【微信號(hào):stmcu832,微信公眾號(hào):茶話MCU】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    FCP32C335——對(duì)標(biāo)TI TMS320F28335的高性能DSP芯片,賦能工業(yè)控制與智能設(shè)備!

    FCP32C335以TMS320F28335為標(biāo)桿,搭載150MHz主頻的32位浮點(diǎn)處理單元FPU),支持單周期32×32位乘法運(yùn)算,單精度浮點(diǎn)
    的頭像 發(fā)表于 03-07 10:45 ?142次閱讀
    FCP32C335——對(duì)標(biāo)TI TMS320F28335的高性能DSP芯片,賦能工業(yè)控制與智能設(shè)備!

    【RA-Eco-RA4E2-64PIN-V1.0開(kāi)發(fā)板試用】RA4E2的DSP浮點(diǎn)性能的軟件浮點(diǎn)測(cè)試和硬件浮點(diǎn)測(cè)試對(duì)比

    RA4E2是一款基于Cortex -M33內(nèi)核的ARM MCU,理論上是具備硬件浮點(diǎn)運(yùn)算單元的,所以這里就測(cè)試下RA4E2的硬件浮點(diǎn)運(yùn)算能力
    發(fā)表于 12-30 17:55

    4G模組Air780E的LuatOS開(kāi)發(fā)之位運(yùn)算(bit)示例

    本文我要說(shuō)的是低功耗4G模組Air780E的LuatOS開(kāi)發(fā),關(guān)于運(yùn)算(bit)示例,我將詳細(xì)解析分享給大家。
    的頭像 發(fā)表于 12-02 14:33 ?285次閱讀
    4G模組Air780E的LuatOS開(kāi)發(fā)之位<b class='flag-5'>運(yùn)算</b>(bit)<b class='flag-5'>示例</b>

    FPGA中的浮點(diǎn)四則運(yùn)算是什么

    由于定點(diǎn)的四則運(yùn)算比較簡(jiǎn)單,如加減法只要注意符號(hào)擴(kuò)展,小數(shù)點(diǎn)對(duì)齊等問(wèn)題即可。在本文中,運(yùn)用在前一節(jié)中描述的自定義浮點(diǎn)格式FPGA中數(shù)的表示方法(下),完成浮點(diǎn)四則運(yùn)算的實(shí)現(xiàn)過(guò)程 1.自
    的頭像 發(fā)表于 11-16 12:51 ?519次閱讀
    FPGA中的<b class='flag-5'>浮點(diǎn)</b>四則<b class='flag-5'>運(yùn)算</b>是什么

    FPGA中浮點(diǎn)四則運(yùn)算的實(shí)現(xiàn)過(guò)程

    由于定點(diǎn)的四則運(yùn)算比較簡(jiǎn)單,如加減法只要注意符號(hào)擴(kuò)展,小數(shù)點(diǎn)對(duì)齊等問(wèn)題即可。在本文中,運(yùn)用在前一節(jié)中描述的自定義浮點(diǎn)格式FPGA中數(shù)的表示方法(下),完成浮點(diǎn)四則運(yùn)算的實(shí)現(xiàn)過(guò)程 1.自
    的頭像 發(fā)表于 11-16 11:19 ?873次閱讀
    FPGA中<b class='flag-5'>浮點(diǎn)</b>四則<b class='flag-5'>運(yùn)算</b>的實(shí)現(xiàn)過(guò)程

    【RA-Eco-RA2E1-48PIN-V1.0開(kāi)發(fā)板試用】在M23內(nèi)核上使用qfplib浮點(diǎn)運(yùn)算庫(kù)進(jìn)行浮點(diǎn)運(yùn)算

    瑞薩的RA2E1系列MCU是基于M23內(nèi)核的,這款芯片是不帶FPU浮點(diǎn)運(yùn)算單元的,使用串口prinf函數(shù)打印時(shí)是無(wú)法打印出浮點(diǎn)數(shù)的,只有Co
    發(fā)表于 11-05 22:07

    如何提高單片機(jī)的運(yùn)算效率之FPU

    只要STM32或者其他32位單片機(jī),自帶FPU功能,就可以加速float類型數(shù)據(jù)的加減乘除運(yùn)算。在STM32中要啟用FPU,需要啟動(dòng)滿足兩個(gè)
    的頭像 發(fā)表于 08-30 11:47 ?899次閱讀
    如何提高單片機(jī)的<b class='flag-5'>運(yùn)算</b>效率之<b class='flag-5'>FPU</b>

    請(qǐng)問(wèn)AURIX TC3xx tricore架構(gòu)下浮點(diǎn)運(yùn)算和將浮點(diǎn)數(shù)小數(shù)點(diǎn)去掉變成整數(shù)來(lái)計(jì)算哪種方式更加節(jié)省算力?

    ? tricore架構(gòu)下CPU有專門的FPU來(lái)處理浮點(diǎn)數(shù)運(yùn)算,是否意味著用12.89參與運(yùn)算,在調(diào)用FPU來(lái)計(jì)算的情況下,計(jì)算時(shí)間不會(huì)比12
    發(fā)表于 08-26 06:54

    如何關(guān)閉ESP32-S3中的FPU浮點(diǎn)數(shù)計(jì)算單元?

    如何關(guān)閉ESP32-S3中的FPU浮點(diǎn)數(shù)計(jì)算單元。如題,之前的項(xiàng)目在esp32s2 上面運(yùn)行良好,但是移植到esp32s3上后由于fpu造成浮點(diǎn)
    發(fā)表于 06-27 07:32

    請(qǐng)問(wèn)esp32 wroom 32u默認(rèn)開(kāi)啟硬件浮點(diǎn)運(yùn)算單元了嗎?

    請(qǐng)問(wèn)esp32 wroom 32u 默認(rèn)開(kāi)啟硬件浮點(diǎn)運(yùn)算單元了嗎?感謝
    發(fā)表于 06-21 11:08

    STM32的HAL庫(kù)如何開(kāi)啟FPU?

    求:STM32的HAL庫(kù)如何開(kāi)啟FPU?
    發(fā)表于 05-16 07:26

    優(yōu)秀的Verilog/FPGA開(kāi)源項(xiàng)目-浮點(diǎn)運(yùn)算器(FPU)介紹

    浮點(diǎn)運(yùn)算器(英文:floating point unit,簡(jiǎn)稱FPU)是計(jì)算機(jī)系統(tǒng)的一部分,它是專門用來(lái)進(jìn)行浮點(diǎn)數(shù)運(yùn)算的(CPU中也叫ALU
    的頭像 發(fā)表于 04-26 11:27 ?4333次閱讀
    優(yōu)秀的Verilog/FPGA開(kāi)源項(xiàng)目-<b class='flag-5'>浮點(diǎn)</b><b class='flag-5'>運(yùn)算</b>器(<b class='flag-5'>FPU</b>)介紹

    verilog語(yǔ)音實(shí)現(xiàn)浮點(diǎn)運(yùn)算

    Verilog可以通過(guò)使用IEEE標(biāo)準(zhǔn)的浮點(diǎn)數(shù)表示來(lái)實(shí)現(xiàn)浮點(diǎn)運(yùn)算。下面是一個(gè)基本的Verilog模塊示例,展示了如何進(jìn)行加法、乘法和除法等常見(jiàn)的浮點(diǎn)
    發(fā)表于 03-25 21:49

    關(guān)于STM32 DMAMUX模塊具體的應(yīng)用示例代碼

    有人通過(guò)公眾號(hào)微信留言,詢問(wèn)是否有關(guān)于STM32 DMAMUX模塊具體的應(yīng)用示例代碼。同時(shí),個(gè)人也發(fā)現(xiàn),雖然STM32片內(nèi)的DMAMUX不是什么新模塊,似乎還是很多人并不太熟悉。這里借
    的頭像 發(fā)表于 03-25 09:15 ?2756次閱讀
    <b class='flag-5'>關(guān)于</b><b class='flag-5'>STM32</b> DMAMUX模塊具體的應(yīng)用<b class='flag-5'>示例</b>代碼

    CKS32F4xx系列I2S功能介紹

    CKS32F4xx系列使用高性能的32位內(nèi)核,支持浮點(diǎn)運(yùn)算單元FPU),同時(shí)還支持DSP指令以及存儲(chǔ)保護(hù)(MPU)用來(lái)加強(qiáng)應(yīng)用的安全性。
    的頭像 發(fā)表于 03-17 09:40 ?1421次閱讀
    CKS32F4xx系列I2S功能介紹