0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詳解浮點運算的定點編程

FPGA設(shè)計論壇 ? 來源:未知 ? 2022-12-09 12:25 ? 次閱讀

我們使用的處理器一般情況下,要么直接支持硬件的浮點運算,比如某些帶有FPU的器件,要么就只支持定點運算,此時對浮點數(shù)的處理需要通過編譯器來完成。在支持硬件浮點處理的器件上,對浮點運算編程最快捷的方法就是直接使用浮點類型,比如單精度的float來完成。但是在很多情況下,限于成本、物料等因素,可供我們使用的只有一個定點處理器時,直接使用float類型進(jìn)行浮點類型的運算會使得編譯器產(chǎn)生大量的代碼來完成一段看起來十分簡單的浮點數(shù)學(xué)運算,造成的后果是程序的執(zhí)行時間顯著加長,且其占用的資源量也會成倍地增加,這就涉及到了如何在定點處理器上對浮點運算進(jìn)行高效處理的問題。


既然是定點處理器,那么其對定點數(shù),或者說字面意義上的“整數(shù)”進(jìn)行處理的效率就會比它處理浮點類型的運算要高的多。所以在定點處理器上,我們使用定點的整數(shù)來代表一個浮點數(shù),并規(guī)定整數(shù)位數(shù)和小數(shù)位數(shù),從而方便地對定點數(shù)和浮點數(shù)進(jìn)行轉(zhuǎn)換。以一個32位的定點數(shù)為例,假設(shè)轉(zhuǎn)換因子為Q,即32位中小數(shù)的位數(shù)為Q,整數(shù)位數(shù)則為31-Q(有符號數(shù)的情況),則定點數(shù)與浮點數(shù)的換算關(guān)系為:

定點數(shù)=浮點數(shù)×2^Q

例如,浮點數(shù)-2.0轉(zhuǎn)換到Q為30的定點數(shù)時,結(jié)果為:

定點數(shù)=-2×2^30=-2147483648

32位有符號數(shù)的表示范圍是:-2147483648到2147483647。如果我們把有符號定點數(shù)的最大值2147483647轉(zhuǎn)換為Q為30對應(yīng)的浮點數(shù),則結(jié)果為:

浮點數(shù)2147483647/2^30=1.999999999

從上面的兩個計算例子中也可以看出,在Q30格式的情況下,最大的浮點數(shù)只能表示到1.999999999,如果我們想把浮點數(shù)2.0轉(zhuǎn)換為Q30的定點數(shù),則產(chǎn)生了溢出,即造成了1e-9的截斷誤差。在此我們列出Q0到Q30對應(yīng)的范圍和分辨率如下表所:

如果你嫌自己計算麻煩的話,可以借助Matlab的命令來求取它們的轉(zhuǎn)換,例如,在Matlab的命令窗口中輸入:

q = quantizer('fixed', 'ceil', 'saturate', [32 30]);

FixedNum=bin2dec(num2bin(q,1.999999999));

回車之后就可以看到1.999999999轉(zhuǎn)成Q30之后的定點數(shù)了。

弄清楚了單個浮點數(shù)和定點數(shù)之間的轉(zhuǎn)換關(guān)系,接下來就需要了解一下兩個定點數(shù)所代表的浮點數(shù)進(jìn)行運算時,是如何轉(zhuǎn)換的了。根據(jù)乘法的結(jié)合律、分配率,浮點數(shù)轉(zhuǎn)換之后的定點數(shù)是可以直接運算的,例如:

1. 不同Q格式的轉(zhuǎn)換

設(shè)有定點數(shù)Fixed1=Float1*2^Q1,如果把它用為Q2這個不同精度/表示范圍的定點數(shù)來表示,則有Fixed2=Float1*2^Q2。所以不同的Q格式直接的轉(zhuǎn)換為:

Fixed2=Fixed1*2^Q2/2^Q1=Fixed1*2^(Q2-Q1)

因為Fixed1、Fixed2都是定點數(shù),所以在C編程的情況下,我們可以使用高效的左移、右移操作來完成這個乘以2^(Q2-Q1)的操作。

2. 兩個相同Q格式的定點數(shù):

Fixed1=Float1*2^Q

Fixed2=Float2*2^Q

則加法操作為:

Float1+Float2=Fixed1/2^Q+Fixed/2^Q=(Fixed1+Fixed2)/2^Q

對于上述的加法操作,如果定點數(shù)的和Fixed1+Fixed2超過了32位整數(shù)的極值,則會發(fā)生溢出現(xiàn)象,造成結(jié)果的不正確,此時我們只能先損失一倍的精度,把Float1、Float2的Q值變?yōu)镼-1.

乘法操作為:

Float1*Float2=Fixed1/2^Q*Fixed/2^Q= Fixed1*Fixed2/2^(2Q)

同樣的道理,如果Fixed1*Fixed2之后的定點數(shù)超過了32位整數(shù)的極值,則我們也需要提前對它們進(jìn)行一下折算,變換一下它們的Q值。這就涉及到對結(jié)果的一個預(yù)估問題,也是定點編程不如浮點編程簡單、高效的不足之一。

3. 兩個不同Q格式的定點數(shù):

Fixed1=Float1*2^Q1

Fixed2=Float2*2^Q2

運算的規(guī)則是結(jié)合了前面的兩種情況,只不過多了額外的轉(zhuǎn)換工作:要么把其中的一個Q1格式的定點數(shù)先轉(zhuǎn)換為另一個Q2格式,要么把它們都轉(zhuǎn)換為一個中間值Q3格式的定點數(shù),然后再進(jìn)行運算。

這些運算雖然并不復(fù)雜,但是如果在數(shù)學(xué)運算比較多的情況下,一個個的進(jìn)行手工轉(zhuǎn)換還是比較麻煩的,還好在近些年的處理器特別是DSP芯片中,在其BootROM中都內(nèi)置了強(qiáng)大的數(shù)學(xué)表來幫助我們完成這些轉(zhuǎn)換工作,我們只要按照一定的格式進(jìn)行書寫,那么編譯器就會自動調(diào)用相關(guān)的庫函數(shù)來完成了。以TI的C28x系列DSP為例,我們可以使用現(xiàn)成的IQMath庫來完成這些繁瑣的工作。它的使用方法示例為

1)在工程屬性中引用IQmath.lib庫文件

2)在使用IQMath庫函數(shù)的主程序中引用相關(guān)的頭文件:

#include

#define PI 3.14159

_iq input, sin_out;

void main(void )

{

/* 0.25 x PI radians represented in Q29 format*/

input=_IQ29(0.25*PI);

sin_out =_IQ29sin(input);

}

其中,我們可以在頭文件中指定一個全局的Q格式,在不需要特別指定Q值的時候,使用默認(rèn)的值。

例如,在頭文件中#define Q 28,則我們在程序中調(diào)用IQMath庫函數(shù)時,

sin_out =_IQsin(input);//使用全局定義的Q28格式

sin_out =_IQ29sin(input); //特別指定使用Q29格式

默認(rèn)情況下,編譯器使用的Q格式是24,如果追求更高的精度,則可以使用更大的Q值,但是相應(yīng)地表示的浮點數(shù)的范圍也要小,此時可以考慮使用標(biāo)么值,使得大部分變量的值都處在-1到1的區(qū)間內(nèi)。

此外,在C語言編程時,調(diào)用方式是_IQsin(input),在C++編程時,則直接使用IQsin(input)就可以了。

3)在CMD鏈接文件中指明IQMath數(shù)學(xué)表的位置:

例如,對于281x器件:

MEMORY

{

PAGE 0:

PRAMH0 (RW) : origin = 0x3f8000, length = 0x001000

PAGE 1:

IQTABLES (R) : origin = 0x3FF000, length = 0x000b50

DRAMH0 (RW) : origin = 0x3f9000, length = 0x001000

}

SECTIONS

{

IQmathTables : load = IQTABLES, type = NOLOAD, PAGE = 1

IQmathTablesRam : load = DRAMH0, PAGE = 1

IQmath : load = PRAMH0, PAGE = 0

}

對于2833x器件:

MEMORY

{

PAGE 0:

PRAML0 (RW) : origin = 0x008000, length = 0x001000

PAGE 1:

IQTABLES (R) : origin = 0x3FE000, length = 0x000b50

IQTABLES2 (R) : origin = 0x3FEB50, length = 0x00008c

DRAML1 (RW) : origin = 0x009000, length = 0x001000

}

SECTIONS

{

IQmathTables : load = IQTABLES, type = NOLOAD, PAGE = 1

IQmathTables2 > IQTABLES2, type = NOLOAD, PAGE = 1

{

IQmath.lib (IQmathTablesRam)

}

IQmathTablesRam : load = DRAML1, PAGE = 1

IQmath : load = PRAML0, PAGE = 0

}

對于280x器件:

MEMORY

{

PAGE 0:

PRAML0 (RW) : origin = 0x008000, length = 0x001000

PAGE 1:

IQTABLES (R) : origin = 0x3FE000, length = 0x000b50

IQTABLES2 (R) : origin = 0x3FEB50, length = 0x00008c

IQTABLES3 (R) : origin = 0x3FEBDC, length = 0x0000AA

DRAML1 (RW) : origin = 0x009000, length = 0x001000

}

SECTIONS

{

IQmathTables : load = IQTABLES, type = NOLOAD, PAGE = 1

IQmathTables2 > IQTABLES2, type = NOLOAD, PAGE = 1

{

IQmath.lib (IQmathTablesRam)

}

IQmathTables3 > IQTABLES3, type = NOLOAD, PAGE = 1

{

IQmath.lib (IQmathTablesRam)

}

IQmath : load = PRAML0, PAGE = 0

}

為了方便數(shù)學(xué)運算的高效處理,IQMath庫中還包含了常用的數(shù)學(xué)運算函數(shù),包括:

1. 格式轉(zhuǎn)換

IQN浮點轉(zhuǎn)定點,IQNtoF定點轉(zhuǎn)浮點,atoIQN字符串轉(zhuǎn)定點,IQNtoa定點轉(zhuǎn)字符串,IQNint返回定點數(shù)的整數(shù)部分,IQNfrac返回定點數(shù)的小數(shù)部分,IQtoIQN和IQNtoIQ為指定Q格式與全局Q格式的互轉(zhuǎn),IQtoQN和QNtoIQ為32位與16位互轉(zhuǎn),IQmpy2, 4, 8..64即左移,IQdiv2, 4, 8..64即右移

2. 算數(shù)運算

IQNmpy和IQNrmpy:乘法,IQNrsmpy為帶飽和的乘法。IQNmpyI32和IQNmpyI32int為定點數(shù)與32位整數(shù)的乘法,IQNmpyI32frac可返回結(jié)果的小數(shù)位數(shù)。QNmpyIQX:不同Q格式的定點數(shù)相乘。

IQNdiv:除法運算。

3. 三角運算

包括IQNasin,IQNsin,IQNsinPU,IQNacos,IQNcos,IQNcosPU,IQNatan2,IQNatan2PU,IQNatan。

其中,PU的含義在該函數(shù)中π已經(jīng)折算為1。例如:

sin(0.25*π)=sinPU(0.25)。

4. 代數(shù)運算

包括IQNexp,IQNlog,IQNsqrt,IQNisqrt,IQNmag,IQNabs,IQsat





精彩推薦



至芯科技12年不忘初心、再度起航12月17日北京中心FPGA工程師就業(yè)班開課、線上線下多維教學(xué)、歡迎咨詢!
浮點與定點運算以及數(shù)據(jù)定標(biāo)和精度問題
FPGA基礎(chǔ)之HLS
掃碼加微信邀請您加入FPGA學(xué)習(xí)交流群




歡迎加入至芯科技FPGA微信學(xué)習(xí)交流群,這里有一群優(yōu)秀的FPGA工程師、學(xué)生、老師、這里FPGA技術(shù)交流學(xué)習(xí)氛圍濃厚、相互分享、相互幫助、叫上小伙伴一起加入吧!


點個在看你最好看





原文標(biāo)題:詳解浮點運算的定點編程

文章出處:【微信公眾號:FPGA設(shè)計論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1635

    文章

    21841

    瀏覽量

    608433

原文標(biāo)題:詳解浮點運算的定點編程

文章出處:【微信號:gh_9d70b445f494,微信公眾號:FPGA設(shè)計論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    設(shè)計了一個基于浮點數(shù)運算的協(xié)處理器,使用C語言編程時沒法輸入float型數(shù)據(jù),請問有哪些部分需要修改?

    我設(shè)計了一個基于浮點數(shù)運算的協(xié)處理器,使用C語言編程時沒法輸入float型數(shù)據(jù),請問有哪些部分需要修改?SDK,EXU_decoder浮點寄存器都需要修改嗎,謝謝
    發(fā)表于 03-07 16:03

    FPGA中的浮點四則運算是什么

    由于定點的四則運算比較簡單,如加減法只要注意符號擴(kuò)展,小數(shù)點對齊等問題即可。在本文中,運用在前一節(jié)中描述的自定義浮點格式FPGA中數(shù)的表示方法(下),完成浮點四則
    的頭像 發(fā)表于 11-16 12:51 ?509次閱讀
    FPGA中的<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>是什么

    FPGA中浮點四則運算的實現(xiàn)過程

    由于定點的四則運算比較簡單,如加減法只要注意符號擴(kuò)展,小數(shù)點對齊等問題即可。在本文中,運用在前一節(jié)中描述的自定義浮點格式FPGA中數(shù)的表示方法(下),完成浮點四則
    的頭像 發(fā)表于 11-16 11:19 ?848次閱讀
    FPGA中<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>的實現(xiàn)過程

    TMS320C6743定點浮點數(shù)字信號處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6743定點浮點數(shù)字信號處理器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-07 11:37 ?0次下載
    TMS320C6743<b class='flag-5'>定點</b>和<b class='flag-5'>浮點</b>數(shù)字信號處理器數(shù)據(jù)表

    TMS320C6745 TMS320C6747定點浮點數(shù)字信號處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6745 TMS320C6747定點浮點數(shù)字信號處理器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-07 11:35 ?0次下載
    TMS320C6745 TMS320C6747<b class='flag-5'>定點</b>和<b class='flag-5'>浮點</b>數(shù)字信號處理器數(shù)據(jù)表

    TMS320C6748定點浮點DSP數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6748定點浮點DSP數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-07 10:57 ?0次下載
    TMS320C6748<b class='flag-5'>定點</b>和<b class='flag-5'>浮點</b>DSP數(shù)據(jù)表

    TMS320C6654定點浮點數(shù)字信號處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6654定點浮點數(shù)字信號處理器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-07 10:11 ?1次下載
    TMS320C6654<b class='flag-5'>定點</b>和<b class='flag-5'>浮點</b>數(shù)字信號處理器數(shù)據(jù)表

    TMS320C6742定點浮點DSP數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6742定點浮點DSP數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-07 09:57 ?0次下載
    TMS320C6742<b class='flag-5'>定點</b>和<b class='flag-5'>浮點</b>DSP數(shù)據(jù)表

    TMS320C6746定點浮點DSP數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6746定點浮點DSP數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-07 09:55 ?0次下載
    TMS320C6746<b class='flag-5'>定點</b>和<b class='flag-5'>浮點</b>DSP數(shù)據(jù)表

    TMS320C6655/57定點浮點數(shù)字信號處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6655/57定點浮點數(shù)字信號處理器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-06 14:19 ?0次下載
    TMS320C6655/57<b class='flag-5'>定點</b>和<b class='flag-5'>浮點</b>數(shù)字信號處理器數(shù)據(jù)表

    TMS320C6671定點浮點數(shù)字信號處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6671定點浮點數(shù)字信號處理器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-05 11:17 ?0次下載
    TMS320C6671<b class='flag-5'>定點</b>和<b class='flag-5'>浮點</b>數(shù)字信號處理器數(shù)據(jù)表

    TMS320C6670多核定點浮點片上系統(tǒng)數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6670多核定點浮點片上系統(tǒng)數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-01 11:06 ?0次下載
    TMS320C6670多核<b class='flag-5'>定點</b>和<b class='flag-5'>浮點</b>片上系統(tǒng)數(shù)據(jù)表

    優(yōu)秀的Verilog/FPGA開源項目-浮點運算器(FPU)介紹

    浮點運算器(英文:floating point unit,簡稱FPU)是計算機(jī)系統(tǒng)的一部分,它是專門用來進(jìn)行浮點數(shù)運算的(CPU中也叫ALU)。
    的頭像 發(fā)表于 04-26 11:27 ?4311次閱讀
    優(yōu)秀的Verilog/FPGA開源項目-<b class='flag-5'>浮點</b><b class='flag-5'>運算</b>器(FPU)介紹

    verilog語音實現(xiàn)浮點運算

    Verilog可以通過使用IEEE標(biāo)準(zhǔn)的浮點數(shù)表示來實現(xiàn)浮點運算。下面是一個基本的Verilog模塊示例,展示了如何進(jìn)行加法、乘法和除法等常見的浮點
    發(fā)表于 03-25 21:49

    STSPIN32F0支持硬件浮點運算嗎?

    STSPIN32F0 支不支持硬件浮點運算
    發(fā)表于 03-13 06:32