0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于STE的QAT算法

jf_pJlTbmA9 ? 來源:jf_pJlTbmA9 ? 作者:jf_pJlTbmA9 ? 2023-08-21 10:46 ? 次閱讀

在對激活進行偽量化前先將激活截斷在(0,1)之間, 這樣的做法是基于一些經(jīng)典的網(wǎng)絡(luò)結(jié)構(gòu)中,比如AlexNet與RestNet中,大部分的激活都會落在這個范圍里的。

wKgZomTeyf6AHyPtAAKETnwxC-0189.jpg

對于weight,則是先通過這樣的一個非線性函數(shù)對weight進行映射,tanh(w)將weight的值域縮放到-1到+1之間,再除以2倍的tanh(w)絕對最大值加上1/2最終weight被映射到了0到1之間,再對其進行量化與反量化,再將輸出結(jié)果通過乘2減1仿射變換到-1到1之間。

這里的quant與dequant操作在原論文中是被表示為一個quantize_k的操作,k指的是k位的量化,其實本質(zhì)上就和我們之前提到的量化公式相似,就是把1/s替換成了2^k-1。

但DoReFa-Net的這個方式對于其它一些activation取值分布較廣的網(wǎng)絡(luò)就顯得有點過于死板了,所以就有另一個改進版本的算法Parameterized Clipping Activation,PACT針對activation的偽量化這一部分,將截斷門限alpha設(shè)為可學(xué)習(xí)的參數(shù),然后通過梯度下降來尋找更優(yōu)的門限。

因為alpha被設(shè)為可學(xué)習(xí)參數(shù),所以這一部分的導(dǎo)數(shù)就可以由小于alpha的部分為0,大于等于alpha的部分為1。

大家看到PACT的這個函數(shù)其實和ReLU很像,對大于零的部分做一個截斷操作,其實PACT原本思想也是想要替代ReLU。但問題是并非所有的模型結(jié)構(gòu)用的都是ReLU這個激活函數(shù),所以為了讓PACT的應(yīng)用范圍更廣,PaddlePaddle也也對其做了一定的改進,對大于零和小于零的激活值都做了相同的限制,使它能夠在某些情況下得到更好的量化范圍,以降低量化損失。

除此之外,還有一個常被使用到的算法,Learned Step Size Quantization,與PACT相似的是它也是通過訓(xùn)練來確定量化參數(shù),但不同的是PACT學(xué)習(xí)的是截斷門限,而LSQ直接將Scale定為一個可學(xué)習(xí)的參數(shù)。

wKgZomTeygGASPp6AANHdxjij3s018.jpg

我們先來看它的計算公式,這里的r_hat指的就是經(jīng)過量化與反量化后的數(shù)值,
這其實就是在對稱量化公式的基礎(chǔ)上加了個scale,完成了一個量化與反量化的過程

因為我們需要反向傳播計算梯度,所以就要對這個公式進行求導(dǎo) (加些對公式的解說)

對于這一塊的導(dǎo)數(shù),LSQ還是采用直通估計,由此我們就得到了一個最終的導(dǎo)數(shù)公式;

這里又可以看出,LSQ雖然也采用了直通估計,但它在截取范圍內(nèi)還是存在梯度計算的

而且,為了使得Scale的學(xué)習(xí)更為穩(wěn)定,LSQ還為其梯度加上了一個縮放系數(shù),這個系數(shù)主要由tensor中的元素數(shù)量決定

另外,既然是可學(xué)習(xí)參數(shù),那么就需要為其設(shè)置一個初始值,PACT中的alpha通常會被手動設(shè)置為常數(shù)值6,而LSQ原文中scale的初始值則由tensor的L1正則確定,不過在實踐過程中,其實更多的是通過統(tǒng)計激活分布,用EMA-minmax, KLD,MSE等PTQ的方式來計算初始的scale值。
審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4344

    瀏覽量

    62810
  • 網(wǎng)絡(luò)結(jié)構(gòu)

    關(guān)注

    0

    文章

    48

    瀏覽量

    11142
  • STE
    STE
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    9269
收藏 人收藏

    評論

    相關(guān)推薦

    HFW14S-2STE1LF和SFV18R-2STE1HLF富加宜(FCI)/安費諾板端優(yōu)勢定貨連接器

    級高新元器件,優(yōu)勢供應(yīng)行業(yè):汽車線束、汽車電子、家電、工業(yè)機械、航空軍工、民用等等聯(lián)系人:張先生聯(lián)系手機:***24小時在線QQ:1719878442(歡迎聯(lián)系詢價)SFW8R-4STAE9LFSFW28R-2STAE1LFSFW12R-1STAE9LFSFW8S-2STE9LFSFW26R-6STE1LFSFW30R-5
    發(fā)表于 10-15 17:30

    板端連接器FCI(富加宜)品牌供應(yīng)商優(yōu)勢型號SFV10R-1STE1HLF和SFW5R-1STE1LF

    級高新元器件,優(yōu)勢供應(yīng)行業(yè):汽車線束、汽車電子、家電、工業(yè)機械、航空軍工、民用等等聯(lián)系人:張先生聯(lián)系手機:***24小時在線QQ:1719878442(歡迎聯(lián)系詢價)62684-501100AHLFHFW11R-2STZE1LFSFW8R-2STE9LFSFW5S-2STMAE1LFSFW12R-6STE9LFSFW8R-
    發(fā)表于 10-15 17:33

    優(yōu)勢定貨連接器供應(yīng)商品牌FCI富加宜型號SFW30R-1STE1LF和SFW15R-1STE1LF及其SFW系列

    級高新元器件,優(yōu)勢供應(yīng)行業(yè):汽車線束、汽車電子、家電、工業(yè)機械、航空軍工、民用等等聯(lián)系人:張先生聯(lián)系手機:***24小時在線QQ:1719878442(歡迎聯(lián)系詢價)62684-362100ALFSFV35R-1STBE1HLFSFV9R-2STBE1HLF10061122-511420HLFSFW18R-7STE1LF1
    發(fā)表于 10-15 17:36

    FCI富加宜SFW10S-2STE1LF和SFW12R-2STE1LF優(yōu)勢板端連接器型號

    級高新元器件,優(yōu)勢供應(yīng)行業(yè):汽車線束、汽車電子、家電、工業(yè)機械、航空軍工、民用等等聯(lián)系人:張先生聯(lián)系手機:***24小時在線QQ:1719878442(歡迎聯(lián)系詢價)59453-081110EDHLFSFW4R-3STAE1LFSFW13R-1STE1LFSFV20R-2STBE1HLF62684-321100ALFSFV
    發(fā)表于 10-18 09:15

    SFW8S-2STE1LF和SLW16R-1C7LF優(yōu)勢訂貨板端連接器交期短價格優(yōu)

    級高新元器件,優(yōu)勢供應(yīng)行業(yè):汽車線束、汽車電子、家電、工業(yè)機械、航空軍工、民用等等聯(lián)系人:張先生聯(lián)系手機:***24小時在線QQ:1719878442(歡迎聯(lián)系詢價)SLW16S-1C7LFSLW4S-1C7LFSFW16R-1STE1LFSFW8S-2STME1LFSFW6R-2STE1LFSFW15S-2STE1LFS
    發(fā)表于 10-18 09:17

    Intel QAT加速卡邏輯實例有哪些

    Intel QAT加速卡邏輯實例1. QAT相關(guān)的名詞組織關(guān)系在本手冊中描述的平臺上,處理器可以連接到一個或多個英特爾?通信芯片組8925至8955系列(PCH)設(shè)備。 從軟件角度來看,每個PCH
    發(fā)表于 07-16 08:16

    Intel? QAT加速卡之Linux上編程詳解

    QATSoftware for Linux1. Introduction該程序員指南提供了有關(guān)軟件體系結(jié)構(gòu)和使用指南的信息。 相關(guān)的英特爾?QAT軟件庫文檔中記錄了有關(guān)使用英特爾
    發(fā)表于 07-22 08:37

    STE相比于之前的AMTE/MTE主要特點有哪些

    STE相比于之前的AMTE/MTE主要特點有哪些?vango驗證和出貨生產(chǎn)芯片的測試原理和基本方法是什么?
    發(fā)表于 11-12 06:00

    Atari ST/STE EPROM墨盒的資料分享

    描述Atari ST/STE EPROM 墨盒該 EPROM 盒板有 4 個 EPROM 插槽,每個插槽可用于 27C256 EPROM,從而可以填充整個 128kB 盒空間。兩個插槽用于 ROM4
    發(fā)表于 07-04 07:37

    英特爾QuestAsvices技術(shù)(英特爾?QAT

    ? QuickAssist Technology (Intel? QAT) Engine with OpenSSL 1.1.0.
    的頭像 發(fā)表于 10-29 06:31 ?2751次閱讀

    利用NVIDIA TensorRT實現(xiàn)推理的QAT偽量化

    在這篇文章中,我們簡要介紹了基本的量化概念和 TensorRT 的量化工具箱,然后回顧了 TensorRT 8 . 0 是如何處理 Q / DQ 網(wǎng)絡(luò)的。我們對量化工具箱提供的 resnet50qat 示例進行了快速演練。
    的頭像 發(fā)表于 03-31 16:51 ?3940次閱讀

    Atari ST/STE EPROM墨盒開源分享

    電子發(fā)燒友網(wǎng)站提供《Atari ST/STE EPROM墨盒開源分享.zip》資料免費下載
    發(fā)表于 07-06 09:20 ?0次下載
    Atari ST/<b class='flag-5'>STE</b> EPROM墨盒開源分享

    1990年代計算機Atari STE的完全未經(jīng)測試的翻拍

    電子發(fā)燒友網(wǎng)站提供《1990年代計算機Atari STE的完全未經(jīng)測試的翻拍.zip》資料免費下載
    發(fā)表于 07-21 11:34 ?0次下載
    1990年代計算機Atari <b class='flag-5'>STE</b>的完全未經(jīng)測試的翻拍

    帶有AV RCA和插孔的ATARI ST/STE RGB到VGA視頻適配器

    電子發(fā)燒友網(wǎng)站提供《帶有AV RCA和插孔的ATARI ST/STE RGB到VGA視頻適配器.zip》資料免費下載
    發(fā)表于 08-05 10:16 ?0次下載
    帶有AV RCA和插孔的ATARI ST/<b class='flag-5'>STE</b> RGB到VGA視頻適配器

    JW5116兼容芯洲SCT2330SCT2433STE 方案

    JW5116杰華特完全兼容芯洲D(zhuǎn)CDCSCT2330SCT2433STE方案
    發(fā)表于 04-24 16:50 ?4次下載