0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TensorFlow官方發(fā)布消息稱將引入一個新的優(yōu)化工具包

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-09-21 08:53 ? 次閱讀

編者按:幾個月前,Tensorflow發(fā)布了一份名為《Quantizing deep convolutional networks for efficient inference》的白皮書,主要介紹團隊關于模型量化的相關工作,所謂量化,簡單來說就是將32浮點數近似地用8位整數存儲和計算,量化后,模型占用存儲空間減小75%,能起到壓縮模型的效果。而現在,這項技術就快和大家見面了。

今天凌晨,TensorFlow官方發(fā)布消息稱將引入一個新的優(yōu)化工具包,方便機器學習初學者和高級開發(fā)人員進行優(yōu)化,方便模型的部署和執(zhí)行。

它的名字是訓練后量化(post-training quantization),這是模型量化的一類,主要優(yōu)點有:

模型占用存儲空間縮小75%

如果是主要由卷積層組成的模型,執(zhí)行速度提高10–50%

如果是基于RNN的模型,執(zhí)行速度提高3倍

內存、算力要求的降低也意味著大多數模型的功耗會大幅降低

內存、算力、功耗,這是模型量化的主要優(yōu)化對象,而在實踐中,最能從中收益的自然是在各種移動端設備上使用機器學習模型的開發(fā)人員,尤其是TensorFlow Lite的用戶。

下圖展示了使用這個優(yōu)化工具包后,幾種典型模型在存儲空間占用上的變化(單核Android Pixel 2手機):

模型尺寸比較:經優(yōu)化的模型幾乎為原來的1/4

下圖是訓練后量化對模型執(zhí)行的加速效果(單核Android Pixel 2手機):

延遲比較:經優(yōu)化的模型執(zhí)行速度提高了1.2到1.4倍

通常情況下,模型壓縮會對原有準確率造成不同程度的影響,但訓練后量化的影響幾乎等同于無,它能在縮小尺寸、提高速度的前提下保持模型精度,如下圖所示(單核Android Pixel 2手機):

啟用模型量化

現在訓練后量化已被集成到TensorFlow Lite中,它的使用方法很簡單:首先構建一個TensorFlow模型,其次在conversion tool中找到模型量化的標志“posttrainingquantize”。假設模型存儲在savedmodeldir中,那么具體命令就是:

converter=tf.contrib.lite.TocoConverter.from_saved_model(saved_model_dir)

converter.post_training_quantize=True

tflite_quantized_model=converter.convert()

open(“quantized_model.tflite”, “wb”).write(tflite_quantized_model)

具體操作可見github:github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/lite/tutorials/posttrainingquant.ipynb

雖然目前開發(fā)者們只能在TensorFlow Lite中用到這個技術,但官方也稱將盡快把它整合到一般的TensorFlow工具中。

小結

除了訓練后量化,在之前提到的白皮書中,Tensorflow還提到了訓練時量化,它能使模型的準確率更高。而綜合來看,它們都是基于量化設計的技術,依靠把32浮點數近似地用8位整數存儲和計算來達到內存占用更少、計算更少和功耗更少的目的。

隨著深層神經網絡不斷在現實中落地,這種技術將適應現代科技設備的發(fā)展步伐,為開發(fā)者和產品用戶帶來便利。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8422

    瀏覽量

    132724
  • tensorflow
    +關注

    關注

    13

    文章

    329

    瀏覽量

    60537

原文標題:模型大小縮小75%,TensorFlow推出模型優(yōu)化工具包

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    最新Simplicity SDK軟件開發(fā)工具包發(fā)布

    最新的SimplicitySDK軟件開發(fā)工具包已經發(fā)布!此次更新針對SiliconLabs(芯科科技)第二代無線開發(fā)平臺帶來了包括藍牙6.0的信道探測(Channel Sounding
    的頭像 發(fā)表于 12-24 09:47 ?170次閱讀

    基于EasyGo Vs工具包和Nl veristand軟件進行的永磁同步電機實時仿真

    EasyGo Vs Addon是款領先的FPGA仿真工具包軟件,它強大地連接了VeriStand軟件與Matlab/Simulink,為實時測試和驗證領域帶來了前所未有的便利和效率,特別適用于汽車
    的頭像 發(fā)表于 11-27 11:28 ?266次閱讀
    基于EasyGo Vs<b class='flag-5'>工具包</b>和Nl veristand軟件進行的永磁同步電機實時仿真

    FPGA仿真工具包軟件EasyGo Vs Addon介紹

    EasyGo Vs Addon是款領先的FPGA仿真工具包軟件,它強大地連接了VeriStand軟件與Matlab/Simulink,為實時測試和驗證領域帶來了前所未有的便利和效率,特別適用于汽車、航空航天和能源電力等實時測試和驗證至關重要的行業(yè)。
    的頭像 發(fā)表于 10-24 15:55 ?405次閱讀
    FPGA仿真<b class='flag-5'>工具包</b>軟件EasyGo Vs Addon介紹

    采用德州儀器 (TI) 工具包進行模擬前端設計應用說明

    電子發(fā)燒友網站提供《采用德州儀器 (TI) 工具包進行模擬前端設計應用說明.pdf》資料免費下載
    發(fā)表于 09-09 11:21 ?0次下載
    采用德州儀器 (TI) <b class='flag-5'>工具包</b>進行模擬前端設計應用說明

    TensorFlow是什么?TensorFlow怎么用?

    TensorFlow是由Google開發(fā)的開源深度學習框架,它允許開發(fā)者方便地構建、訓練和部署各種復雜的機器學習模型。TensorFlow憑借其高效的計算性能、靈活的架構以及豐富的
    的頭像 發(fā)表于 07-12 16:38 ?727次閱讀

    使用freeRTOS開發(fā)工具包時,在哪里可以找到freeRTOS的版本?

    作為主題,當我使用 freeRTOS 開發(fā)工具包時,在哪里可以找到 freeRTOS 的版本?
    發(fā)表于 07-09 07:17

    tensorflow和pytorch哪個好

    tensorflow和pytorch都是非常不錯的強大的框架,TensorFlow還是PyTorch哪個更好取決于您的具體需求,以下是關于這兩框架的些關鍵點:
    的頭像 發(fā)表于 07-05 09:42 ?702次閱讀

    keras模型轉tensorflow session

    在這篇文章中,我們討論如何Keras模型轉換為TensorFlow session。 Keras和TensorFlow簡介 Keras是
    的頭像 發(fā)表于 07-05 09:36 ?553次閱讀

    寶塔面板Docker鍵安裝:部署GPTAcademic,開發(fā)私有GPT學術優(yōu)化工具

    人工智能的浪潮中,GPT模型因其強大的自然語言處理能力備受矚目。然而,為了更好地應用于學術領域,許多人希望能部署自己私有的GPT學術優(yōu)化工具。本文詳細介紹如何通過寶塔面板和Docker鍵安裝
    的頭像 發(fā)表于 07-02 11:58 ?2634次閱讀
    寶塔面板Docker<b class='flag-5'>一</b>鍵安裝:部署GPTAcademic,開發(fā)私有GPT學術<b class='flag-5'>優(yōu)化工具</b>

    新加坡推出Project Moonshot -- 這是款生成式人工智能測試工具包,用于應對LLM安全和安保挑戰(zhàn)

    新加坡2024年6月3日?/美通社/ -- 新加坡通訊及新聞部部長Josephine Teo 女士推出了AI Verify- Project Moonshot,這是易于使用的測試工具包,旨在
    的頭像 發(fā)表于 06-03 19:59 ?239次閱讀
    新加坡推出Project Moonshot -- 這是<b class='flag-5'>一</b>款生成式人工智能測試<b class='flag-5'>工具包</b>,用于應對LLM安全和安保挑戰(zhàn)

    QE for Motor V1.3.0:汽車開發(fā)輔助工具解決方案工具包

    電子發(fā)燒友網站提供《QE for Motor V1.3.0:汽車開發(fā)輔助工具解決方案工具包.pdf》資料免費下載
    發(fā)表于 02-19 10:44 ?0次下載
    QE for Motor V1.3.0:汽車開發(fā)輔助<b class='flag-5'>工具</b>解決方案<b class='flag-5'>工具包</b>

    求助,請問有沒有l(wèi)abview opc ua工具包 2018 啊

    如題,求助,請問有沒有l(wèi)abview opc ua工具包 2018 啊。只要2018的哦
    發(fā)表于 01-25 20:14

    labview工具包下載

    求助labview2020控制仿真工具包,官網下載不了,這個說能免注冊下載網址我打開也是空白,求助好心人幫幫忙分享 https://download.ni.com/#evalua
    發(fā)表于 01-16 15:07

    利用ProfiShark 構建便攜式網絡取證工具包

    網絡安全領域日益重視便攜式取證工具的靈活應用。本文介紹了如何構建以ProfiShark1G為核心的便攜式網絡取證工具包,以提高網絡取證的效率和實效性
    的頭像 發(fā)表于 01-13 08:04 ?1607次閱讀
    利用ProfiShark 構建便攜式網絡取證<b class='flag-5'>工具包</b>

    Torch TensorRT是優(yōu)化PyTorch模型推理性能的工具

    那么,什么是Torch TensorRT呢?Torch是我們大家聚在起的原因,它是端到端的機器學習框架。而TensorRT則是NVIDIA的高性能深度學習推理軟件工具包。Torc
    的頭像 發(fā)表于 01-09 16:41 ?1761次閱讀
    Torch TensorRT是<b class='flag-5'>一</b><b class='flag-5'>個</b><b class='flag-5'>優(yōu)化</b>PyTorch模型推理性能的<b class='flag-5'>工具</b>