神經(jīng)網(wǎng)絡(luò)壓縮方法:模型量化的概念簡介

來源:DeepHub IMBA 本文約3200字,建議閱讀6分鐘?
本文為你介紹如何使用量化的方法優(yōu)化重型深度神經(jīng)網(wǎng)絡(luò)模型。
在過去的十年中,深度學(xué)習(xí)在解決許多以前被認(rèn)為無法解決的問題方面發(fā)揮了重要作用,并且在某些任務(wù)上的準(zhǔn)確性也與人類水平相當(dāng)甚至超過了人類水平。如下圖所示,更深的網(wǎng)絡(luò)具有更高的準(zhǔn)確度,這一點(diǎn)也被廣泛接受并且證明。

更長的推理時(shí)間 更高的計(jì)算要求 更長的訓(xùn)練時(shí)間
模型壓縮方法
什么是量化?








深度學(xué)習(xí)中的量化


量化類型
訓(xùn)練后量化:在模型完全訓(xùn)練后執(zhí)行 量化感知訓(xùn)練:訓(xùn)練是在量化約束下完成的



模型的基準(zhǔn)測(cè)試



總結(jié)
評(píng)論
圖片
表情
