权重量化的深度神经网络模型压缩算法

陈昀; 蔡晓东<sup>*</sup>; 梁晓曦; 王萌

doi:10.19665/j.issn1001-2400.2019.02.022

摘要

深度神经网络模型通常存在大量的权重参数,为了减少其对存储空间的占用,提出权重量化的深度神经网络模型压缩算法。在前向传播过程中,使用一个四值滤波器将全精度权重量化为2、1、-1和-2四种状态,以进行高效的权重编码。最小化全精度权重与缩放后四值权重的L2距离,以获得精确的四值权重模型。使用一个32位二进制数对16个四值权重进行编码压缩,以大幅度压缩模型。在MNIST、CIFAR-10和CIFAR-100数据集上的实验表明,该算法分别获得了6.74%、6.88%和6.62%的模型压缩率,与三值权重网络的相同,但准确率分别提升了0.06%、0.82%和1.51%。结果表明,该算法可提供高效、精确的深度神经网络模型压缩。

出版日期2019
单位桂林电子科技大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-11 18:20

权重量化的深度神经网络模型压缩算法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友