首页 > 期刊 > 自然科学与工程技术 > 信息科技 > 电子信息科学综合 > 计算机与数字工程 > 卷积神经网络低位宽量化推理研究 【正文】

卷积神经网络低位宽量化推理研究

付强; 姜晶菲; 窦勇 国防科技大学计算机学院; 长沙410073
  • 卷积神经网络
  • 量化
  • 批规范化

摘要:随着深度卷积神经网络对计算量与访存量的需求增加,网络压缩与加速技术成为近几年的研究热点。针对网络架构改进、伪量化等重训练方法在压缩深度卷积神经网络时存在算力要求大、数据集难获得以及部署周期长等缺点,论文提出一种有效利用卷积神经网络数值均衡以及批规范化和ReLU非线性激活组合信息特点的压缩加速方法,只需对预训练网络模型权值进行调整即可达到较好的压缩加速效果。该方法适合在FPGA或ASIC这类定制硬件上实现,并能够实现硬件逻辑资源、能耗、访存带宽以及物体检测精度之间的平衡。最后,在人脸检测任务上验证了该卷积神经网络低位宽量化推理方法的有效性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

投稿咨询 免费咨询 杂志订阅

我们提供的服务

服务流程: 确定期刊 支付定金 完成服务 支付尾款 在线咨询