小红花·文摘

本研究提出了一种安全驱动的量化框架，解决了资源受限设备上深度神经网络的模型压缩与性能保留问题。通过权重修剪和量化，优化模型复杂度，使模型大小减少60%，同时测试准确率提高2.5%。

Optimizing Deep Neural Networks with Secure Guided Self-Compression

BriefGPT - AI 论文速递 ·

本文提出了一种基于忆阻器的深度神经网络（DNN）框架，结合权重修剪和量化，利用交替方向乘子法（ADMM）提升性能。该框架在VGG-16和ResNet-18上实现了显著的权重压缩和功耗降低，且精度损失极小。此外，研究探讨了混合精度训练方案和新算法“排序权重分区”（SWS），有效降低了能耗和计算成本，展示了在大型语言模型和计算机视觉中的应用潜力。

深度神经网络中忆阻器交叉阵列的高效重编程：权重排序和位绑定

BriefGPT - AI 论文速递 ·

本文提出了一种基于忆阻器的深度神经网络（DNN）框架，结合权重修剪和量化，利用交替方向乘子法（ADMM）实现高压缩比和低精度损失。研究表明，该框架在VGG-16和ResNet-18网络上显著降低了功耗和面积，同时保持较高的训练准确率。此外，探讨了混合精度训练方案和新算法，以提高大型语言模型的服务效率，解决系统提示的瓶颈问题。

在_memristor交叉阵列上实现大型语言模型的能源高效部署：大与小的协同

BriefGPT - AI 论文速递 ·