小红花·文摘

本研究提出了一种创新方法，解决大型语言模型处理结构化表格数据的不足。通过多层次分区和自适应量化机制，改善了稀疏高基数字段和数值推理的挑战，实现了交易与文本的有效交互，并在合成支付交易数据集上验证了其有效性。

Scalable Multimodal Table Transaction Representation Learning

BriefGPT - AI 论文速递 ·

本文介绍了一种基于深度强化学习的硬件感知自适应量化方法，旨在为不同神经网络和硬件架构定制量化策略。该方法有效降低延迟和能耗，并通过优化量化策略提高计算效率和准确性，同时保持精度。

加速边缘设备上的二次幂量化

BriefGPT - AI 论文速递 ·

本研究提出了多种深度神经网络的量化方法，旨在提高计算效率和模型性能。通过端到端深度强化学习框架和自适应量化技术，保持高准确性并降低计算成本。新方法如HAWQ、SAT和GPTQ等在不同模型上表现优于传统方法，推动了神经网络在资源受限环境中的应用。

约束指导的神经网络模型量化

BriefGPT - AI 论文速递 ·

本文探讨了Transformer模型的量化问题，提出了三种解决方案，包括基于embedding group的量化方法，以降低内存占用并保持精度。研究还涉及量化感知训练(QAT)和自适应量化方案，强调与数据分布匹配的重要性。实验结果表明，提出的4位量化模型在性能和能耗上表现优异，为Transformer模型的高效训练和部署提供了指导。

设备端人工智能：时间序列中变换器的量化感知训练

BriefGPT - AI 论文速递 ·

本文研究了深度神经网络在FPGA上的优化设计，提出多种精度量化方法以降低计算和数据传输成本。通过量化卷积神经网络，模型在ILSVRC-12基准测试中实现了4~6倍的加速和15~20倍的压缩，分类准确率损失仅为1%。同时，介绍了一种基于深度强化学习的自适应量化方法，显著降低了延迟和能耗，为神经网络和硬件架构设计提供了新思路。

深度神经网络加速器中的量化和映射协同探索

BriefGPT - AI 论文速递 ·

本文探讨了自适应量化梯度下降算法（AQGD）在网络控制系统中的应用，证明其在一定比特率阈值以上具有指数级收敛速度。AQGD在保持快速线性收敛率方面表现优越，有效解决多智能体优化问题，提升算法效率和可伸缩性。

有限通信范围下的线性二次网络控制的分布式策略梯度

BriefGPT - AI 论文速递 ·

本研究提出了一种新的自适应量化方案，可在时间序列Transformer模型上减少计算开销，同时保持可接受的精度。该方法在真实数据和混合精度量化中具有鲁棒性，为模型量化和部署决策提供了指导，同时为进一步发展量化技术奠定基础。

关于资源受限的 FPGA 上基于时间序列 Transformer 模型的量化感知训练研究

BriefGPT - AI 论文速递 ·