小红花·文摘

本研究提出通过推断优先的视角来提升生成预训练算法的效率，解决生成模型中的算法创新停滞问题。改进扩散模型的推断过程，开发出稳定的单阶段算法，样本质量超越现有方法，并显著提升推断效率。

BriefGPT - AI 论文速递 ·

本文介绍了一种基于粒子马尔可夫蒙特卡罗的新推理方法，适用于复杂控制流的概率编程语言，实验证明其效率优于传统方法。同时开发了Swift推理引擎，提升了运算速度，并提出了新型概率编程框架，增强了推断效率。

BriefGPT - AI 论文速递 ·

T-MAC是一种基于查找表的低位量化方法，旨在提高大型语言模型的推断效率。通过FlattenQuant方法，模型在使用4位和8位权重时实现了显著的速度提升和内存减少，且准确度损失微小。此外，研究还提出了LUT-Q训练方法和BiQGEMM矩阵乘法，进一步优化了深度神经网络的性能和计算需求。

BriefGPT - AI 论文速递 ·

本研究提出了ActiveHARNet，一种支持设备上增量学习和推理的深度集成模型。实验证明ActiveHARNet在推断效率和数据采集减少率方面都有显著提升，证明了其可行性。

BriefGPT - AI 论文速递 ·

BriefGPT - AI 论文速递 ·