本文提出了一种研发代理量化框架,旨在解决金融市场资产回报预测中的高维性和非平稳性问题。该框架通过协调因素与模型的共同优化,实现量化策略的全栈自动化研发。研究表明,该框架的年度收益比传统因子库提高了2倍,并在真实市场中优于现有深度时间序列模型,展现了良好的预测准确性和策略稳健性。
本研究提出了一种安全驱动的量化框架,解决了资源受限设备上深度神经网络的模型压缩与性能保留问题。通过权重修剪和量化,优化模型复杂度,使模型大小减少60%,同时测试准确率提高2.5%。
本研究提出MambaQuant量化框架,解决Mamba模型中门投影和输出投影的异常值问题,实现8位权重和激活量化,准确率损失低于1%。
本研究提出了一种高效的量化框架,解决了稳定扩散模型在文本到图像生成中的计算密集性问题,提升了生成质量和一致性。
本研究提出了一种系统的量化框架,解决了机器学习算法在因果推断中可推广性评估不足的问题,通过真实数据模拟评估模型性能,为实际应用提供指导。
本文介绍了一种高效的transformer模型训练方法,支持亿级参数的并行计算,显著提升了训练效率。通过实验,提出了量化框架和分布式训练策略,尤其在资源有限的环境下,推理吞吐量得到了显著提高。
本文介绍了一种高效的量化框架,旨在解决大型语言模型的内存需求和推断成本问题。通过SqueezeLLM和QFT等方法,实现了高达3位的无损压缩和内存优化,显著提高了推断性能。研究表明,量化模型在保持准确性的同时,能够在GPU上实现更高的吞吐量,且新型算法ABQ-LLM在低比特宽度执行中表现优异。
本文提出了一种新的量化框架PreQuant,分开量化与微调,提升了Transformer模型在GLUE数据集上的表现。研究表明,量化显著提高了模型的敌对准确性和鲁棒性。此外,提出的ZeroQuant后训练量化方法有效压缩大型模型并减少精度损失。
本文介绍了一种名为WAGEUBN的量化框架,能够将神经网络的数据路径转换为低位整数,实现全面量化和在线训练。该框架在ImageNet数据集上表现出良好的精度,适用于移动设备,提高了推理效率。研究还探讨了不同量化技术在深度神经网络中的应用,强调了量化对模型大小和推理速度的影响。
完成下面两步后,将自动完成登录并继续当前操作。