本研究提出了一种新颖的熵加权量化(EWQ)方法,克服了大型语言模型(LLMs)在架构和规模上的局限,实现了选择性量化,提升了质量与压缩效果的平衡。
本文介绍了广告牌点图(BBSplat),一种基于可学习纹理几何原语的3D场景表示方法。BBSplat通过优化纹理平面原语,提高了渲染效率和压缩效果,性能超过1200 FPS,展现出良好的应用潜力。
本文介绍了多种大型语言模型(LLMs)的修剪方法,如GBLM-Pruner、Wanda和LLM-Pruner。这些方法通过结构修剪和自动化度量标准,提高了模型性能和压缩效果,减少了重新训练的需求。实验结果表明,这些方法在语言基准测试中表现优异,适用于资源受限设备。
完成下面两步后,将自动完成登录并继续当前操作。