基于同态熵增的预训练模型个性化压缩算法研究

📝

内容提要

本研究针对当前AI领域中的Vision Transformer模型和大型语言模型(LLM)在移动设备上的部署挑战,提出了一种新型分层剪枝策略,通过压缩感知和随机采样来区分个性化层与共通层,从而大幅减少模型参数。实验结果表明,引入的步缓机制在剪枝后显著提高了模型的准确性,为未来在资源受限环境下高效个性化AI模型的部署提供了新的方向。

🏷️

标签

➡️

继续阅读