MoVE-KD:针对视觉语言模型的知识蒸馏与视觉编码器混合

📝

内容提要

本研究解决了视觉语言模型中多种视觉编码器的计算成本高的问题,提出了一种新的框架MoVE-KD,通过将多个视觉编码器的独特能力蒸馏成一个高效模型。研究结果表明,该方法有效改善了模型的适应性和效率,具有显著的性能提升。

🏷️

标签

➡️

继续阅读