小红花·文摘

本文综述了多模态大型语言模型（MLLMs）的最新进展，重点介绍了TinyGPT-V、Mipha和EE-MLLM等模型的设计与应用。研究分析了这些模型在视觉、语言和音频任务中的表现，并提出了知识蒸馏和新架构以提升效率。未来的研究方向将集中在优化计算资源和提升模型性能上。