小红花·文摘

本研究针对视频语言模型ResNetVLLM中的多模态幻觉问题，提出了改进的Lynx模型和动态知识库策略。实验结果表明，ResNetVLLM-2的准确率从54.8%提升至65.3%，显著增强了模型的可靠性。