该研究提出了多模态大规模视觉语言模型(LVLM)及相关方法,如u-LLaVA和ViLaM,旨在解决任务间干扰问题,提升视觉与语言任务的性能。通过优化数据质量和训练配方,较小模型也能达到与大模型相当的效果,展示了在医学图像分析等领域的潜力。
TriRE是一种新的持续学习范式,通过保留最突出的神经元、修订和巩固提取知识,以及回溯和重新学习促进次要活跃神经元,显著减少了任务干扰,并超过了其他持续学习方法。
完成下面两步后,将自动完成登录并继续当前操作。