小红花·文摘

本研究提出了一种创新方法，结合大型语言模型和视觉问答系统，从少量视觉数据中学习新物体并提供解释。实验结果显示，该方法计算开销低，性能与现有方法相当，并具备可解释性。