本研究提出了一种创新方法,结合大型语言模型和视觉问答系统,从少量视觉数据中学习新物体并提供解释。实验结果显示,该方法计算开销低,性能与现有方法相当,并具备可解释性。
完成下面两步后,将自动完成登录并继续当前操作。