本研究提出两种方法,通过模拟数据增强视觉-语言模型的物理推理能力,包括问答对微调和物理上下文构建器。实验结果表明,这些方法显著提升了模型在物理推理任务中的表现。
完成下面两步后,将自动完成登录并继续当前操作。