小红花·文摘

本研究提出两种方法，通过模拟数据增强视觉-语言模型的物理推理能力，包括问答对微调和物理上下文构建器。实验结果表明，这些方法显著提升了模型在物理推理任务中的表现。