本研究提出了一种名为GeoGen的管道,旨在提升多模态大语言模型在几何问题解决中的能力。GeoGen结合符号推理与多模态模型,能够自动生成几何图形的逐步推理路径,从而显著改善模型在几何推理任务中的表现。
该研究提出了逆思维链(R-CoT)生成管道,解决了大型多模态模型在几何推理中缺乏高质量图像文本配对数据的问题,显著提升了模型在MathVista和GeoQA数据集上的表现。
本研究提出几何约定,通过多层图和多智能体系统框架,提升大语言模型(LLMs)对复杂物理世界的理解,发现LLMs能够在统一约定下进行多步骤几何推理。
本研究分析了计算机图形学学生在视觉感知和几何推理方面的技能缺口。评估了多模态模型GPT-4o,发现其在处理视觉信息上具有潜力,但准确性和质量仍需提升。提出了新教学方法,以帮助教育者利用生成性人工智能提高学习效果。
本研究提出了结构化知识的几何推理方法,使用 Knowledge Crosswords 进行实验,附加了两种新方法,结果表明 Verify-All 方法在性能上大幅优于其他方法,并且对于困难问题更加稳健。但LLMs在结构化知识的几何推理能力仍不够强大,易受影响。
本研究提出了结构化知识的几何推理方法,使用 Knowledge Crosswords 进行实验,附加了两种新方法,结果表明 Verify-All 方法在性能上大幅优于其他方法,并且对于困难问题更加稳健。但LLMs在结构化知识的几何推理能力仍不够强大或完美。
完成下面两步后,将自动完成登录并继续当前操作。