鹰:通过大型语言模型赋能的视觉指导调优提升几何推理
原文中文,约400字,阅读约需1分钟。发表于: 。该研究针对现有多模态大型语言模型在几何问题解决中的视觉感知不足进行探讨,发现其存在显著的几何感知不准确和幻觉问题。提出EAGLE框架,通过两阶段的视觉增强提升几何推理能力,在多个基准测试中表现优异,超越了现有先进模型,展示了其在几何推理领域的潜在影响。
最近的大型语言模型和多模态模型在解决几何数学问题方面的能力尚未得到深入评估。GeoEval基准测试有助于研究模型性能。WizardMath模型在主子集上表现出色,但在困难子集上准确率较低。研究结果显示,GPT系列模型在重新表述问题上更有效,为增强模型能力提供了方法。