小红花·文摘

本研究提出了一种网格叠加方法，通过在输入图像上添加9x9黑色网格，增强多模态模型的空间理解能力。实验结果表明，该方法显著提高了空间定位的准确性，适用于机器人操作、医学成像和自主导航等领域。