本研究提出了一种基于位置感知的视觉问题生成方法(LocaVQG),利用图像和GPS数据生成引人入胜的问题。通过GPT-4生成多样化问题,并开发轻量级模型以适应边缘设备。研究结果表明,该方法在人工和自动评估中均优于基线,验证了数据集生成技术的有效性。
完成下面两步后,将自动完成登录并继续当前操作。