大型语言模型存在地理偏见
原文中文,约300字,阅读约需1分钟。发表于: 。通过地理学角度研究大型语言模型的地理知识,展示其在地理空间预测中存在的问题性地理偏差,并 quantifies 目前大型语言模型的偏差程度。
我们评估了GPT-3.5,GPT-4和Llama-2在判断地理位置之间斜对角方向能力方面的表现。结果显示,GPT-4的准确率最高,为55.3%,其次是GPT-3.5的47.3%,Llama-2的44.7%。尽管这些模型在某些任务上存在准确性较低的问题,但它们大多数情况下能够正确识别最近的基准方向,表现出类似人类的错误理解。研究者还讨论了使用代表地理关系的文本数据来改进大型语言模型的空间推理能力的潜力。