本文探讨了大型语言模型(LLMs)在空间关系表示和推理中的能力,特别是通过自然语言导航任务评估其表现。研究发现,LLMs在不同空间结构中的表现存在变异性,并能利用对象名称作为地标。尽管LLMs在空间理解上有一定能力,但仍需改进。此外,研究提出了基于LLMs的文档理解方法LayoutLLM,显示出在文档分析任务中的性能提升。
大型语言模型(LLMs)在自然语言导航任务中展现出卓越能力,特别是在表示和推理空间结构方面。LLMs的错误反映了空间和非空间因素。LLMs能够隐含地捕捉到空间结构的某些方面,但仍有改进空间。
大型语言模型(LLMs)在自然语言导航任务中展现出卓越能力,特别是在表示和推理空间结构方面。LLMs的错误反映了空间和非空间因素,表明其能够隐含地捕捉到空间结构的某些方面,但仍有改进空间。
大型语言模型(LLMs)在自然语言导航任务中表现出卓越能力,特别是在表示和推理空间结构方面。LLMs利用对象名称作为地标来维护空间地图,但其表现存在变异性和错误。LLMs能够隐含地捕捉到空间结构的某些方面,但仍有改进空间。
本文研究了大型语言模型在表示和推理空间结构方面的能力,并与人类表现进行比较。研究发现,LLMs在不同空间结构中的表现变异性较大,但与人类类似,它们利用对象名称作为地标来维护空间地图。在错误分析中,发现LLMs的错误反映了空间和非空间因素。研究表明,LLMs能够隐含地捕捉到空间结构的某些方面,但仍有改进空间。
完成下面两步后,将自动完成登录并继续当前操作。