本文提出了一种基于语言解析器和视觉语言模型的方法,用于处理复杂空间概念和长指令,通过优化算法重新布置室内家具,提升人机交互空间。研究表明,该方法在准确性和可转移性方面表现优异,能够有效预测物体在场景中的位置。
完成下面两步后,将自动完成登录并继续当前操作。