PerLA:感知3D语言助手

📝

内容提要

本研究解决了当前大型语言模型在理解3D物理世界时面临的局限性,尤其是在处理点云数据时可能丢失细节和上下文信息。我们提出了PerLA,一个更具感知能力的3D语言助手,通过独特算法同时捕捉局部高分辨率细节与全局上下文,从而提升了视觉表现的丰富性和信息性。PerLA在多个任务中显著优于现有的3D语言助手,实现了显著的性能提升。

➡️

继续阅读