本研究提出了PiSA-Engine框架,旨在解决三维多模态大语言模型(MLLMs)在数据数量和质量上的不足。通过生成具有三维空间语义的数据集,结合2D和3D模型的优势,实现高质量数据的持续生成。实验结果表明,PointLLM-PiSA在零-shot三维物体描述和生成分类中显著提升了性能。
完成下面两步后,将自动完成登录并继续当前操作。