本研究提出了CL3DOR模型,以解决现有数据集中视觉和文本信息不足的问题。通过增加点云密度和构建困难负样本,提升了多模态理解的精准性。实验结果表明,CL3DOR在3D场景理解和推理方面表现优异,验证了其关键组件的有效性。
完成下面两步后,将自动完成登录并继续当前操作。