小红花·文摘

本研究提出了CL3DOR模型，以解决现有数据集中视觉和文本信息不足的问题。通过增加点云密度和构建困难负样本，提升了多模态理解的精准性。实验结果表明，CL3DOR在3D场景理解和推理方面表现优异，验证了其关键组件的有效性。