本研究提出CL3DOR模型,解决现有训练数据集中视觉和文本信息颗粒度不足的问题。通过增加点云密度和构建困难负样本,提升多模态理解的准确性与清晰度。实验结果表明,CL3DOR在3D场景理解和推理方面表现优异。
本研究提出了一种基于优化的方法,通过几何和颜色线索来提高大规模场景中特征匹配的准确性和密度。使用Sampson距离实现几何一致性,改善相机位置精度和点云密度。
完成下面两步后,将自动完成登录并继续当前操作。