本文介绍了一种名为3D-RES的模型,其中采用了一个创新的端到端Superpoint-Text Matching Network(3D-STMN),通过超点文本匹配机制实现了跨模态语义关系的高效利用,并引入了依赖驱动交互模块来提升模型对指代表达的语义理解。在ScanRefer基准上的实验结果表明,该模型在性能和速度方面都取得了显著提升。
完成下面两步后,将自动完成登录并继续当前操作。