本文提出了一种基于Transformer的点追踪框架TAPTR,能够高效实时跟踪视频中的任意查询点,并解决了累积误差问题,显著提升了TAP-Vid基准测试中的性能。此外,研究探讨了密集跟踪在机器人学习中的应用,展示了其在复杂任务中的有效性。
完成下面两步后,将自动完成登录并继续当前操作。