本文研究了多形式句子的时空视频定位问题,提出了包括时空图推理网络和CG-STVG在内的多种方法,利用时空区域图和上下文信息提高定位准确性。实验结果表明,这些方法在多个基准测试中表现优异,推动了视频定位技术的发展。
完成下面两步后,将自动完成登录并继续当前操作。