该研究提出了一种新的统一时空图数据结构UniEdge,旨在改善行人轨迹预测中的时空交互建模不足问题。UniEdge通过简化高阶跨时间交互为一阶关系,有效捕捉时空依赖,实验结果显示其在多个数据集上显著提升了预测准确性。
视频目标分割(VOS)旨在自动分割视频中的目标,广泛应用于多个领域。现有方法在复杂场景中面临挑战。本文提出逐帧和逐段时空交互记忆网络(FSSTIM),通过整合多粒度时空信息,提升分割准确性和效率,尤其在处理遮挡和相似目标时表现优异。实验结果表明,FSSTIM在多个数据集上超越现有方法,具有重要应用价值。
完成下面两步后,将自动完成登录并继续当前操作。