本研究提出了ProtoFormer框架,结合原型学习和Transformer,适用于多种动作任务。交叉注意力原型化发现动作模式,提供对动作场景的理解。潜在同步缓解动作不确定性。实验证明该方法在多个动作任务上有竞争力。适用于物体跟踪和视频稳定等应用任务。
完成下面两步后,将自动完成登录并继续当前操作。