小红花·文摘

本研究提出了ProtoFormer框架，结合原型学习和Transformer，适用于多种动作任务。交叉注意力原型化发现动作模式，提供对动作场景的理解。潜在同步缓解动作不确定性。实验证明该方法在多个动作任务上有竞争力。适用于物体跟踪和视频稳定等应用任务。