本文提出了一种多粒度时间聚合框架,利用最大池化和注意力技术实现了下一步行动和密集预测,并在多个数据集上取得了最新的实验结果。
本文介绍了一种灵活的多粒度时间聚合框架,利用最大池化和注意力等简单技术实现了最新的下一步行动和密集预测。在 Breakfast、50Salads和EPIC-Kitchens数据集上进行了实验,并与视频分割和动作识别兼容。
完成下面两步后,将自动完成登录并继续当前操作。