TAFormer:面向航拍场景中视频和运动联合预测的统一目标感知 Transformer
💡
原文中文,约600字,阅读约需2分钟。
📝
内容提要
无人机技术的进步使得高空遥感成为主导趋势。研究提出了目标感知航拍视频预测任务,设计了名为TAFormer的模型,通过时空关注和信息共享机制来预测未来场景和目标运动状态。实验证明TAFormer在目标感知视频预测方面表现出卓越性能。
🎯
关键要点
- 无人机技术的进步使高空遥感成为主导趋势。
- 提出了目标感知航拍视频预测任务,旨在同时预测未来场景和目标运动状态。
- 现有视频预测方法仅关注未来场景,忽视目标运动状态的建模。
- 设计了名为TAFormer的模型,提供统一的建模方法。
- 引入时空关注机制(STA)和信息共享机制(ISM)以有效建模视频和目标运动。
- 采用目标敏感高斯损失(TSGL)增强模型对目标位置和内容的敏感性。
- 在UAV123VP和VisDroneVP数据集上验证了TAFormer的卓越性能。
🏷️
标签
➡️