基于显著性引导的DETR用于时刻检索和亮点检测
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
现有视频检索和亮点检测方法存在对齐问题,影响性能。本文提出结合显著性引导的交叉注意力机制与混合DETR架构的新方法,提升性能。使用InterVid-MR数据集预训练,在多个基准上取得先进结果,提供高效可扩展的解决方案。
🎯
关键要点
- 现有视频时刻检索和亮点检测方法存在对齐问题,影响性能。
- 提出结合显著性引导的交叉注意力机制与混合DETR架构的新方法。
- 新方法显著提升了时刻检索和亮点检测的性能。
- 开发了InterVid-MR数据集用于预训练。
- 在多个基准上取得了最先进的结果,提供高效可扩展的解决方案。
🏷️
标签
➡️