晓飞的算法工程笔记 ·

TSP-Detection：CMU 提出抛弃交叉注意力的 DETR 变体 | ICCV 2021 - 晓飞的算法工程笔记

💡 原文中文，约9500字，阅读约需23分钟。

📝

内容提要

这篇文章介绍了基于Transformer的目标检测方法DETR，提出了两种改进方法：TSP-FCOS和TSP-RCNN，以解决DETR训练时间收敛缓慢的问题。这两种方法在收敛速度和检测精度方面优于原始DETR和其他基线模型。文章还讨论了DETR的优化困难原因，并提出了删除交叉注意力模块和设计新的二分匹配方案来加速训练和提高检测性能。

🎯

关键要点

DETR 是基于 Transformer 的目标检测方法，但训练时间收敛缓慢。
论文提出 TSP-FCOS 和 TSP-RCNN 两种改进方法，显著提高收敛速度和检测精度。
DETR 收敛缓慢的原因主要是匈牙利损失和交叉注意力模块。
删除交叉注意力模块后，DETR 对小物体的检测性能显著提升。
TSP-FCOS 引入了感兴趣特征选择机制，帮助处理多级特征。
TSP-RCNN 结合了两阶段检测器的优点，进一步提高检测精度。
论文设计了新的二分匹配方案，以加速训练中的收敛。
实验结果表明，TSP-FCOS 和 TSP-RCNN 在 COCO 2017 数据集上表现优于原始 DETR 和其他基线模型。
TSP-FCOS 和 TSP-RCNN 的收敛速度明显快于原始 DETR。
模型分析显示，集合预测损失和位置编码对 TSP 机制至关重要。

🏷️

继续阅读

开始尝试使用obsidian作为笔记软件
本文讨论了Obsidian作为笔记软件的使用体验。Obsidian基于Markdown格式，支持内部链接，便于构建知识体系。作者强调，主动整理记忆比工具本...
CLI与MCP之争终局：智能体工具层架构从对抗走向三层融合的工程范式
CLI与MCP的争论已结束，分层架构成为标准。开发者意识到，选择不再是单一工具，而是如何组合使用。CLI在本地执行效率高，MCP适合远程服务和权限控制。新...
.git | 基于工作流的 Git 学习笔记
《Git》是由Linus Torvalds开发的去中心化版本控制软件，支持单人和多人协作。用户通过命令如git add、git commit等管理版本，使...
就靠一张新地图，《原神》是怎么让我这个淡坑玩家回归的？
对于《原神》，最近上线的新版本“月之六”其实颇为特殊，因为按照它过往的更新规律，每年的4到6月份刚好卡在了一个尴尬的节点——前一个大版本的主线剧情高潮结束...
两个波兰人，用“风水”做了一款解谜游戏
“顺应自然”。来自波兰的二人游戏工作室Armed Chicken，有着两位非常“随意”的创始人。创始人Szymon Windak告诉我，进入游戏行业前，他...
这家俄罗斯科技巨头，正在助力中国开发者开拓俄语区市场
2026年4月16日，第三届Yandex Ads中国大会在深圳拉开帷幕，数百位来自游戏、应用出海企业及生态伙伴的参会者齐聚现场。对于普通玩家来说，Yand...

TSP-Detection：CMU 提出抛弃交叉注意力的 DETR 变体 | ICCV 2021 - 晓飞的算法工程笔记

内容提要

关键要点

标签

继续阅读