在广义少样本语义分割中应用ViT

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本研究提出了一种在少样本情况下改进普适少样本分割任务的方法,通过学习视觉提示对多尺度Transformer解码器进行提示,实现准确的密集预测。引入单向因果关注机制提升新提示质量,无需测试时间优化或传导即可在基准数据集上实现最先进性能。

🎯

关键要点

  • 本研究提出了一种在少样本情况下改进普适少样本分割任务的方法。

  • 通过学习视觉提示对多尺度Transformer解码器进行提示,实现准确的密集预测。

  • 引入单向因果关注机制提升新提示质量,连接少样本学习到的新提示和大量数据学习到的基础提示。

  • 在COCO-$20^i$和Pascal-$5^i$两个基准数据集上实现了GFSS的最先进性能。

  • 无需进行测试时间的优化或传导,且使用未标记的测试数据进行传导提示调优。

➡️

继续阅读