具有门控机制的可变形混合变压器用于密集预测的多任务学习
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种新颖的多任务学习模型DeMTG,结合了可变形卷积神经网络和基于查询的Transformer,采用共享门控机制,具有任务特定的灵活性。与传统方法相比,DeMTG成本低、复杂度小、参数少。实验证明,DeMTG在三个密集预测数据集上使用更少的GFLOPs,优于竞争模型。
🎯
关键要点
-
提出了一种新颖的多任务学习模型DeMTG。
-
DeMTG结合了可变形卷积神经网络和基于查询的Transformer。
-
采用共享门控机制,具有任务特定的灵活性。
-
与传统方法相比,DeMTG成本低、复杂度小、参数少。
-
实验证明,DeMTG在三个密集预测数据集上使用更少的GFLOPs。
-
DeMTG显著优于基于Transformer和CNN的竞争模型。
-
代码和模型可在指定网址获取。
➡️