该研究提出了一种通用框架,用于处理各种类型的LiDAR,并使用稀疏焦点调制替代窗口注意力,以实现多层次上下文的提取和动态聚合。该方法在传统机械旋转LiDAR基准上表现出有竞争力的性能,并在混合固态LiDAR基准上取得了最先进的结果。在作者的混合固态LiDAR数据集上,该方法胜过了现有方法。
最近的研究显示,将预训练的视觉转换器应用到各种下游任务中的视觉提示调整(VPT)具有巨大潜力。本文提出了一种创新的VPT方法,即iVPT,通过引入跨层动态连接(CDC)和动态聚合(DA)模块,实现了任务相关信息的共享和选择性共享。iVPT还引入了关注强化(AR)机制,通过增强图像令牌与提示令牌的关系来提高性能。实验证明iVPT相对于现有方法具有优势。
完成下面两步后,将自动完成登录并继续当前操作。