基于频谱分解的域泛化语义分割学习

📝

内容提要

提出了一种基于 Spectral-dEcomposed Token (SET) 学习框架的方法,通过将 Vision Foundation Model (VFM) 特征在频域分解为幅度和相位组件,并使用可学习的 token 进行任务特定信息提取,进一步优化了样式无关特征的学习,在推理过程中通过注意力优化方法解决了样式变化对特征增强的影响,通过大量跨域实验证明其具有最先进的性能。

➡️

继续阅读