本研究通过多模态融合和一致性建模改进了视频主题分割方法,采用不同架构增强多模态融合,通过对比学习加强多模态对齐和融合。实验证明,该模型在视频主题分割性能上表现出色。
完成下面两步后,将自动完成登录并继续当前操作。