本文介绍了一种多模态视频主题分段器,结合视频转录和跨模态注意机制,提出双对比学习框架,以提升模型对复杂视频的适应能力。实验结果表明,该方法在短视频和长视频上均优于基准,具有更好的准确度和可转移性。
完成下面两步后,将自动完成登录并继续当前操作。