CoLeaF: 一个对比 - 协同学习框架,用于弱监督音频 - 视觉视频解析
发表于: 。通过使用 CoLeaF,一种新的学习框架,提高了弱监督音频 - 视觉视频解析的性能,通过在嵌入空间中优化跨模态上下文的集成,对于可听 - 可见事件,网络能够明确学习将跨模态信息结合起来,而对于不一致的事件进行过滤。
通过使用 CoLeaF,一种新的学习框架,提高了弱监督音频 - 视觉视频解析的性能,通过在嵌入空间中优化跨模态上下文的集成,对于可听 - 可见事件,网络能够明确学习将跨模态信息结合起来,而对于不一致的事件进行过滤。