MECD:解锁视频推理中的多事件因果发现
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了当前视频因果推理仅限于简单单事件分析的问题,提出了多事件因果发现(MECD)任务,旨在揭示长视频中事件之间的因果关系。研究采用新颖的基于Granger因果性的框架,通过事件预测模型进行因果测试,并整合因果推理技术,验证了在多事件视频中提供因果关系的有效性,超越现有模型5.7%和4.1%。
深度学习在处理不确定数据如对话和视频时,因果发现面临挑战。为解决数据集不足,推出了Causalogue和Causaction数据集,分别包含因果注释的文本和视频样本。提出的概率模型通过三个方法解决问题:1)在非固定因果结构下建立因果条件,2)将因果强度视为潜变量,3)估计潜在混淆因子的影响。实验评估了因果结构和表示的效果。