MECD：解锁视频推理中的多事件因果发现

本研究解决了当前视频因果推理仅限于简单单事件分析的问题，提出了多事件因果发现（MECD）任务，旨在揭示长视频中事件之间的因果关系。研究采用新颖的基于Granger因果性的框架，通过事件预测模型进行因果测试，并整合因果推理技术，验证了在多事件视频中提供因果关系的有效性，超越现有模型5.7%和4.1%。

深度学习在处理不确定数据如对话和视频时，因果发现面临挑战。为解决数据集不足，推出了Causalogue和Causaction数据集，分别包含因果注释的文本和视频样本。提出的概率模型通过三个方法解决问题：1）在非固定因果结构下建立因果条件，2）将因果强度视为潜变量，3）估计潜在混淆因子的影响。实验评估了因果结构和表示的效果。

因果发现数据集概率模型深度学习混淆因子