无限数据中的因果关系:基准模型和新数据集
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
研究人员发布了两个高质量的数据集,结合深度学习和因果发现,提出了一个概率模型作为基线,解决了多结构数据和多值表示的挑战,并评估了基线结果。
🎯
关键要点
-
研究人员结合深度学习和因果发现,发现对话和视频中的因果结构学习面临挑战。
-
定义为“不确定数据”的数据形式具有多结构数据和多值表示特征。
-
发布了两个高质量的数据集,Causalogue 和 Causaction,分别包含因果注释的文本对话样本和视频动作样本。
-
由于多结构数据和多值表示的存在,当前方法的假设被打破,使其在不确定数据上不可行。
-
提出了一个概率模型作为基线,包含三个亮点:1)利用非固定因果结构下噪声项独立性建立因果条件,2)将因果强度视为潜变量并测量重建损失,3)估计潜在混淆因子的影响。
-
这些亮点使概率模型能够克服多结构数据和多值表示的挑战,并为潜在混淆因子的扩展铺平道路。
-
全面实验评估了因果结构、因果表示和混淆解缠结的基线结果。
➡️