非语言社交互动中信念预测的明确理论心智建模
原文中文,约400字,阅读约需1分钟。发表于: 。我们提出了 MToMnet - 一种针对多模态输入的预测人类社交互动中信念及其动态的心智理论(ToM)神经网络。通过编码上下文线索(场景视频和物体位置)并将其与个体特定线索(人类凝视和身体语言)在每个人的独立 MindNet 中进行整合,MToMnet...
研究者提出了一种针对多模态输入的神经网络MToMnet,用于预测人类社交互动中的信念及其动态。MToMnet通过整合上下文线索和个体特定线索,提供了三种变体,并在现实世界数据集上进行了评估。结果显示,MToMnet在参数较少的情况下,显著超越了现有方法,为未来的人工智能系统预测人类信念和更有效地与人类合作提供了前景。