基于因果动作 - 效应建模的视频领域隐式便利性获取
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了创建超过10K数据集的方法,通过提取七个sitcom中人物与场景中不同物体的互动场景,预测新场景下的affordances。研究结果显示,数据规模对于学习具有普适性和鲁棒性的affordances模型至关重要。
🎯
关键要点
- 本文介绍了创建超过10K数据集的方法。
- 数据集通过提取七个sitcom中人物与场景中不同物体的互动场景而成。
- 提出了一个两步走的方法用于预测新场景下的affordances。
- 使用了一个变分自编码器来提取affordances的尺度和变形。
- 研究结果显示,数据规模对于学习具有普适性和鲁棒性的affordances模型至关重要。
➡️