基于文本的从第一人称视角的作用感知学习
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本论文介绍了名为3D AffordanceNet的数据集,包含23个语义对象类别的23k个形状,注释了18个视觉可用性类别,并提供了三个评估视觉可用性理解的基准测试任务。作者评估了三种最先进的点云深度学习网络,并研究了半监督学习设置下利用未标记数据的可能性。结果表明,视觉可用性理解是一个有价值但具有挑战性的基准测试。
🎯
关键要点
- 介绍了名为3D AffordanceNet的数据集
- 数据集包含23个语义对象类别的23k个形状
- 注释了18个视觉可用性类别
- 提供了三个评估视觉可用性理解的基准测试任务
- 评估了三种最先进的点云深度学习网络
- 研究了半监督学习设置下利用未标记数据的可能性
- 结果表明视觉可用性理解是一个有价值但具有挑战性的基准测试
🏷️
标签
➡️