COM Kitchens:一个未经编辑的俯视视频数据集作为一个视觉 - 语言基准测试
💡
原文中文,约1500字,阅读约需4分钟。
📝
内容提要
EPIC-KITCHENS数据库是一个大规模数据集,包含32名参与者的55小时第一人称视角视频,涵盖39.6K个动作段和454.3K个物体边界框,记录了厨房中的日常行为,具有多样性和真实意图的注释,推动了视频领域的研究与评估。
🎯
关键要点
- EPIC-KITCHENS数据库是一个大规模的第一人称视角视频数据库,包含32名参与者的55小时视频。
- 数据库记录了39.6K个动作段和454.3K个物体边界框,注释与真实意图紧密相关。
- 该数据库可用于第一人称视角视频领域的挑战评估和研究,推动了相关领域的发展。
- 视频内容涵盖厨房中的日常行为,具有多样性和真实意图的注释。
❓
延伸问答
EPIC-KITCHENS数据库包含哪些类型的数据?
EPIC-KITCHENS数据库包含来自32名参与者的55小时第一人称视角视频,记录了39.6K个动作段和454.3K个物体边界框。
EPIC-KITCHENS数据库的主要用途是什么?
该数据库可用于第一人称视角视频领域的挑战评估和研究,推动相关领域的发展。
EPIC-KITCHENS数据库的注释特点是什么?
数据库的注释与真实意图紧密相关,具有多样性和真实意图的注释。
EPIC-KITCHENS数据库如何推动视频领域的研究?
通过提供大规模和多样化的厨房日常行为记录,EPIC-KITCHENS数据库为视频领域的研究与评估提供了丰富的数据基础。
EPIC-KITCHENS数据库的参与者来自哪里?
参与者来自不同国籍,确保了数据的多样性。
EPIC-KITCHENS数据库的规模有多大?
数据库包含55小时的视频和超过39.6K个动作段,454.3K个物体边界框,规模非常庞大。
➡️