COM Kitchens:一个未经编辑的俯视视频数据集作为一个视觉 - 语言基准测试

💡 原文中文,约1500字,阅读约需4分钟。
📝

内容提要

EPIC-KITCHENS数据库是一个大规模数据集,包含32名参与者的55小时第一人称视角视频,涵盖39.6K个动作段和454.3K个物体边界框,记录了厨房中的日常行为,具有多样性和真实意图的注释,推动了视频领域的研究与评估。

🎯

关键要点

  • EPIC-KITCHENS数据库是一个大规模的第一人称视角视频数据库,包含32名参与者的55小时视频。
  • 数据库记录了39.6K个动作段和454.3K个物体边界框,注释与真实意图紧密相关。
  • 该数据库可用于第一人称视角视频领域的挑战评估和研究,推动了相关领域的发展。
  • 视频内容涵盖厨房中的日常行为,具有多样性和真实意图的注释。

延伸问答

EPIC-KITCHENS数据库包含哪些类型的数据?

EPIC-KITCHENS数据库包含来自32名参与者的55小时第一人称视角视频,记录了39.6K个动作段和454.3K个物体边界框。

EPIC-KITCHENS数据库的主要用途是什么?

该数据库可用于第一人称视角视频领域的挑战评估和研究,推动相关领域的发展。

EPIC-KITCHENS数据库的注释特点是什么?

数据库的注释与真实意图紧密相关,具有多样性和真实意图的注释。

EPIC-KITCHENS数据库如何推动视频领域的研究?

通过提供大规模和多样化的厨房日常行为记录,EPIC-KITCHENS数据库为视频领域的研究与评估提供了丰富的数据基础。

EPIC-KITCHENS数据库的参与者来自哪里?

参与者来自不同国籍,确保了数据的多样性。

EPIC-KITCHENS数据库的规模有多大?

数据库包含55小时的视频和超过39.6K个动作段,454.3K个物体边界框,规模非常庞大。

➡️

继续阅读