OphNet:眼科手术工作流程理解的大规模视频基准
原文中文,约500字,阅读约需2分钟。发表于: 。通过视频进行手术场景感知对于推动机器人手术、远程手术和 AI 辅助手术至关重要,特别是在眼科领域。然而,缺乏多样化且注释丰富的视频数据集妨碍了智能系统在手术工作流分析方面的发展。为了填补这一空白,我们引入了 OphNet,一个大规模的,由专家注释的眼科手术工作流理解视频基准。OphNet 具有包含 2,278 个手术视频的多样化收藏,涵盖了 66 种白内障、青光眼和角膜手术,对 102...
OphNet是一个大规模的眼科手术视频数据集,包含2,278个手术视频,涵盖了66种手术类型和102个手术阶段。该数据集提供了详细的注释和顺序信息,有助于手术工作流分析和时间定位任务。数据集已在GitHub上开放获取。