切割与检测:使用大型基础视频理解模型对切割未修剪视频进行人类跌倒检测
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究使用大型视频理解模型探讨了未修剪视频中人类跌倒检测的性能,并利用预训练的视觉变换器进行多类别动作检测。实验结果显示,在给定的实验设置下,跌倒事件的检测能力达到了0.96的F1分数。
🎯
关键要点
-
本研究探讨了未修剪视频中人类跌倒检测的性能。
-
使用预训练的视觉变换器进行多类别动作检测,包括 '跌倒'、'躺下' 和 '其他 / 日常活动'。
-
介绍了一种基于未修剪视频简单截取的时间动作定位方法。
-
引入了简单而有效的剪辑采样策略。
-
实验结果显示在给定的实验设置下,跌倒事件的检测能力达到了0.96的F1分数。
-
源代码将在GitHub上提供。
➡️