MIT News - Artificial intelligence ·

在视频中寻找特定动作？这种基于人工智能的方法可以为您找到它

💡 原文英文，约1700词，阅读约需6分钟。

📝

内容提要

麻省理工学院的研究人员开发了一种新技术，利用未标记的视频和自动生成的文本训练机器学习模型，以识别长视频中的特定动作。这种方法通过关注空间和时间信息，提高了多活动视频中动作识别的准确性，具有在线学习和医疗应用的潜力。研究人员还创建了新的基准数据集，以评估模型在未剪辑视频中的表现。

🎯

❓

他们开发了一种利用未标记视频和自动生成文本训练机器学习模型的方法，以识别长视频中的特定动作。

该技术通过同时关注空间信息和时间信息，提高了多活动视频中动作识别的准确性。

研究人员创建了一个新的基准数据集，以评估模型在未剪辑视频中的表现，采用新的注释技术来识别多步骤动作。

这种技术可以快速找到诊断程序视频中的关键时刻，从而在医疗应用中发挥潜力。

他们在框架中加入了一个额外的组件，以减轻叙述与视频之间的错位问题。

新方法不依赖于大量人工标注的数据，能够更有效地识别多步骤动作，且在长视频中表现更佳。

🏷️