BriefGPT - AI 论文速递 ·

长尾时间动作分割与组内时间逻辑调整

💡 原文中文，约1300字，阅读约需4分钟。

📝

内容提要

本文介绍了一种基于结构化分割网络的框架，通过时间金字塔模型和判别模型实现动作实例的时间结构建模，提升了行为检测和时间分割的性能。研究涵盖弱监督、非监督学习及半监督方法，提出多种新技术以提高动作分割的准确性和效率，实验结果显示在多个数据集上均优于现有方法。

🎯

❓

基于结构化分割网络的框架通过时间金字塔模型建模动作实例的时间结构，并利用判别模型区分正面提议和背景或不完整的提议。

研究通过引入时间戳监督、置信损失和本地-全局注意力机制等新技术，提高了动作分割的准确性和效率。

实验结果显示该框架在THUMOS14和ActivityNet数据集上表现突出，优于现有方法。

弱监督学习通过利用被动数据采集到的行为集合训练模型，实现自动的视频行为分割和标注。

本地-全局注意力机制解决了行动分割中的过度分割问题，提升了分割精度。

BIT框架通过学习明确的行动标记进行时间建模，提高了基于transformer的方法的准确性和计算效率，同时保持较低的计算成本。

🏷️