BriefGPT - AI 论文速递 ·

O-TALC: 应对在线动作分割中过度细分的步骤

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

本文介绍了多种基于弱监督和深度学习的时序动作定位方法，如AutoLoc、SVTAS-RL和OTAS。这些方法通过新损失函数和优化策略，提高了在多个数据集上的定位精度和效率，尤其在长视频分析中表现突出。

🎯

❓

AutoLoc框架通过OIC损失函数提高了定位精度，在THUMOS'14和ActivityNet数据集上分别达到21.2%和27.3%的平均精度。

SVTAS-RL模型通过强化学习解决优化目标不一致的问题，特别适用于长视频分割任务，在EGTEA数据集上表现出更大的优势。

OTAS框架通过自监督特征提取和边界选择模块实现时域行为分割，F1分数平均提高41%，并具备实时推理能力。

OpenTAL框架利用不确定性动作分类和时间位置回归解决开放场景下的未知动作问题，实验结果证明其有效性。

无监督活动分割方法使用视频帧聚类和时间最优传输，在线处理小批量数据，性能优于以往方法，且不需要存储整个数据集的特征。

IntraC和InterC正则化项使得时间行为定位框架能够适应潜在时间约束，实验结果优于基线方法。

🏷️