长尾时间动作分割与组内时间逻辑调整
原文中文,约200字,阅读约需1分钟。发表于: 。本研究针对程序活动视频中长尾动作分布的问题,提出了一种新颖的组内时间逻辑调整(G-TLA)框架,以解决现有时间动作分割方法未能有效识别长尾动作的局限。通过结合组内软max公式,利用活动信息和动作顺序进行逻辑调整,显著提升了对尾部动作的分割能力,同时不影响头部动作的表现。
本文提出了一种半监督学习方法,用于在工程视频中发现行动并将其分段。该方法在少量有标签数据和大量无标签数据的情况下进行任务,并引入了两个新的损失函数和自适应边界平滑方法。通过三个基准测试的评估,结果表明该方法显著提高了行为分割性能,并在使用少量标记数据(5%和10%)的情况下取得了与全监督相当的结果。