小红花·文摘

本研究提出了一种新的隐式位置-字幕对齐方法，解决了弱监督密集视频字幕生成中缺乏事件边界注释的问题。该方法通过补充掩蔽简化了事件提议和定位过程，实验结果表明其在公共数据集上优于现有弱监督方法，并与全监督方法竞争。

BriefGPT - AI 论文速递 ·

通过生成学习重新构建声音事件检测问题，模型学习逆转噪声处理，能从噪声查询中生成准确的事件边界。实验证明，在Urban-SED和EPIC-Sounds数据集上，模型训练速度更快且优于现有替代方法。

BriefGPT - AI 论文速递 ·