HierSum:用于视频摘要的全局与局部注意力机制
📝
内容提要
本研究旨在解决视频摘要中缺乏有效分段的问题,特别是在教学视频中。我们提出了一种名为HierSum的分层方法,它结合了来自字幕的细粒度局部线索和视频级别指导提供的全球上下文信息,利用“最重播”统计数据作为监督信号来识别关键片段,从而显著提高摘要效果。研究表明,HierSum在多个基准数据集上优于现有方法,具有较高的F1分数和排名相关性。
➡️