小红花·文摘

该论文提出了一种基于回归模型的方法，通过提取文本查询中的语义短语，反映查询与视频视觉特征的双模态交互，显著提高了时态动作定位的预测效果。研究表明，该方法在多个数据集上优于现有技术，并提出了新的边界回归范式和视觉-语言预训练模型，验证了其有效性。

BriefGPT - AI 论文速递 ·

该论文提出了一种基于回归模型的方法，使用语义短语提取中间特征，以反映查询中描述的重要语义实体和视频的视觉特征之间的交互，通过利用上下文信息，有效地预测目标时间区间。实验证明，该方法在两个数据集上的表现明显优于现有方法。

BriefGPT - AI 论文速递 ·