小红花·文摘

本文介绍了一种视频相似性学习架构ViSiL，通过卷积神经网络计算视频间相似度，避免了在帧之间的相似度计算之前进行特征聚合。使用三元组损失方案训练提出的网络，在五个公共基准数据集上评估，结果表明ViSiL比现有技术取得了显着进步。