本文介绍了一种视频相似性学习架构ViSiL,通过卷积神经网络计算视频间相似度,避免了在帧之间的相似度计算之前进行特征聚合。使用三元组损失方案训练提出的网络,在五个公共基准数据集上评估,结果表明ViSiL比现有技术取得了显着进步。
完成下面两步后,将自动完成登录并继续当前操作。