大规模视频驱动电子商务中的神经图匹配
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该论文提出了一种新的半监督深度学习算法,用于基于视觉内容检索相似的2D和3D视频。该算法采用深度卷积和递归神经网络与动态时间扭曲作为相似性度量,能够处理大规模视频数据集,并根据图形帧和内容检索与给定查询视频片段最相关的视频。该方法在多个公共数据集上进行了测试,表现良好,优于基准深度学习模型。
🎯
关键要点
- 提出了一种新颖的半监督深度学习算法,用于基于视觉内容检索相似的2D和3D视频。
- 算法采用深度卷积和递归神经网络与动态时间扭曲作为相似性度量。
- 能够处理大规模视频数据集,检索与给定查询视频片段最相关的视频。
- 在多个公共数据集上进行了测试,包括CC_WEB_VIDEO、Youtube-8m、S3DIS和Synthia。
- 该算法在视频检索任务中表现良好,优于基准深度学习模型。
➡️