本文介绍了一种新的立体事件驱动视频帧插值网络(SEVFI-Net),通过特征聚合模块解决交叉模态视差,并利用融合特征实现精确的光流和视差估计,通过流和合成方式实现更好的插值结果。作者还构建了一个由事件相机和RGB-D相机组成的立体视觉采集系统,并收集了一个新的立体事件强度数据集(SEID)。实验证明SEVFI-Net在公共真实世界立体数据集和作者的SEID数据集上优于现有方法。
该文介绍了一种名为 DINO-Mix 的新型 VPR 架构,利用 DINOv2 模型修剪和微调图像以提取鲁棒的特征,并通过 MLP-Mixer 特征聚合模块实现全局鲁棒和可泛化的特征描述,从而实现高精度的 VPR。
完成下面两步后,将自动完成登录并继续当前操作。