本研究提出了一种名为SimBase的时间视频定位基线模型。该模型通过轻量级的一维时间卷积层和元素乘积实现跨模态交互,在两个大规模数据集上取得了先进的结果,展示了其创新潜力和效率提升。
完成下面两步后,将自动完成登录并继续当前操作。