本研究提出了一种新颖的非接触声音恢复方法,利用事件流中的时空信息,结合事件稀疏性和长期时间建模,解决了现有方法的不足。实验结果表明,该方法在合成和真实数据上均表现良好,具有显著的应用潜力。
本研究提出了一种STTS-EAD方法,通过将异常检测与多变量时间序列预测训练过程无缝集成,克服了现有方法的局限性。该方法优化了时空信息,提高了预测准确性,实验证明其在推理阶段的性能显著优于基线方法。
本研究提出了一种基于传统相机的驾驶状态识别方法,针对光照变化的挑战,通过生成事件帧,结合脉冲神经网络和注意力驱动状态网络,显著提升了识别的准确性和鲁棒性。
本文提出了一种通过互联网视频生成高质量训练数据的方法,并构建了YouTube3D数据集,推动了深度估计网络的发展。研究介绍了多种深度估计技术,包括基于时空信息的框架和条件图像扩散模型,旨在提高视频深度估计的准确性和一致性。最终,DepthCrafter方法在开放世界视频中实现了时间一致性和复杂细节的深度序列生成,展现出良好的泛化能力。
本文提出了多种新型交通预测框架,包括 MoSSl、FusionTransNet 和 STFGNN,利用自监督学习和图神经网络,结合时空信息和多模态数据,提升了车辆轨迹和交通流量预测的准确性,并验证了其在实际交通系统中的有效性。
本文介绍了在线视频实例分割(VIS)的新方法,包括TCOVIS、CTVIS和CrossVIS模型,旨在解决遮挡和实例关联问题。这些模型通过利用时空信息和外观特征,显著提高了分割的准确性和稳定性。此外,研究生成了一个大规模遮挡数据集,揭示了现有系统在处理遮挡对象方面的不足。
近年来,视频行为质量评估(AQA)受到关注。为了解决现有方法忽视行为阶段特征的问题,提出了多阶段对比回归(MCoRe)框架,能够有效提取时空信息并降低计算成本。MCoRe在多个AQA数据集上表现优异,展示了先进的性能。此外,研究还探讨了知识转移和多任务学习对AQA的提升效果。
通过动态功能连接图的时空信息,提出了一种生成式自监督学习方法,该方法在下游任务的微调中能够学习到有价值的表示,并构建出准确且稳健的模型。
完成下面两步后,将自动完成登录并继续当前操作。