本研究提出了SpikeVideoFormer,一种高效的脉冲驱动视频变换器,采用汉明注意力和线性时间复杂度。该模型在视频分类、人类姿态跟踪和语义分割等任务中表现优越,显著提升了脉冲神经网络的能效和性能。
Meta的NeuralFeels技术使机械手能够自学操作未知物体,精度提升94%。该技术结合触觉与视觉,克服了传统训练对视觉的依赖,显著提高了物体重建和姿态跟踪的准确性,尤其在复杂环境中表现突出。
本研究提出了一种自监督学习方法,通过未标记的视频学习视觉对应关系,并利用循环一致性识别动态对象。实验结果表明,该方法在视频对象传播和姿态跟踪任务上优于全监督算法,并结合语义模型提升了视觉关系检测性能。
本文介绍了一种紧凑的3D高斯喷洒表示方法,优化了场景重建和渲染效率,显著降低了内存消耗。通过自适应扩张策略和高效的姿态跟踪,提升了SLAM系统的准确性和实时性。研究表明,该方法在多个数据集上表现优异,具有广泛的应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。