本文提出了一种自监督学习方案,以提高无人机在无GPS环境中的自我运动估计能力。通过改进遮挡处理方法,显著提升了无人机在高速飞行和接近障碍物时的视觉识别准确性,增强了实际应用表现。
本研究提出MASSeg模型,解决复杂视频物体分割中的小物体识别、遮挡处理和动态场景建模问题,利用MOSE+数据集和数据增强策略显著提升模型性能。
视频目标分割(VOS)旨在自动分割视频中的目标,广泛应用于多个领域。现有方法在复杂场景中面临挑战。本文提出逐帧和逐段时空交互记忆网络(FSSTIM),通过整合多粒度时空信息,提升分割准确性和效率,尤其在处理遮挡和相似目标时表现优异。实验结果表明,FSSTIM在多个数据集上超越现有方法,具有重要应用价值。
本文介绍了一种实时多人姿态估计系统,能够处理遮挡、适应全景相机和雷达传感器。系统使用轻量级算法,在室内外环境中表现准确。时间复杂度恒定,可在商用GPU笔记本上达到7-8帧每秒的帧率。
完成下面两步后,将自动完成登录并继续当前操作。