字节跳动的Depth Anything 3(DA3)模型通过单一Transformer实现深度和姿态估计,简化了三维视觉任务的处理,并刷新了多项基准测试记录。
Matrix3D是一种统一模型,能够同时进行姿态估计、深度预测和新视图合成。它通过多模态扩散变换器整合图像、相机参数和深度图,采用掩码学习策略进行大规模多模态训练,显著提升训练数据的可用性。Matrix3D在姿态估计和新视图合成方面表现优异,并通过多轮交互提供精细控制,是3D内容创作的创新工具。
本研究提出了一种新型神经网络方法,成功解决零售机器人中简单形状产品的姿态估计问题,成功率达到77.3%,显著优于传统模型。
本研究提出了一种基于姿态估计的跌倒检测系统,旨在提高辅助生活机构中老年居民的安全性。该系统无需额外传感器,能够在标准CPU上实时区分跌倒与非跌倒活动,显著降低误报率并保持高准确性。
本研究提出了一种高效流程,通过神经辐射场自动生成多样化、高质量的3D数据集,显著提升了3D姿态估计网络的性能,解决了3D检测中数据集不足的问题。
本研究提出了PoseLess框架,解决机器人手部控制中的姿态估计问题。该方法通过生成合成训练数据,实现从图像直接映射到关节角度,支持零-shot泛化和跨形态迁移,无需人工标注数据。实验结果表明PoseLess在关节角度预测上表现优异。
本研究提出了EgoSim,一种新型身体佩戴相机模拟器,能够生成佩戴者身体各部位的自我中心渲染图像。EgoSim利用真实运动捕捉数据,显著提升了运动跟踪、身体姿态估计和动作识别的表现,尤其在下半身动作识别方面具有重要意义。
本研究提出了一种基于AMIS算法的快速可扩展姿态估计器,旨在解决工业应用中实时反馈的速度与准确性问题。该模型在四个基准数据集上表现优异,实现了推理时间与准确度的优化平衡。
本研究提出了MET-POSE框架,通过变形测试解决姿态估计系统测试中的高成本和低数据再利用性问题。该框架无需手动标注,能够有效评估系统在不同环境下的表现,揭示缺陷,并可根据需求调整测试规则。
本研究提出了一种新型多模态姿态估计模型,有效解决了XR设备中的全身动作跟踪问题,显著提高了准确性和应用范围。
RoboPEPP是一种新方法,旨在提高机器人在未知关节角度下的姿态估计性能。该方法通过掩码自监督嵌入预测架构,将机器人的物理模型信息融入编码器,从而增强对机器人物理结构的理解。研究表明,RoboPEPP在姿态和关节角度估计中表现最佳,且对遮挡的敏感性最低。
本研究提出了一种自监督框架,旨在解决复杂胃肠道条件下内窥镜的深度与姿态估计问题。实验结果表明,该方法在准确性和真实感方面显著优于现有技术,具有重要的临床应用潜力。
本研究提出了一种新的中间骨架表示,解决了姿态估计模型对大量人工标注数据的依赖,显著减少了预测翻转现象,实验结果表明其精度优于传统模型,具有重要的应用潜力。
本研究提出了一种新算法,解决了多视角多人姿态估计的挑战,利用深度信息提升性能,实现了具有良好泛化能力的全身姿态估计,旨在促进相关领域的发展。
本文介绍了一种新型物体定位方法,结合概率和神经网络技术,显著提高了目标检测和姿态估计的性能。实验表明,该方法在复杂动态环境中表现优异,并可与现有系统集成,提升定位准确性。
本研究提出多种新算法和方法,解决3D物体检测、姿态估计和图像对称性检测问题,提升了检测效率和准确性,适用于工业场景和复杂环境。
本研究探讨了多任务学习在航天器姿态估计中的应用,发现直接姿态估计与热图估计相互促进,而边界框和分割任务对精度贡献有限。这为提升航天器姿态估计提供了新视角。
本文介绍了一个用于6自由度姿态估计的新数据集,包含玩具物品的3D模型和RGBD图像,旨在提升机器人抓取和操控能力。同时,研究提出了新的姿态评估指标ADD-H,并探讨了基于视觉的机器人操作学习和透明物体深度感知的解决方案。
本文介绍了一种基于物理模型的3D人体运动推断方法,结合2D和3D姿态估计,通过物理轨迹优化提高动作的真实性和准确性。研究表明,该方法在多种场景下表现优越,尤其在姿势估计和运动捕捉方面显著改善了运动质量和物理可信度。
本文介绍了一种新型卷积神经网络架构SPNv3,专用于非合作航天器的姿态估计。通过合成图像训练和数据增强,该模型在真实图像上展现出良好的鲁棒性和计算效率,具有广泛的应用潜力。研究强调了深度学习在航天器感知中的重要性,包括姿态估计和三维重建等任务。
完成下面两步后,将自动完成登录并继续当前操作。