推动增强现实中的 6D 姿态估计 — 克服非受控图像的投影模糊
原文中文,约300字,阅读约需1分钟。发表于: 。本研究主要解决在增强现实(AR)中准确估计六自由度姿态的挑战,我们提出了一种新颖的方法,通过分解 z 轴平移和焦距的估计,利用 FocalPose 架构中内置的神经渲染和比较策略,从无控制的 RGB 图像中准确估计六自由度姿态,并显著提高了 AR 环境中三维物体叠加的准确性,实验结果表明在六自由度姿态估计准确度上有明显改进,该研究成果对制造业和机器人领域具有潜在的重要应用。
使用经济可扩展的实际到合成数据的生成以及姿态估计器等最新组件,建立了一个代表性的6D姿态估计流程,并对汽车零件进行了评估。发现训练后的6D姿态估计器性能有所改善,但不满足行业需求。揭示了原因是估计器无法提供可靠的姿态不确定性。进一步分析了基于RGB和RGB-D的方法与通过合成数据引起的领域差异的比较,并发现它们对此具有不同的脆弱性。