小红花·文摘

本研究提出Corr2Distrib，首个基于对应关系的方法，能够从RGB图像中估计6D相机姿态分布，有效解决视觉模糊引发的多种姿态问题，超越现有技术。

Corr2Distrib: Transforming Blurry Correspondences into Reliable 6D Pose Distribution Predictions

BriefGPT - AI 论文速递 ·

该文章介绍了实体说明任务，结合视觉说明模型和导航能力，减少次优视角的视觉模糊。作者构建了包含10K个混乱物体的3D场景和注释段落的ET-Cap数据集，并提出了级联实体说明模型（CaBOT）。实验证明CaBOT优于其他基线模型。

具有融入字幕的可自解释性可行动性学习

BriefGPT - AI 论文速递 ·

该文介绍了一项名为“实体说明”的新任务，旨在将视觉说明模型与导航能力相结合，以主动探索场景并减少来自次优视角的视觉模糊。作者构建了一个包含10K个混乱物体的3D场景和每个场景三个注释段落的ET-Cap数据集，并提出了一个级联实体说明模型（CaBOT），用于处理这个任务。实验证明，该模型优于其他精心设计的基线模型。数据集、代码和模型可在链接中获得。

以场景为驱动的多模态知识图构建用于具象人工智能

BriefGPT - AI 论文速递 ·