BriefGPT - AI 论文速递 ·

冗余感知的室内场景神经渲染相机选择

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文探讨了三维室内场景中人类动作预测的建模技术，提出了多种方法以提高动作合成的自然度和多样性，包括异常值感知的相机定位算法、从单图生成新视角的方法，以及基于强化学习的虚拟人类与环境交互技术。同时，引入了新的数据集和基准，推动了室内场景分析的进展。

🎯

❓

基于异常值感知的相机定位算法通过层次化空间划分和深度学习路由函数实现更好的三维场景理解，并使用异常值拒绝模块过滤动态点，提升相机姿态精度。

通过卷积神经网络提取深层特征和估计深度图，并利用室内场景布局信息和几何约束来生成目标视角图像。

自回归Transformer用于综合长视频，通过预测多个帧之间的关系和下一帧，实现对多帧序列的建模，特别适用于室内3D场景的长期合成。

通过基于多样性因素的分层框架方法，解决目标、位置预定及动作多样性不足的问题，从而提升动作合成的自然度与多样性。

强化学习用于处理虚拟人类与环境的交互，包括生成运动模型和创新的碰撞回避奖励函数，提升运动的自然性和多样性。

Occ-ScanNet是一个大规模的室内场景占据基准数据集，其大小比NYUv2大40倍，旨在促进室内场景分析的研究。

🏷️