本研究提出了一种利用单目连续波飞行时间(C-ToF)摄像头重建动态场景的方法,优化了场景几何表示,能够在受限条件下实现高保真的动态三维重建,尤其在快速运动场景中表现优异。
本研究提出了SimAvatar框架,解决了文本驱动的人物头像生成中发型、服装和人体建模的统一几何表示问题。通过结合3D高斯体和模拟就绪的头发与服装网格,实现了高真实感的3D头像生成,具有重要的应用价值。
本文提出了一种新型自监督单目深度估计框架,利用反向循环模型和信息蒸馏策略,在KITTI基准测试中表现优异。研究了如何运用语义结构指导几何表示学习,提出了基于预训练语义分割网络的架构,克服动态对象的语义偏差。该方法在多个数据集上验证了其高精度和泛化性能,适用于自主车辆环境分析等关键应用。
本文研究了基于神经网络的3D重建技术,提出了多种提升几何表示和重建质量的方法,包括八叉树、无符号距离函数和自遮挡感知的光线跟踪。实验结果表明,这些方法在复杂形状重建和室内场景细节恢复方面表现优越,显著提高了渲染效率和重建精度。
MeshGraphNets是一种基于图神经网络的框架,专用于物理系统仿真。研究提出了多种深度学习方法,包括基于PointNet的流场预测和新颖的“bi-stride”池化策略,显著提升了计算效率和准确性。此外,研究探讨了复杂几何形状下的流体动力学建模及其可解释性,提出了新的几何表示方法和混合模型PI-MGNs,以解决非稳态偏微分方程的模拟问题。
本文提出了一种基于自监督学习的方法,通过彩色图像学习关节物体的几何、外表和动作表示,实现独立控制。该方法无需形态学注释,仅依赖2D观测,能够更精准地恢复物体形状和外观,适用于少样本重建和新视角生成等应用。研究表明,该方法在准确性和稳定性上优于传统3D监督方法。
本文介绍了一种基于单张图像的密集场景几何表示方法,适用于单目稠密SLAM系统,具有优异性能。研究提出了结合学习的深度图估计和相机跟踪算法,能够在复杂环境中实现实时三维重建,适用于机器人和增强现实等应用。
完成下面两步后,将自动完成登录并继续当前操作。