本研究提出了一种新颖的非最优运输流模型,解决三维点云生成中的组合不变性问题,显著提高了生成效率,并在ShapeNet基准测试中超越了现有方法。
本文介绍了一种新方法,将人类监督与预训练神经网络结合,生成三维点云分割和类别注释,显著减少自动驾驶3D物体检测的人工标注时间。该方法在多个数据集上验证了其高精度和实时性,提出了新的自监督3D感知模型和弱监督语义分割框架,提升了自动驾驶场景的理解能力。
本研究提出了一种可微分的碰撞监督牙齿排列网络(DTAN),有效解决了目标姿态感知与运动回归耦合的问题。通过解耦预测任务与特征建模,DTAN显著提高了牙齿排列的准确性与速度,并引入了一种新的碰撞损失函数,为三维点云任务提供了新思路。
本文介绍了多种深度学习方法优化三维点云的分类与检索,包括自适应下采样、差分松弛算法和PointASNL网络。这些方法在点云分类和去噪方面表现优异,特别是Set-Mixer模块显著提升了噪声点云的模型性能,展示了在3D识别中的应用潜力。
本文介绍了一种卷积网络,能够基于单张图像预测物体的RGB图和深度图,并生成完整的三维点云和表面网格。该网络通过合成模型训练,在复杂背景下生成合理推测。此外,研究提出了多视角一致性的方法和无监督的3D面部纹理生成技术,显著提升了纹理质量和一致性。
本文介绍了ParaPoint,一种无监督神经学习管道,通过在不规则三维点云上建立3D点与2D UV坐标的映射,实现全局自由边界表面参数化。研究构建了多个几何子网络,并优化了神经映射过程,实验证明了其有效性。
本文提出了两种针对三维点云的后门攻击方法:有毒标签和干净标签后门攻击,成功率分别为95%和50%。同时,介绍了MirrorAttack和PointCert等防御框架,提升了模型的鲁棒性,并验证了其在对抗攻击中的有效性。
本文提出了一种自动驾驶中的单目三维物体检测框架,通过将输入数据从二维图像转换为三维点云进行处理,并使用PointNet网络进行三维检测,提高点云的辨别能力。同时利用多模态融合模块将RGB颜色信息融入点云表示,证明了在三维空间中推断三维包围盒比在二维图像平面中更有效。经过在KITTI数据集上的评估,该方法超过了现有最新的单目方法。
该文介绍了一种名为神经梯度学习(NGL)的深度学习方法,用于从三维点云中学习具有一致方向的梯度向量,并提出了基于局部平面几何的梯度向量优化(GVO)来细化粗糙的梯度向量。该方法具有高效的全局梯度近似性能和更好的局部特征描述的准确性和泛化能力,成为具有抗噪声、异常值和点密度变化能力的最先进的法线估计器。
OGC算法可在三维点云中实现多个3D物体的分割,无需人工标注,通过挖掘动态运动模式作为监督信号来实现。该算法考虑了多物体刚体性一致性和对象形状不变性,在室内和具有挑战性的室外场景中广泛评估,证明了其在对象实例分割和一般对象分割方面的杰出性能。
本文介绍了Point-Bind和Point-LLM两个模型,Point-Bind是一个多模态模型,将三维点云与二维图像、语言、音频和视频对齐,实现了许多有前景的应用。Point-LLM是第一个遵循三维多模态指令的三维大型语言模型,通过将Point-Bind的语义注入到预训练的LLM中,实现了出色的三维和多模态问答能力。希望这些模型可以为扩展三维点云到多模态应用的社区提供帮助。
Point-Bind是一种多模态模型,可以将三维点云与二维图像、语言、音频和视频对齐。通过引入ImageBind,构建了三维和多模态之间的联合嵌入空间,实现了许多有前景的应用。此外,还提出了Point-LLM,是第一个遵循三维多模态指令的三维大型语言模型。通过参数高效的微调技术,将Point-Bind的语义注入到预训练的LLM中,具有出色的三维和多模态问答能力。希望这项工作可以为扩展三维点云到多模态应用的社区提供帮助。
完成下面两步后,将自动完成登录并继续当前操作。