标签

 视图 

相关的文章:

该列表页介绍了视图合成与多视图数据分析的最新研究进展,包括关节物体建模、遥感变化检测、深度中的不确定性等内容。

DVPE: 多视角三维物体检测的分割视图位置嵌入

原文约300字,阅读约需1分钟。发表于:

通过将特征全局建模并与局部虚拟空间的部分特征交互,以减少干扰并解耦位置嵌入,本文提出了一种分割视角方法,同时将 2D 历史 RoI 特征与对象中心的时态建模相结合,实现了稳定的一对多分配策略,取得了状态 - of-the-art 的性能(57.2% mAP 和 64.5% NDS)在 nuScenes 测试集上。

本研究提出了一种多相机三维目标检测方法,通过视角校正和特征渲染,实现准确检测不同视角下的目标。该方法无需额外推理成本和真实场景注释,有效地集成和部署各种模型。实验证明其有效性。

相关推荐 去reddit讨论

一种多视图掩码对比学习图卷积神经网络用于年龄估计

原文约200字,阅读约需1分钟。发表于:

基于多视图掩蔽对比学习图卷积神经网络 (MMCL-GCN) 提出了一种用于年龄估计的模型,通过引入图结构和设计多视图掩蔽对比学习机制来学习复杂结构和语义信息,使用多层极限学习机方法来充分利用在线编码器提取的特征,从而实现了有效减小基准数据集上年龄估计误差的目标。

使用图卷积网络从非规则人脸图像中提取特征,提高了年龄估计的准确性并降低了 MAE 误差值。

相关推荐 去reddit讨论

UTG: 面向时间图的快照和事件模型的统一视图

原文约400字,阅读约需1分钟。发表于:

通过引入统一时序图 (UTG) 框架,将快照和事件驱动机器学习模型统一起来,使得针对一种表示方法开发的模型可以有效地应用于另一种数据集。我们在时序链接预测任务上对快照和事件驱动模型进行了全面评估,发现引入 UTG...

通过引入统一时序图 (UTG) 框架,将快照和事件驱动机器学习模型统一起来,使得针对一种表示方法开发的模型可以应用于另一种数据集。在时序链接预测任务上评估了快照和事件驱动模型,发现引入 UTG 训练后,快照模型在事件数据集上能够与事件驱动模型竞争,并且推断速度更快。这些发现强调了比较模型架构时独立于数据格式的重要性,并且提出了将快照模型的效率与事件驱动模型的性能相结合的潜力。

相关推荐 去reddit讨论

InfoNorm: 方向信息互信息建模用于稀疏视图重建

原文约300字,阅读约需1分钟。发表于:

通过在几何建模中显式地鼓励高度相关场景点的表面法线之间的互信息,调控从噪声(一阶)几何先验中产生的二阶相关性,我们提出了一种正则化几何建模的方法,消除了因泛化能力差导致的偏差。此外,我们引入了一种简单而有效的方案,利用语义和几何特征来识别相关点,并相应地增强它们的互信息。该技术可作为基于 SDF 的神经表面表示的插件,并通过实验证明了其在提高现有方法的表面重建质量方面的有效性。

通过调控几何建模中的互信息,消除偏差,提高表面重建质量。利用语义和几何特征识别相关点,并增强互信息。

相关推荐 去reddit讨论

稀疏视图合成的普遍人类高斯函数

原文约300字,阅读约需1分钟。发表于:

本文介绍一种利用高斯分廓的新方法,能够通过限定的稀疏视图以前馈的方式学习和呈现广义的人类高斯,从而实现对新的人类主题的逼真和准确的视图呈现。该方法通过在人类模板的 2D UV 空间上定义回归过程来学习 3D 高斯参数,有效利用了强的几何先验和 2D 卷积的优势,并通过多层支架的提出有效地表示偏移细节。实验证明,该方法在数据集内和跨数据集的泛化设置中优于最近的方法。

本文介绍了一种利用高斯分布的新方法,通过稀疏视图以前馈的方式学习和呈现广义的人类高斯,实现对新的人类主题的逼真和准确的视图呈现。该方法在学习3D高斯参数时,利用了强的几何先验和2D卷积的优势,并通过多层支架的提出有效地表示偏移细节。实验证明,该方法在数据集内和跨数据集的泛化设置中优于最近的方法。

相关推荐 去reddit讨论

基于互补的二维扩散模型和正交视图的低复杂度 3D 脑分割

原文约300字,阅读约需1分钟。发表于:

通过使用互补的 2D 扩散模型,将 2D 的语义信息提取为特征,并将其融合为 3D 上下文特征表示,我们提出了一种新颖的基于深度学习的 3D...

通过互补的2D扩散模型提取2D语义信息为特征,并融合为3D上下文特征表示,提出了一种新的基于深度学习的3D脑部分割方法。实验证明,该方法在仅使用一个主体的数据集进行训练时优于目前最先进的自监督学习方法,甚至在仅有九个切片和一个标注的背景区域的情况下,通过稀疏标记的最低标注要求进行的进一步实验也取得了有希望的结果。

相关推荐 去reddit讨论

学习多视图异常检测

原文约400字,阅读约需1分钟。发表于:

该研究探讨了最近提出的具有挑战性的多视图异常检测(AD)任务,引入了多视图异常检测(MVAD)框架,该框架学习和整合来自多视图的特征,并通过邻域关注窗口将特征图划分为计算单视图窗口和所有其他视图之间的语义相关矩阵,从而实现了多视图窗口之间的注意力机制。在 Real-IAD 数据集上进行的广泛实验验证了我们方法的有效性,在交叉设置(多 / 单类)中取得了尖端性能,仅使用 18M 参数、更少的...

该研究提出了多视图异常检测(MVAD)框架,通过学习和整合多视图特征,并使用邻域关注窗口实现多视图窗口之间的注意力机制。在实验中,该方法在Real-IAD数据集上取得了尖端性能,实现了多项指标的提升。

相关推荐 去reddit讨论

SRPose:稀疏关键点的双视图相对位姿估计

原文约300字,阅读约需1分钟。发表于:

SRPose 是一个基于稀疏关键点的框架,用于在相机到世界和物体到相机场景中进行双视图相对姿态估计,通过使用稀疏关键点探测器、内部校准位置编码器和可提示的先验知识引导的注意力层,SRPose 能够在不同图像大小和相机内参的情况下获得竞争性或卓越的性能,及低计算资源的部署。

SRPose是一个用于双视图相对姿态估计的基于稀疏关键点的框架,通过使用稀疏关键点探测器、内部校准位置编码器和可提示的先验知识引导的注意力层,能够在不同图像大小和相机内参的情况下获得竞争性或卓越的性能,适合低计算资源的部署。

相关推荐 去reddit讨论

AdaOcc:自适应前向视图变换与流模型用于 3D 占据与流预测

原文约400字,阅读约需1分钟。发表于:

通过采用自适应前视转换和流建模的双阶段框架,我们提出了一种创新的方法,以增强 3D 占用和流的预测能力。我们首先独立训练占用模型,然后使用连续帧集成进行流预测。我们的方法将回归与分类相结合,以解决不同场景中的尺度变化,并利用预测的流将当前体素特征扭曲到未来帧,由未来帧的真值引导。在 nuScenes...

通过自适应前视转换和流建模的双阶段框架,提出了一种增强3D占用和流预测能力的方法。在nuScenes数据集上实验,结果表明该方法在准确性和鲁棒性方面有显著改进,展示了在真实环境下的有效性。基于Swin-Base的单一模型在公共排行榜上排名第二,验证了该方法在推进自动驾驶车辆感知系统方面的潜力。

相关推荐 去reddit讨论

学习 3D 高斯函数对极度稀疏视图的锥束 CT 重建

原文约300字,阅读约需1分钟。发表于:

通过稀疏视图重建减少辐射剂量的研究方向中,我们提出了一种新的重建框架,名为 DIF-Gaussian,利用三维高斯函数在三维空间中表示特征分布,通过测试时优化改进模型的泛化能力,通过在两个公共数据集上的评估结果,显示出明显优于最先进方法的重建性能。

稀疏视图CT重建研究中,3D高斯模型通过启发滤波反投影重建图像的先验信息,提高了收敛性和渲染效果。自适应密度控制进一步提高了性能,加速了收敛速度,同时能学习高频细节。在自监督学习方式下进行训练,避免了大规模配对数据的需求。实验证明,3D高斯模型比基于INR的方法性能更优。

相关推荐 去reddit讨论