标签

 重建 

相关的文章:

了解重建技术的最新发展,包括多粒度分层结构、图像增强、神经场、真实世界图像和体素表面等方面的研究成果。

任务驱动的单图像文档扫描超分辨重建

发表于:

本文研究了超分辨率重建作为预处理步骤以提高文档扫描的光学字符识别的可能性,并通过以任务驱动方式训练深度网络使其更适合用于文本检测的目的,引入了多任务损失函数并取得了令人鼓舞的结果,为实现文档图像的实际超分辨率迈出了重要一步。

相关推荐 去reddit讨论

基于元表面的瞬间短波红外高光谱图像重建与内外先验学习网络

原文约200字,阅读约需1分钟。发表于:

通过使用紧凑的基于超表面滤波器的瞬间式短波红外高光谱成像系统和新颖的先验学习展开框架,以及自适应特征转移机制,本研究提出了一种快速高质量的短波红外高光谱成像方法。

本文介绍了应用深度学习处理高光谱影像的挑战,包括高维度和有限空间分辨率。通过多模态学习整合雷达和合成孔径雷达数据以提高空间分辨率。采用对抗学习和知识蒸馏解决领域差异和缺失模态的问题。通过自监督学习方法应对有限的训练样本,并利用无标签数据的降维自动编码器和半监督学习技术。该方法在各种高光谱数据集上评估,并超越现有技术。

相关推荐 去reddit讨论

基于立体图像的类别级物体检测、姿态估计与重建

原文约400字,阅读约需1分钟。发表于:

我们研究了对具有不同材质属性(漫反射、镜面、透明和混合)的日常物体进行 3D 物体理解的任务。我们提出了一种名为 CODERS 的一阶方法,用于立体图像的类别级对象检测、姿态估计和重建。我们的方法明显优于所有公共 TOD 数据集中的竞争方法。此外,通过在模拟数据上进行训练,CODERS 在真实世界中的机器人操作实验中对未见过的类别级对象实例具有很好的泛化能力。

本文介绍了一种基于实时RGB的管道,用于物体检测和六自由度姿态估计。该方法利用域随机化训练的三维模型的模拟视图和变体的降噪自编码器进行创新性的三维方向估计。该方法不需要真实标注的训练数据,适用于各种测试传感器,并在T-LESS和LineMOD数据集上取得了最新成果。

相关推荐 去reddit讨论

LuSNAR: 一个基于多传感器的月球分割、导航和重建数据集用于自主探测

原文约400字,阅读约需1分钟。发表于:

通过构建多任务并具备多场景、多标签的月球基准数据集 LuSNAR,我们可以全面评估自主感知和导航系统,包括高分辨率的立体图像对、全景语义标签、密集深度地图、LiDAR 点云和漫游者的位置等,验证了该数据集在自主环境感知和导航等任务的可行性,并提供了用于测试算法指标的月球基准数据集。

美国宇航局生成了模拟月球照明条件的POLAR数据集的数字资产POLAR3D,包括岩石/阴影标签和月球地形场景的数字孪生体。可用于训练月球探测的感知算法和合成原始POLAR收集之外的照片真实场景,同时可集成到模拟环境中,促进数字化POLAR场景中逼真的月球车操作。POLAR3D公开可用,帮助感知算法开发、相机模拟工作和月球模拟练习。

相关推荐 去reddit讨论

逐步优化的图像重建与学习注意力正则化

原文约400字,阅读约需1分钟。发表于:

利用深度学习的力量,结合传统的稀疏性促进模型,我们提出了一种图像重建的正则化方案。通过解决一系列凸问题的最小化,我们的方案具有可解释性,并逐步对图像结构变得关注。我们证明了更新算子的固定点的存在。在实验中,我们实现了与最先进的学习变分模型匹配的逆问题解决方案的性能,并在可解释性、理论保证、可靠性和性能之间提供了有希望的平衡。

计算成像在稀疏测量中起重要作用。提出了深度变分框架,利用深度生成模型学习图像重建的不确定性。通过流模型参数化目标后验并最小化KL散度实现准确不确定性估计。引入双向正则化的强大流模型增强稳定性和表达能力。通过填充设计方法实现方差减少。在基准任务和真实应用中验证了方法。结果表明,提供可靠高质量图像重建和强大不确定性估计。

相关推荐 去reddit讨论

多次蒙特卡洛渲染用于互反射重建

原文约400字,阅读约需1分钟。发表于:

逆向渲染方法在重建具有分离几何、材料和环境光的高保真 3D 对象方面取得了显著成果,但在反射表面重建方面仍面临巨大挑战。本文提出了一种引入多次蒙特卡洛采样的反射 -...

逆向渲染方法在重建具有分离几何、材料和环境光的高保真3D对象方面取得了显著成果。本文提出了一种引入多次蒙特卡洛采样的反射-MC2方法,解决了处理多个平滑物体之间的互反射的困难。实验证明,该方法在各种物体组上优于其他逆向渲染方法,并展示了其解耦能力的下游应用。

相关推荐 去reddit讨论

STMR:螺旋变压器用于手部网格重建

原文约300字,阅读约需1分钟。发表于:

通过将螺旋采样方法与 Transformer 架构相结合,提高手部网格重建的性能,并引入多尺度姿势特征提取和预定义姿势到顶点提取方法,以增强模型表征和重建性能,实现了与相似方法相比的最先进性能和出色的推理速度。

本研究提出了一种名为METRO的新方法,使用变压器编码器建模顶点-顶点和顶点-关节交互,并从单个图像中输出3D关节坐标和网格顶点。该方法在处理局部遮挡等情况方面更加鲁棒和有效,并在人类网格重建和野外3D手重建方面取得了最先进的结果。

相关推荐 去reddit讨论

无需跟踪器的手持超声无刚性重建

原文约300字,阅读约需1分钟。发表于:

使用深度学习可以预测非刚性转换,从而在扫描过程中重建 3D 超声图像,并通过考虑软组织运动中观察到的非刚性变形来改善刚性变换预测的推广能力。

本文介绍了一种使用RGB-D传感器进行动态几何形状重建的新方法,无需预定义形状模板,能够准确跟踪并降低模型对齐漂移。通过参数化几何和运动,结合稀疏颜色特征和密集深度约束公式实现运动跟踪。同时,通过非线性正则化变分优化问题和数据并行的翻转优化策略,实现了空间最佳变形的寻找。研究结果表明,该方法在快速运动和缺乏几何特征的场景下也能实现稳健的跟踪。

相关推荐 去reddit讨论

Free-SurGS:无 SFPM 的手术场景重建中的三维高斯散点法

原文约400字,阅读约需1分钟。发表于:

通过联合优化相机姿态和场景表示,提出了首个基于 3DGS 的无 SfM 手术场景重建方法,利用光流先验引导从 3D 高斯获得的投影流,并引入一致性检查来过滤异常值,实验结果表明性能优越且高效。

本文介绍了GS-SLAM算法,使用3D高斯表示方法实现了同时定位与地图构建系统中的更好平衡。该算法通过自适应扩张策略重构新观测到的场景几何并改善先前观测区域的建图。在位姿跟踪过程中,使用了从粗到细的技术来选择可靠的3D高斯表示来优化相机姿态。该算法在Replica和TUM-RGBD数据集上具有竞争力的性能。

相关推荐 去reddit讨论

应用注意力机制整合的网络,在 MR 图像重建过程中共享低秩、图像和 k - 空间信息,实现单次呼吸保持心脏电影成像

原文约300字,阅读约需1分钟。发表于:

提出了一种新颖的深度学习网络 A-LIKNet,它采用平行分支结构,在多个领域(包括低秩、图像和 k 空间)中嵌入信息,通过耦合的信息共享层实现领域之间的信息交换,并引入注意机制来赋予更重要的线圈或时间帧更大的权重,实现了高速重建高质量的动态磁共振图像。

研究人员提出了A-LIKNet,一种新的深度学习网络,通过平行分支结构在多个领域中嵌入信息,实现了高速重建高质量的动态磁共振图像。

相关推荐 去reddit讨论