浙大团队提出了一种新方法——体素对齐的前馈3D高斯泼溅,解决了二维特征在三维空间对齐及高斯密度受限的问题,提升了多视角渲染的质量与效率。该方法通过将2D特征聚合到3D体素网格中,增强了几何一致性和跨视图稳定性,适用于机器人、自动驾驶及AR/VR等领域。
本研究通过将CityGML数据转化为体素,提高城市数据处理效率。利用高斯模糊技术增强建筑体积与空气温度的相关性,为城市规划提供可持续发展建议。
本研究针对现有单目神经形态相机在3D重建中的不足,提出了一种无物理先验的端到端方法。该方法引入了新颖的事件表示,增强了边缘特征学习的效果,并通过优化二值化阈值选择原则提供了未来研究的指导。实验结果表明,该方法的重建精度比基线方法提高了54.6%。
本文提出了一种新方法——高斯体素核函数(GVKF),旨在解决现有神经辐射场3D表面重建在训练和渲染时间上的问题。GVKF通过核回归建立连续场景表示,显著提升了开放场景的重建效率和质量。实验结果表明,其在重建质量、实时渲染速度和内存消耗方面具有明显优势。
本研究提出了一种基于3D全卷积神经网络的MRI次皮质脑结构分割方法,显著提升了特征提取的准确性和一致性,实验结果显示该方法在神经解剖学成像中表现出色,具备高效性和鲁棒性。
该论文研究了自动驾驶中的高精度3D物体检测,提出了MV3D框架,结合LIDAR和RGB图像,显著提升了检测精度。通过多种融合方案和新方法,优化了传感器性能,解决了遮挡和环境影响问题,增强了车辆的感知能力。实验结果表明,该方法在多个数据集上表现优异。
本文介绍了多种基于点云的三维目标检测和跟踪方法,如VoxelNet、PillarTrack和EasyTrack。这些方法通过不同的特征编码和网络设计,显著提升了在KITTI和nuScenes数据集上的检测和跟踪性能,具备较高的实时性和准确性。
本研究利用深度学习算法自动识别CT扫描中的颅内出血,开发了多个模型和数据集,显示出良好的分割和预测能力,具有提高医学图像分析中诊断准确性的潜力。
提出了一种名为 Arbitrary-Scale Super-Resolution NeRF (ASSR-NeRF) 的新型框架,通过使用 VoxelGridSR 模型在优化的体积上直接进行 3D 超分辨率 (SR) 操作,从而实现超分辨率新视角合成 (SRNVS)。通过在多样化场景上进行训练,可以确保模型的泛化能力,在训练过程中,对于使用低分辨率视角的未见场景,可以直接应用...
基于视觉的道路三维物体检测中,提出了一种新的体素池化策略 BEVSpread,通过自适应权重将图像特征传播到周围的 BEV 格点,使得现有基于截锥体和 BEV 的方法在车辆、行人和骑行者方面得到明显的性能提升。
本文介绍了多种基于神经网络的表面重建方法,如Voxurf、GradientSurf和NeuS。这些方法通过优化几何特征和颜色一致性,显著提升了重建质量和速度,克服了传统方法在细节和一致性方面的不足。实验结果表明,这些新方法在复杂场景重建中表现优越。
这项研究介绍了一种利用土壤的三维微计算机断层扫描图像模拟有机物质微生物分解的新的计算方法。该方法利用一个连接的体素的评估图来模拟微生物分解过程中涉及的转化和扩散过程。该模型可被用于模拟多孔介质中的任何扩散 - 转化过程。我们实施了并行化策略,并探索了不同的数值方法,包括隐式、显式、同步和异步方案。为了验证我们的方法,我们将模拟输出与 LBioS 和 Mosaic...
本文提出了一种新颖的使用视觉 Transformer(ViTs)处理体积医学信息的框架,通过将先进的 Swin Transformer 模型拓展到三维医学领域,以及在 ViTs 中处理体积信息和编码位置的新方法。我们提出了基于 Transformer 的体积方法 SuperFormer,用于磁共振成像(MRI)超分辨率,通过利用 MRI...
基于基元的体积表示可以用于建模散射和发光介质,并具有相对高效的渲染。我们提出了基于混合核心体积基元的散射和发光介质建模方法,并提供了一些优化以实现高性能和易用性。
本文提出了一种基于点云、体素和全景图形的融合网络(RPVNet),用于细粒度分割定位任务。该方法通过门控融合模块实现信息交互,并在SemanticKITTI和nuScenes数据集上表现优异,SemanticKITTI排行榜上排名第一。
该研究提出了多种基于深度学习的图像配准方法,包括利用神经图形原语优化位移向量场、使用cycle-GAN改善CT与MR图像配准以及无监督关键点检测。这些方法在提高配准精度和速度方面表现优越,具有临床应用潜力,特别是在肿瘤监测和手术决策中。
本文介绍了语义场景补全(SSC)技术的最新进展,包括点-体素聚合网络、深度卷积神经网络SSCNet和自我监督方法S4C等。这些方法在多个基准测试中表现优越,有效捕捉3D场景的语义信息和结构细节,推动了基于单目摄像机的三维场景重建研究。
该论文提出了多种改进神经辐射场(NeRF)的方法,如ConsistentNeRF、TiNeuVox和TensoRF,显著提升了稀疏视图下的重建质量和渲染性能。这些方法通过引入深度信息、时间感知特征和高效采样技术,在新视角合成和三维重建方面表现优异,推动了实时化发展。
本文研究了视觉地点识别中的光照和遮挡问题,提出了PointNetVLAD和VOLoc等新方法,利用深度学习和激光雷达地图提高识别精度,并创建了新的基准数据集以验证其有效性。
介绍了 Vox-Fusion++,一个利用神经隐式表示和传统体积融合技术进行多地图鲁棒稠密跟踪和建图的系统,并应用于实际场景,通过综合评估表明在重建质量和准确性方面优于以往方法,可用于增强现实和协作建图应用。
完成下面两步后,将自动完成登录并继续当前操作。