本研究提出了一种名为TripoSG的新型流线型形状扩散范例,旨在提升3D形状生成的质量和泛化能力。通过大规模修正流变换器和混合监督训练策略,TripoSG显著提高了3D网格的重建性能,展现出卓越的细节表现和高保真性。
本研究提出了统一模型CodeBrain,用于填补缺失的脑MRI模态。通过将模态转换视为编码预测任务,CodeBrain在重建和编码预测阶段进行训练,展现出优越的填补性能,为脑MRI填补设定了新标准。
本研究提出了一种新的图像令牌化方法GaussianToken,克服了现有方法在离散代码本空间的限制。该方法通过将编码样本表示为多个二维高斯特征,显著增强了图像表示能力,实验结果表明其在多个基准数据集上的重建性能具有竞争力。
本研究提出了一种基于HSV色彩空间的对象中心表示学习方法,克服了RGB色彩空间在无监督学习中的局限性。通过预测额外的颜色通道,显著提升了重建和解耦性能,推动了计算机视觉任务的发展。
本研究提出了一种新方法,利用隐式神经表达在低数据环境下进行无镜像图像去模糊。该方法通过嵌入先验的无训练迭代优化,显著提升了重建性能和收敛速度,优于现有低shot方法。
本文提出了分层量化变分自动编码器(HQ-VAE)和鲁棒生成模型(RVQ-VAE),有效解决了分层 VQ-VAE 的层级坍塌问题,提升了重建性能。通过动态量化和在线聚类学习,改进了图像生成质量,并在视觉和语音任务中展示了其优势。
该文章介绍了一种新的稠密同时定位与建图(SLAM)方法,使用高斯斑点作为场景表示。该方法能够实时重建和渲染真实世界和合成场景,并通过新的策略扩展高斯斑点的应用。此外,还将高斯斑点扩展到编码几何并进行实验。该方法在真实世界和合成数据集上具有竞争力的重建性能和运行时间。
本研究展示了等变插拔式算法如何通过保持等变性来提高算法的稳定性和重建质量。实验结果表明,等变插拔式算法能够提高重建性能和稳定性。
本文提出了一种基于去噪扩散概率模型的无线通信方案,具有低信噪比下的网络韧性和抵抗非高斯噪声的强大分布外表现。与传统深度神经网络接收机相比,该方案具有超过25dB的改进的重建性能。
完成下面两步后,将自动完成登录并继续当前操作。