标签

 重建 

相关的文章:

本列表汇集了关于重建技术的最新研究与应用,涵盖软件项目修复、三维场景重建及生成模型等领域,展示了重建技术的广泛应用与发展趋势。

修复还是重建?拯救失败软件项目的真实成本

Your software project is spiraling out of control. Features are glitchy, bugs multiply by the hour, and deadlines are a distant memory. You’re now at a major fork in the road: Should you fix your...

软件项目失控时,修复或重建是个难题。修复适合小问题,重建适合技术过时或存在重大缺陷的情况。需评估成本、团队士气和用户体验等因素,以决定最佳方案。混合方法也可行,逐步重构关键系统。

修复还是重建?拯救失败软件项目的真实成本
原文英文,约1100词,阅读约需4分钟。发表于:
阅读原文

三天重建:私信回归——比以往更好

Originally posted on May 2, 2025 After a major setback wiped our codebase, we rebuilt Tavrn's 1-to-1 DM system from scratch — in just 3 days. This post breaks down how we did it, what’s new, and...

Tavrn在三天内重建了1对1消息系统,解决了代码库丢失问题。新系统更快、更清晰,具备更好的消息渲染和输入指示功能。接下来将优化群聊和个人资料等核心功能,以提升用户体验。

三天重建:私信回归——比以往更好
原文英文,约300词,阅读约需1分钟。发表于:
阅读原文

Pixel3DMM:适用于单幅图像的多功能屏幕空间先验的3D人脸重建

本研究解决了从单幅RGB图像中重建人脸的3D模型问题。我们提出了Pixel3DMM,这是一组高度泛化的视觉变换器,通过预测每个像素的几何线索来约束3D可变人脸模型的优化。实验结果表明,我们的方法在姿态人脸表情的几何准确性上比最具竞争力的基线提升了超过15%。

本研究提出了Pixel3DMM,通过预测每个像素的几何信息,从单幅RGB图像重建3D人脸模型。实验结果显示,该方法在姿态和表情的几何准确性上提升超过15%。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文

重新审视图像重建中的扩散自编码器训练质量

本研究解决了扩散自编码器在图像重建中难以平衡结构恢复与细节提升的问题。提出了一种新的训练方法,将训练分为两个阶段,以首先提取结构信息,随后专注于细节的改善。实验结果表明,该方法能够生成具有准确高层次结构和低层次细节的高质量图像。

本研究提出了一种新训练方法,通过分阶段训练解决扩散自编码器在图像重建中结构恢复与细节提升的平衡问题,实验结果表明该方法能够生成高质量图像。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文

合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源

上海人工智能实验室开源了生成式世界模型AETHER,该模型基于合成数据训练,具备3D空间决策与规划能力。它结合几何重建与生成建模,提升了动态环境中的智能决策能力,支持目标导向视觉规划、4D动态重建和动作条件视频预测,展现出强大的零样本泛化能力。

合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源
原文中文,约2100字,阅读约需5分钟。发表于:
阅读原文
原文中文,约1600字,阅读约需4分钟。发表于:
阅读原文

动态重建的大型插值模型

该研究解决了现有4D重建方法在类别特定模型和慢优化方法上的局限性,提出了一种新颖的变换器基础的前馈解决方案LIM,通过因果一致性损失进行指导,实现了隐式3D表示的时间插值。研究表明,LIM能够以秒级速度生成高质量的插值帧,并为现有制作流程提供一致的uv纹理网格序列。

发表于:
阅读原文

GenFusion:通过视频缩小重建与生成之间的差距

本研究解决了3D重建与生成之间的条件缺口,这一缺口导致了在实际应用中的限制。我们提出了一种驱动重建的视频扩散模型,并通过循环融合管道提升了生成模型的训练效果,最终验证了该方法在从稀疏视图和遮挡输入中进行视图合成的有效性。

本研究提出了一种视频扩散模型,解决了3D重建与生成之间的条件缺口,提升了生成模型的训练效果,并验证了其在稀疏视图和遮挡输入下的视图合成有效性。

原文中文,约200字,阅读约需1分钟。发表于:
阅读原文

对齐基础模型先验与基于扩散的手部交互,实现耐遮挡的双手重建

本研究针对单目图像中的双手重建存在的挑战,如复杂的手势和遮挡问题,提出了一种新颖的框架,集成了基础模型驱动的2D先验和基于扩散的交互优化,以提高重建的准确性和鲁棒性。通过引入融合对齐编码器和双手扩散模型,实验表明该方法在多个数据集上实现了最先进的性能,显著改善了对遮挡的处理和交互的可靠性。

发表于:
阅读原文

学习高效适应基础模型进行自监督内窥镜三维场景重建

本研究针对内窥镜深度估计和三维场景重建中的自监督学习(SSL)方法,提出了Endo3DAC框架,填补了在医疗领域对基础模型适应策略的探索空白。通过冻结基础模型并仅训练新设计的Gated Dynamic Vector-Based Low-Rank Adaptation (GDV-LoRA),本框架在深度和姿态估计上取得了显著提升,同时保持了训练效率。

本研究提出了Endo3DAC框架,针对内窥镜深度估计和三维场景重建中的自监督学习,填补了医疗领域基础模型适应策略的空白。通过冻结基础模型并训练新设计的GDV-LoRA,显著提升了深度和姿态估计的效果。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文