大晓机器人与港中文MMLab推出Kairos-Homeworld,这是首个全屋三维生成与物体级交互框架,利用30万套中国住宅户型数据为机器人提供训练环境。该系统能够自动生成家庭场景,支持机器人进行家务任务训练,提升交互能力。同时,开源的Kairos 3.0-4B世界模型增强了机器人的理解与预测能力,推动具身智能的发展。
香港科技大学谭平教授团队在CVPR 2025发布了Craftman3D和Dora两项三维生成技术,核心代码已开源。Craftman3D获得满分评价,被多家企业引用,显著降低了三维建模的门槛,使用户能够轻松创建高质量的三维内容。
本研究提出了Zero-1-to-G方法,解决了三维生成中的数据稀缺和质量问题。通过使用Gaussian splats和预训练的二维扩散模型,增强了三维一致性,实验结果表明生成质量和泛化能力显著提升。
本研究提出一种新方法,通过引入触觉模态来改善三维生成中的几何细节表现。结合高分辨率触觉感知与二维扩散模型,能够生成更真实的几何纹理,实现视觉与触觉的精准对齐。
上海人工智能实验室与南洋理工大学推出3DTopia-XL,这是一种新型三维生成模型。利用PrimX表征和DiT架构,该模型能在5秒内从图像或文本生成高质量三维数字资产,支持PBR材质,适用于游戏引擎和工业设计软件。未来将支持多模态输入,提供全面三维内容创作解决方案。
本文介绍了多种三维生成技术,包括基于分数蒸馏的NeRF模型、DragD3D局部网格编辑方法和PolyDiff三维多边形网格生成方法。这些技术通过结合草图风格引导、二维扩散先验和合理性保持,显著提升了三维对象生成的质量和控制能力,解决了几何不一致性问题。
Muse是一种文本到图像的Transformer模型,能够根据文本生成高质量图像,并支持图像编辑。研究介绍了文本导向的三维生成技术,包括头像、纹理和场景生成。用户可以通过Control3D根据草图交互式控制三维内容生成。CompAgent方法在复杂文本提示下保持图像可控性,L3GO模型和Agent3D-Zero框架提升了三维场景理解能力。
本文介绍了一种新颖的三维生成方法“Consistent3D”,通过GSD框架和姿态相关性蒸馏采样(PCDS),显著提高了文本到三维生成的几何一致性和质量。研究还提出了分类器分数蒸馏(CSD)和稳定评分蒸馏(SSD)等新方法,优化了生成模型的性能,解决了3D模型准确性与文本提示之间的错位问题。实验结果表明,这些方法在生成高保真度和多样性的三维物体方面表现优异。
本文探讨了分数蒸馏抽样(SDS)及其变体在文本到三维生成中的应用,提出了“Consistent3D”方法,显著提升了三维物体和场景的生成质量。研究分析了SDS的组成部分,并提出了稳定评分蒸馏(SSD)和分类器分数蒸馏(CSD)方法,解决了生成模型中的多面几何和准确性问题,效果优于现有技术。
本文讨论了文本到三维生成技术的最新进展,重点介绍了通过手绘草图增强用户控制的 Control3D 方法。该方法结合改进的 2D 条件扩散模型,能够生成与文本提示和草图一致的三维场景。此外,研究还介绍了新模型 GET3D 和 DreamGaussian,提升了三维生成的效率和质量,展示了在多模态条件下生成高质量三维内容的潜力。
本文介绍了Control3D、ControlNet-XS和ControlGAN等可控文本生成方法,旨在提升用户对三维和图像生成的控制能力。通过结合文本提示和手绘草图,这些方法增强了生成内容的准确性和可控性,研究表明其在生成高质量图像和三维场景方面表现优异,能够有效满足用户需求。
最新的文本到图像扩散模型在文本到三维生成领域取得重大突破,通过文本提示和手绘草图创作准确忠实的三维场景,提高用户可控性和交互式控制能力。
完成下面两步后,将自动完成登录并继续当前操作。