中国团队Hyper3D推出Rodin Gen-2 Edit,实现3D模型的局部编辑,标志着3D生成进入可编辑时代。用户可通过自然语言指令修改模型,提升3D创作效率与可控性,推动行业从“结果展示”向“可迭代工作流”转变。
谷歌的Gemini 2.5 Flash图像模型在图像生成和编辑方面表现优异,特别是在一致性和推理能力上有显著提升。该模型支持自然语言驱动的局部编辑,能够合成多张图片,并禁止生成不当内容。与国内模型相比,Gemini在推理能力和图像处理上具有明显优势,预示着行业变革的趋势。
本文探讨了大语言模型解释性研究中的区域化问题,提出了一种新技术,通过对齐技术寻找最佳局部编辑。研究发现,随机位置的最佳编辑效果与全模型对齐相当,而局部编辑的行为变化几乎没有编码目标行为的证据。
本文介绍了一种基于文本引导扩散模型的3D场景生成与编辑方法,重点解决3D一致性和局部编辑问题。研究提出了DragD3D和DragTex技术,实现高效的3D编辑和纹理处理,显著提高编辑速度和视觉质量。MVEdit框架结合多视角扩散技术,优化3D对象合成,提升生成质量。实验结果表明,该方法在多样性和质量上优于现有技术。
本文提出了一种基于神经辐射场(NeRF)的三维语义分割新方法,利用2D监督提取特征,优化3D特征场,支持语义场景分解和局部区域编辑,显著提升训练和渲染速度。实验结果表明,该方法在3D分割和编辑任务中表现优异,展示了其在3D场景理解中的潜力。
完成下面两步后,将自动完成登录并继续当前操作。