阿里巴巴通义千问团队推出了全能图像编辑模型Qwen-Image-Edit,具备语义与外观双重编辑能力,支持中英文文字精准编辑,显著提升图像编辑效果。
该研究提出了一种快速高效且内存占用低的神经网络架构,可通过图像编辑和几何和外观调整实现用户友好的交互式编辑 Neural Radiance Fields,并通过语义特征提炼和局部 3D 感知图像内容,使编辑结果视角一致。相比于现有的基于文本引导的编辑方法,该方法加速了10-30倍,并在多个示例上展示了外观和几何编辑的效果。
完成下面两步后,将自动完成登录并继续当前操作。