量子位 ·

这个春节P图不求人！小红书开源图像编辑新SOTA

💡 原文中文，约3400字，阅读约需8分钟。

📝

内容提要

小红书推出FireRed-Image-Edit图像编辑模型，具备高效的文字编辑和风格转换能力，支持复杂指令处理，旨在提升图像编辑质量，满足用户需求。

🎯

🔎

小红书的FireRed-Image-Edit模型开源，不仅为开发者提供了强大的图像编辑工具，也促进了社区的技术交流与创新。开源意味着更多的用户可以参与到模型的改进中，推动技术的快速发展。

RedEdit Bench的推出为图像编辑模型的评估设立了新的标准，涵盖了15个子任务，能够更全面地反映模型在实际应用中的表现。这种严谨的评测方式将有助于提升整个行业的技术水平。

FireRed-Image-Edit的高效架构和三阶段训练逻辑，使其在处理复杂编辑任务时表现出色。这种设计不仅提高了模型的准确性，也增强了其在多样化场景中的适应能力，值得其他开发者借鉴。

❓

FireRed-Image-Edit模型具备高效的文字编辑和风格转换能力，支持复杂指令处理。

小红书希望通过开源FireRed-Image-Edit，为社区提供高效、可控、高质量的图像编辑基座。

FireRed-Image-Edit在多个核心指标上表现出色，获得SOTA，达到业界领先水平。

RedEdit Bench覆盖15个子任务，评估编辑模型的通用能力，精度更高。

该模型依靠高效的数据引擎与三阶段训练逻辑，提升模型能力。

模型通过Layout-Aware OCR-based Reward机制，确保文字编辑准确且保持原始风格。

🏷️