小红花·文摘

OpenAI推出免费GPT-4o图像生成，支持文本控制和多轮交互，用户可在ChatGPT和Sora中体验。该模型能精确融合符号与图片，处理多个物体，生成速度快。用户每天限3次体验，API将逐步推出。

GPT-4o图像生成今起免费！奥特曼坐镇紧急发布，指令遵循/文本控制表现惊艳

量子位 ·

潞晨科技的尤洋博士在MEET 2025大会上介绍了视频生成模型Video Ocean，强调其在文本控制、机位角度、角色一致性和风格定制化方面的潜力。预计未来三年，该技术将突破现实限制，降低影视制作成本，推动行业变革。

潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025

量子位 ·

本文介绍了一种新的大语言模型编辑方法，利用梯度追踪和快速定位，支持编辑任意命题，无需主语标签，实验结果显示其性能接近最先进的方法。此外，提出了新的数据集FACT，验证了该方法在非二元命题上的有效性，并强调了在知识编辑和文本控制方面的优势。

Locate&Edit: 基于能量的文本编辑技术用于高效、灵活和真实的可控文本生成

BriefGPT - AI 论文速递 ·

本文介绍了一种新颖的图像修复和纹理合成方法DreamInpainter，结合文本和示例图像进行高质量修复，确保纹理一致性。该方法通过主题特征和令牌选择模块增强文本控制。此外，研究开发了基于文本的图像处理框架TIP，利用自然语言指导图像恢复，提升恢复性能。实验结果表明，该方法在视觉质量和文本控制方面表现优越。

InTeX: 统一深度感知修复的交互式文本生成纹理方法

BriefGPT - AI 论文速递 ·