小红花·文摘 - 小红花技术领袖俱乐部

5分钟AI长视频不翻车！国产开源框架杀到全球第一梯队

量子位 ·

人工智能视频正在超越片段拼接

人工智能视频正在超越片段拼接

The Verge ·

第4篇：导演思维 + AI素材生成全流程 - 怎么用AI从0做出短剧/漫剧？

第4篇：导演思维 + AI素材生成全流程 - 怎么用AI从0做出短剧/漫剧？

王欣的博客 ·

谷歌推出Nano Banana 2图像生成模型，具备快速智能与高视觉质量，支持精确的文本生成与翻译，提升创作控制和角色一致性，适用于多种工作流程，已在谷歌产品中上线。

Nano Banana 2：将专业能力与闪电般的速度相结合

The Keyword ·

使用 Sora2 制作动画视频试验

愆伏 ·

与黑森林实验室合作，将FLUX.2 [开发版]引入Workers AI

与黑森林实验室合作，将FLUX.2 [开发版]引入Workers AI

The Cloudflare Blog ·

Gemini 精准图像生成功能挑战 ChatGPT

Gemini 精准图像生成功能挑战 ChatGPT

myfreax ·

神秘「香蕉」AI 正式上线！Google P 图新王深夜炸场｜附体验方式

神秘「香蕉」AI 正式上线！Google P 图新王深夜炸场｜附体验方式

爱范儿 ·

我们推出了先进的图像生成和编辑模型，提升了角色一致性、对话式编辑和照片合成能力。用户可通过简单提示进行精准编辑，建议内容包括主题、构图、动作、地点、风格和编辑指令。模型仍在持续改进中，期待用户的创意。

在Gemini应用中获取最佳图像生成和编辑的技巧

The Keyword ·

本研究提出了一种增强的Transformer模块，旨在解决开放式故事可视化中的角色一致性和场景自然性问题。该方法结合自注意力和交叉注意力机制，以及预训练扩散模型，生成逻辑连贯的场景，表现优于现有技术，具有重要应用潜力。

Object Isolation Attention for Consistent Story Visualization

BriefGPT - AI 论文速递 ·

GPT4o新版图片生成上手：丸辣！你是要毁了设计圈吗！

GPT4o新版图片生成上手：丸辣！你是要毁了设计圈吗！

张洪Heo ·

Gemini 2.0的实验模型在图像编辑中引发关注，尤其是角色一致性功能，增强了创作灵活性。用户可轻松编辑角色，生成游戏素材和电商图像。尽管有担忧AI会取代设计师，但专业人士仍能利用AI工具提升技能。

P图从此不求人: 都玩疯了…

王福强 ·

CVPR 2025｜北大开源多模态驱动的定制化漫画生成框架DiffSensei，还有4.3万页漫画数据集

CVPR 2025｜北大开源多模态驱动的定制化漫画生成框架DiffSensei，还有4.3万页漫画数据集

机器之心 ·

人工智能工厂创造数百万个具有一致个性的独特数字角色

人工智能工厂创造数百万个具有一致个性的独特数字角色

DEV Community ·

本研究提出了StoryAgent框架，解决了自动化定制故事视频生成中的角色一致性问题。通过任务分解和角色分配，显著提升了角色一致性，超越了现有方法。

StoryAgent: Custom Story Video Generation through Multi-Agent Collaboration

BriefGPT - AI 论文速递 ·

清华系Sora全球上线，支持动漫风AI视频产品，生成速度快，新增角色一致性和动漫风格功能。Vidu提供高质感画面和影视级特效，推理速度快，用户体验好。

清华系Sora全球上线！注册即用不排队，重点支持动漫风

量子位 ·

最新的文本到图像生成模型在角色一致性生成方面存在挑战。本文提出了一种自动化解决方案，通过文本提示生成一致性角色，显示出在角色一致性和图像质量上优于传统方法，且速度更快。此外，介绍了CharacterGen框架，能够高效生成高质量3D角色，适用于动画应用。

CharacterFactory: GANs 采样一致性字符用于扩散模型

BriefGPT - AI 论文速递 ·

越来越多的AI生成图像的工具实现了角色一致性的功能，包括Midjourney的角色参考、Scenario的IP适配器、Rendernet和MidjourneyNIJI。这些工具通过匹配参考图像中的人物特征、使用图像提示和模板、以及改变提示来生成具有一致性的角色图像，提高产品模型与背景的搭配效果。

五个实现角色一致性的图像生成工具

极道 ·

本文提出了一个个性化情感支持框架，结合情感对话模型和可控生成方法，实验结果表明该框架优于其他模型。同时，研究了基于角色的移情对话，提供了新的数据集和模型，提升了对话中的角色一致性和情感反应。

通过语义相似性进行情感支持对话生成的角色提取

BriefGPT - AI 论文速递 ·