小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
第4篇:导演思维 + AI素材生成全流程 - 怎么用AI从0做出短剧/漫剧?

本文讨论了利用AI制作短剧的全流程,强调剧本质量、场景设计、角色一致性和镜头运用的重要性。剧本是制作的基础,场景数量应控制在5到10个,角色需保持一致性,镜头的景别、角度和运镜方式直接影响AI生成效果。

第4篇:导演思维 + AI素材生成全流程 - 怎么用AI从0做出短剧/漫剧?

王欣的博客
王欣的博客 · 2026-04-24T02:00:00Z

谷歌推出Nano Banana 2图像生成模型,具备快速智能与高视觉质量,支持精确的文本生成与翻译,提升创作控制和角色一致性,适用于多种工作流程,已在谷歌产品中上线。

Nano Banana 2:将专业能力与闪电般的速度相结合

The Keyword
The Keyword · 2026-02-26T16:00:00Z
使用 Sora2 制作动画视频试验

作者利用 Sora2 制作了一分钟动画,突破了15秒生成限制。通过镜头设计和新功能,角色一致性有所提升,最终完成了一条风格统一的视频,尽管仍存在一些瑕疵。这次实验让作者重新认识了工具的边界。

使用 Sora2 制作动画视频试验

愆伏
愆伏 · 2025-12-12T14:00:00Z
与黑森林实验室合作,将FLUX.2 [开发版]引入Workers AI

Black Forest Lab推出的FLUX.2模型在Cloudflare的Workers AI平台上运行,具备高质量图像生成能力,支持多语言和JSON提示,解决了角色一致性问题,适用于广告、电子商务和创意摄影等领域。

与黑森林实验室合作,将FLUX.2 [开发版]引入Workers AI

The Cloudflare Blog
The Cloudflare Blog · 2025-11-25T00:00:00Z
Gemini 精准图像生成功能挑战 ChatGPT

谷歌DeepMind推出的Gemini 2.5 Flash Image具备精准的图像生成和编辑功能,解决角色一致性问题,支持模糊背景和物体移除等操作。该模型已集成至Gemini应用,并提供开发者API,用户可免费使用,生成的图像将添加浮水印以防止滥用。Gemini的推出旨在与ChatGPT竞争,吸引更多用户。

Gemini 精准图像生成功能挑战 ChatGPT

myfreax
myfreax · 2025-08-27T13:22:11Z
神秘「香蕉」AI 正式上线!Google P 图新王深夜炸场|附体验方式

Google推出Gemini 2.5 Flash Image模型,具备高质量图像生成与编辑功能,解决角色一致性问题,支持自然语言指令精准编辑及多图像融合,提升智能化,适用于多种创意场景,标志AI图像工具的重大进步。

神秘「香蕉」AI 正式上线!Google P 图新王深夜炸场|附体验方式

爱范儿
爱范儿 · 2025-08-27T04:44:54Z

我们推出了先进的图像生成和编辑模型,提升了角色一致性、对话式编辑和照片合成能力。用户可通过简单提示进行精准编辑,建议内容包括主题、构图、动作、地点、风格和编辑指令。模型仍在持续改进中,期待用户的创意。

在Gemini应用中获取最佳图像生成和编辑的技巧

The Keyword
The Keyword · 2025-08-26T16:08:00Z

本研究提出了一种增强的Transformer模块,旨在解决开放式故事可视化中的角色一致性和场景自然性问题。该方法结合自注意力和交叉注意力机制,以及预训练扩散模型,生成逻辑连贯的场景,表现优于现有技术,具有重要应用潜力。

Object Isolation Attention for Consistent Story Visualization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-30T00:00:00Z
GPT4o新版图片生成上手:丸辣!你是要毁了设计圈吗!

GPT4o推出的新绘图功能支持自然语言生成图像,角色一致性良好,适合设计师使用。尽管存在中文显示模糊和比例限制等小问题,但整体效果令人满意,降低了作图门槛。

GPT4o新版图片生成上手:丸辣!你是要毁了设计圈吗!

张洪Heo
张洪Heo · 2025-03-28T09:52:28Z

Gemini 2.0的实验模型在图像编辑中引发关注,尤其是角色一致性功能,增强了创作灵活性。用户可轻松编辑角色,生成游戏素材和电商图像。尽管有担忧AI会取代设计师,但专业人士仍能利用AI工具提升技能。

P图从此不求人: 都玩疯了…

王福强
王福强 · 2025-03-15T16:00:00Z
CVPR 2025|北大开源多模态驱动的定制化漫画生成框架DiffSensei,还有4.3万页漫画数据集

DiffSensei是一个结合多模态大语言模型与扩散模型的漫画生成框架,解决了多角色场景中的一致性和布局控制问题。它通过创新机制实现角色动态调整,支持灵活对话布局,并发布了包含4.3万页漫画的MangaZero数据集。实验结果表明,DiffSensei在角色一致性和图像质量上优于现有模型,推动了漫画创作和教育可视化的发展。

CVPR 2025|北大开源多模态驱动的定制化漫画生成框架DiffSensei,还有4.3万页漫画数据集

机器之心
机器之心 · 2025-03-07T04:48:49Z
人工智能工厂创造数百万个具有一致个性的独特数字角色

OpenCharacter是一个框架,用于训练可定制的AI角色,能够大规模生成个性一致的虚拟角色。通过对话模拟生成多样化的训练数据,快速创建角色扮演AI,且在角色一致性和互动性方面优于现有方法。

人工智能工厂创造数百万个具有一致个性的独特数字角色

DEV Community
DEV Community · 2025-02-03T09:04:45Z

本研究提出了StoryAgent框架,解决了自动化定制故事视频生成中的角色一致性问题。通过任务分解和角色分配,显著提升了角色一致性,超越了现有方法。

StoryAgent:通过多智能体协作定制故事视频生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z

清华系Sora全球上线,支持动漫风AI视频产品,生成速度快,新增角色一致性和动漫风格功能。Vidu提供高质感画面和影视级特效,推理速度快,用户体验好。

清华系Sora全球上线!注册即用不排队,重点支持动漫风

量子位
量子位 · 2024-07-30T04:55:43Z

本文提出了一种轻量级但复杂的引导方法,通过引入后验样本来引导去噪轨迹向目标集群集中,以提高生成图像的内容多样性。实验结果显示,该方法在角色一致性、提示一致性和图像质量方面都优于基线方法,并且比基于调整的基线方法至少快4倍。同时,首次证明语义空间具有与潜在空间相同的插值特性,可作为另一种精细生成控制的有希望工具。

CharacterFactory: GANs 采样一致性字符用于扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-24T00:00:00Z

越来越多的AI生成图像的工具实现了角色一致性的功能,包括Midjourney的角色参考、Scenario的IP适配器、Rendernet和MidjourneyNIJI。这些工具通过匹配参考图像中的人物特征、使用图像提示和模板、以及改变提示来生成具有一致性的角色图像,提高产品模型与背景的搭配效果。

五个实现角色一致性的图像生成工具

极道
极道 · 2024-04-02T00:25:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码