小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
谷歌照片现在允许用户描述如何将图像转换为视频

谷歌照片更新了图像转视频功能,用户可以通过文本提示描述运动、风格或效果。此功能仅限18岁及以上用户,支持更精确的视频生成,并默认添加音频,同时简化了通过Gmail分享照片和视频的过程。

谷歌照片现在允许用户描述如何将图像转换为视频

The Verge
The Verge · 2026-01-27T12:44:01Z
ETVA:通过细粒度问题生成与回答评估文本到视频的对齐

本文提出了一种新方法ETVA,用于精确评估文本提示与生成视频之间的语义对齐。ETVA通过生成细粒度问题并进行回答,克服了现有指标的局限性。实验结果表明,ETVA与人类判断的相关性显著高于现有指标,并构建了一个包含2000个提示和12000个问题的基准,推动了文本到视频生成的发展。

ETVA:通过细粒度问题生成与回答评估文本到视频的对齐

Apple Machine Learning Research
Apple Machine Learning Research · 2025-06-30T00:00:00Z
释放你的内心艺术家:利用AI图像生成创造特定风格

AI图像生成为艺术家提供了新的创作工具。通过精准的文本提示,用户可以生成特定风格的图像,关键在于艺术媒介、风格、光线和构图等元素。结合参考图像和风格转移技术,可以提升视觉效果。生成过程需反复调整,并关注版权和伦理问题,掌握这些技巧可开启新的创作可能性。

释放你的内心艺术家:利用AI图像生成创造特定风格

DEV Community
DEV Community · 2025-05-18T09:18:50Z
如何使用Envato ImageGen创建AI图像

Envato ImageGen是一款AI图像生成工具,用户可通过文本提示快速生成艺术作品。支持多种图像比例和“增强提示”功能,帮助生成更详细的图像。用户需注册Envato Elements账户,免费生成5张图像,之后需订阅。通过详细提示和风格关键词,用户可获得更佳效果。

如何使用Envato ImageGen创建AI图像

Design Shack
Design Shack · 2025-04-04T08:00:50Z
刚刚,GPT-4o原生图像生成上线,P图、生图也就一嘴的事

OpenAI推出的GPT-4o具备原生图像生成能力,能够根据文本提示生成高质量图像,支持多种输入形式。尽管存在裁剪和多语言渲染等局限性,GPT-4o仍为用户提供了强大的图像创作工具,适合多种用户群体。

刚刚,GPT-4o原生图像生成上线,P图、生图也就一嘴的事

机器之心
机器之心 · 2025-03-26T02:24:58Z

本研究提出了一种pix2pix-zeroCon方法,旨在解决文本提示与参考图像内容保留不足的问题。通过补丁级对比损失,自动确定编辑方向,确保生成图像的内容和结构精准保留。实验结果表明,该方法在图像转换任务中优于现有模型。

Contrastive Learning Guided Latent Diffusion Model for Image-to-Image Translation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-26T00:00:00Z

本研究提出了一种新颖的测试时间扩展(TTS)方法,以提高视频生成质量。通过增加推理时间的计算资源和采用有效的推理策略(如"树帧"方法),显著提升了基于文本提示的视频生成效果,展示了TTS在视频生成中的潜力。

Test-Time Scaling for Video Generation: Video-T1

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z
Dfusion AI:人工智能驱动创意的下一次飞跃

Dfusion AI是一款强大的图像生成工具,能够将文本提示转化为高质量的视觉作品,适合艺术家和设计师使用。用户只需输入描述和选择风格,即可快速生成图像,提升创作效率。随着AI技术的发展,Dfusion AI将推动创意工作的未来。

Dfusion AI:人工智能驱动创意的下一次飞跃

DEV Community
DEV Community · 2025-02-23T12:34:50Z
YouTube将允许您在短视频中插入AI生成的视频片段

YouTube推出新的生成AI视频功能,允许创作者在制作短视频时生成独立片段。该功能与Google的Veo 2视频模型集成,旨在提升生成速度和真实感。用户可通过短视频相机访问,输入文本提示。目前在美国、加拿大、澳大利亚和新西兰推出,未来将扩展至更多地区。

YouTube将允许您在短视频中插入AI生成的视频片段

The Verge
The Verge · 2025-02-13T15:07:24Z

本研究提出了一种基于掩膜的运动轨迹框架,能够将静态图像转化为真实视频序列,有效解决了对象运动不准确和不一致的问题。该方法在多对象和高运动场景中展现了优异的时序一致性和文本提示忠实度。

Through-The-Mask: Mask-based Motion Trajectories for Image-to-Video Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-06T00:00:00Z
AI系统在保留原始运动和构图的同时创建定制视频

CustomCrafter是一种新的视频生成方法,能够在保留原始运动和构图的基础上,结合用户提供的文本提示与现有视频,生成反映文本的新视频。

AI系统在保留原始运动和构图的同时创建定制视频

DEV Community
DEV Community · 2024-12-30T09:31:44Z

本研究提出了PromptDresser模型,旨在解决虚拟试穿中对文本提示的使用不足。该模型通过根据文本描述编辑穿着方式,利用大规模多模态模型生成详细文本并调整修复遮罩,从而显著提升编辑的可控性和图像质量。

PromptDresser: Improving the Quality and Controllability of Virtual Try-On via Generative Textual Prompts and Prompt-aware Masks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-22T00:00:00Z
OpenAI的AI视频生成器Sora今天正式上线

OpenAI的AI视频生成器Sora正式上线,YouTuber Marques Brownlee分享了使用体验,称其结果“既令人恐惧又鼓舞人心”。Sora能够将文本提示转换为视频,并允许用户进行自定义,尽管在生成真实物理效果方面存在困难。

OpenAI的AI视频生成器Sora今天正式上线

The Verge
The Verge · 2024-12-09T17:04:15Z

本文提出了一种无需训练的3D编辑方法,通过用户文本提示和粗略掩膜,实现快速、精确的单个形状编辑,确保编辑区域与原始输入无缝融合。

PrEditor3D: Fast and Accurate 3D Shape Editing

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z
使用HTML、CSS和JavaScript的日月动画

本文介绍了一种网页设计,允许用户通过按钮在日间和夜间模式之间切换,界面会根据模式变化调整背景和图像效果,并包含动画效果和文本提示。

使用HTML、CSS和JavaScript的日月动画

DEV Community
DEV Community · 2024-10-28T11:55:41Z

本研究提出了名为HeadSculpt的流程,通过文本提示生成和编辑高保真3D头像。该方法采用三维高斯模型和动态表示,优化了头像的几何和表情捕捉,显著提升了渲染效率和质量。实验结果表明,HeadSculpt在实时推理和细节表现上优于现有技术,推动了个性化头像的创建。

HeadGAP:通过可泛化的高斯先验实现少样本三维头像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-12T00:00:00Z

本文介绍了一种新颖的三维生成方法“Consistent3D”,通过GSD框架和姿态相关性蒸馏采样(PCDS),显著提高了文本到三维生成的几何一致性和质量。研究还提出了分类器分数蒸馏(CSD)和稳定评分蒸馏(SSD)等新方法,优化了生成模型的性能,解决了3D模型准确性与文本提示之间的错位问题。实验结果表明,这些方法在生成高保真度和多样性的三维物体方面表现优异。

连接一致性蒸馏与分数蒸馏用于文本到 3D 生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

本文介绍了MVDream,一个多视图扩散模型,能够根据文本提示生成几何一致的多视图图像。该模型结合了大规模Web数据集的预训练图像扩散模型和3D资源,解决了现有2D-lifting方法中的3D一致性问题,提升了生成的稳定性,并可在少量样本下微调,实现个性化3D生成。

DreamStory: 基于 LLM 引导的多主题一致扩散的开放域故事可视化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-17T00:00:00Z
稳定扩散项目:复活老照片

本文介绍了修复老照片并使其焕发新生的方法,包括超分辨率处理、ControlNet模型重建、文本提示扩散过程、ControlNet精细调整和Stable Diffusion填补空白。

稳定扩散项目:复活老照片

MachineLearningMastery.com
MachineLearningMastery.com · 2024-06-30T21:04:45Z

该研究提出了一种多功能图像编辑框架,支持刚性和非刚性编辑,利用文本提示或参考图像引导。通过双路径注入方案和自注意机制,融合外观与结构信息,实验证明其在文本编辑和外观转换任务中表现优越。

LIPE:学习非刚性图像编辑的个性化身份先验

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码