小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
像素肖像:AI生成的交易卡

在Next.js Conf和Ship AI活动中,团队推出了结合AI技术和怀旧元素的像素肖像交易卡体验。参与者拍照后可生成个性化的像素风格卡片,作为活动纪念品。该系统高效便捷,用户可在线生成卡片,并推出了Vercelf Yourself应用,允许用户创建节日主题的像素肖像。

像素肖像:AI生成的交易卡

Vercel News
Vercel News · 2025-12-23T13:00:00Z
YouTube的AI‘肖像检测’工具正在寻找流行创作者的深度伪造内容

YouTube推出了一项新的AI检测功能,帮助创作者识别和报告未经授权使用其肖像的内容。创作者在验证身份后,可以在YouTube Studio查看被标记的视频,并请求删除可能的AI生成内容。此功能将逐步向更多创作者开放,旨在帮助名人管理与其肖像相关的AI内容。

YouTube的AI‘肖像检测’工具正在寻找流行创作者的深度伪造内容

The Verge
The Verge · 2025-10-21T21:17:15Z
谷歌实验室的肖像实验与Scott Galloway国际扩展

谷歌实验室推出了Scott Galloway(Prof G)肖像,旨在为用户提供决策指导。该肖像整合了Prof G的1200多部作品,利用Gemini 2.5 Flash模型,支持全球用户提问并获取建议。此次国际扩展覆盖印度、日本、德国、巴西和英国,展示了AI在知识获取中的潜力。

谷歌实验室的肖像实验与Scott Galloway国际扩展

The Keyword
The Keyword · 2025-10-01T17:00:00Z
肖像动画生成利器:高效拼接与精准控制 | 开源日报 No.623

LivePortrait 是一款高效的肖像动画生成工具,支持精确编辑和音视频合并。deep-prove 是一个快速证明机器学习模型的框架,采用零知识加密,显著提升证明速度。splatter-image 实现快速3D重建,支持多类别模型。eaio 通过硬链接减少磁盘占用,ix 是设计自主GPT-4代理的平台。

肖像动画生成利器:高效拼接与精准控制 | 开源日报 No.623

开源服务指南
开源服务指南 · 2025-06-01T07:35:38Z
月光下的旅行,伴随着你那被光辉照亮的肖像

定制月亮灯融合了月亮的柔和光辉与珍贵照片,营造温馨氛围,适合作为礼物,适用于各种特殊场合。设计过程简单,选择照片和灯型,最终得到独特的灯具,成为生活中的珍贵纪念。

月光下的旅行,伴随着你那被光辉照亮的肖像

DEV Community
DEV Community · 2025-05-18T12:56:36Z

本研究针对肖像模式短视频的音视频事件定位(AVEL)问题,提出了专用数据集AVE-PM,并改进了数据预处理和模型设计,显著提升了性能,为移动视频内容的AVEL研究奠定了基础。

肖像模式短视频中的音视频事件定位

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z

本文解决了文本到图像扩散模型在生成多样肖像时,对阴影控制缺乏直观性的问题。我们提出了“阴影导演”,该方法在经过训练的扩散模型中提取和操作隐藏的阴影属性,只需少量合成图像和快速训练,能够实现对阴影形状、位置和强度的参数化控制,同时保留多样风格中的艺术完整性和身份。此方法为资源友好的可访问解决方案,具有广泛应用的潜力。

基于参数的阴影控制在文本到图像扩散模型中的肖像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z

本研究解决了肖像视频编辑中缺乏灵活性和训练需求的问题,提出了一种无需训练的通用框架。该框架基于统一动画控制机制,支持不同条件下的肖像外观和嘴部编辑,显著提高了视频编辑的同步性和灵活性,具有广泛的应用潜力。

RASA:替换任何人,随心所欲—一个无训练框架用于音频驱动的通用肖像视频编辑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-14T00:00:00Z

1999年出生的施文轩在美国西北大学攻读计算机博士学位。他受到深圳南方科技大学教授的影响,选择赴美深造。尽管面临压力与焦虑,他通过参加人工智能网络安全挑战赛找到了方向,计划在2025年发表论文,并关注行业实习。他的经历反映了许多中国留学生在学术与职业之间的挣扎。

西北大学博士生施文轩的肖像

Whexy Blog
Whexy Blog · 2024-12-29T18:00:00Z

本研究提出GoHD框架,解决音频驱动谈话头像生成中的肖像多样性和音频与面部运动的复杂关系,显著提升了肖像视频的真实感和可控性。

GoHD:以凝视为导向的高度解耦肖像动画,具有韵律姿势和真实表情

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究解决了当前基于扩散的方法在单图像3D肖像生成中常常出现的低保真和模糊纹理问题,主要因为跨视角一致性考虑不足。我们提出了一种混合先验扩散模型,它综合利用多视角先验来改善生成肖像的细节与一致性,实验结果表明,该方法能有效生成高几何精度和丰富细节的3D肖像。

基于交叉视角先验的细节丰富的高保真3D肖像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-15T00:00:00Z
机器人界出了个「达芬奇」,画一幅图灵肖像,卖了108万美元

机器人艺术家Ai-Da创作的《AI之神:艾伦・图灵肖像》在苏富比拍卖会上以108.48万美元成交,超出预期。这一作品通过摄像头和AI算法绘制,引发了对艺术本质的思考。

机器人界出了个「达芬奇」,画一幅图灵肖像,卖了108万美元

机器之心
机器之心 · 2024-11-12T00:39:00Z

Live_iy 是一款应用,通过参考视频为静态肖像添加动态效果。用户上传肖像和参考视频后,利用 Segmind 的 API 将静态图像转化为动态视频。应用使用 React 和 Sass 构建,并集成了 Pinata 和 Segmind 的 API。界面设计直观,方便用户操作。

Live_iy(让你的静态肖像栩栩如生)

DEV Community
DEV Community · 2024-10-14T01:01:04Z

本研究结合3D可变模型和多视角一致性扩散方法,提升生成扩散模型在创建可控逼真头像方面的表现。实验表明,该方法在单图像生成新视角头像时效果突出,实现了面部表情和身体姿势的精准控制,是首个能从单一图像生成3D一致可动画头像的模型,优于现有技术。

稳定的视频肖像

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

本研究提出了一种新方法,通过大规模合成数据集和扩散先验,解决单视角三维头发重建中的发型多样性问题,能够有效重建复杂发型,并在真实图像上表现良好。

从单视角肖像到统一的三维头发重建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

本文提出了无监督的变分风格转换模型(VAST),用于唤醒中性逼真头像的表情。该模型包括风格编码器、混合面部表情解码器和变分风格增强器。实验结果显示,该方法能够生成更生动、真实、丰富表达的说话头像。

SVP:风格增强生动肖像对话头扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-05T00:00:00Z

该研究提出了一种使用扩散模型和基于Transformer的轻量级U-Net实现的语音驱动的3D面部动画方法,通过交叉模态对齐偏差和引入BlendVOCA数据集来增强唇部同步性,并简化动画编辑过程。实验结果表明,该方法在唇部同步性上与基线方法相当或更出色。

MegActor-$\Sigma$: 利用扩散变换器实现肖像动画中的灵活混合模态控制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

马斯克发布了Grok 2,包括特朗普和贺锦利的梗图。Grok 2与Grok 1的开源时间相符,但不再更新。AIGC公司爆发,马斯克重启对OpenAI的诉讼。Grok 2的具体模型和开源情况不明。Grok 2的订阅价格便宜,可实时获取推特回复。Grok 2的绘画功能百无禁忌,图片审核限制较少。Grok 2回答问题幽默且准确,但绘画功能受限。AI生图版权问题可能引发诉讼。Grok 2对推特活跃度和广告收益有利,对XAI和Twitter的价值有帮助。马斯克希望通过Grok提升Twitter的互动和广告收入。

马斯克Grok-2登场,可订阅才8美元,真的划算吗?推翻AI市场的游戏规则,Elon Musk的肖像被拿来玩儿梗图!

硕鼠的博客站
硕鼠的博客站 · 2024-08-20T13:33:21Z

通过基于扩散的技术在多语音输入中实现面部动态同步,采用 LinguaLinker 方法将音频驱动的视觉合成与面部动画综合,以达到更加逼真、准确的口型同步,适用于不同语言的人物头像动画。

LinguaLinker: 基于音频驱动的肖像动画与隐式面部控制增强

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-26T00:00:00Z

通过采用扩散法为基础的方法框架,该研究提出了一种音频驱动下的肖像图像动画技术,通过引入层次化的音频驱动视觉合成模块,实现了更准确的音频输入与视觉输出的对齐,包括嘴唇、表情和姿势的动作,并通过定性和定量分析进行综合评估。

Hallo: 分层音频驱动的肖像图像动画综合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码