小红花·文摘

《Mixtape》是一幅关于青少年生活的音乐肖像

The Verge ·

英国所有18岁及以上的人均可参与“A National Portrait”项目，拍摄个人照片并生成数字肖像，展出至2026年10月27日。该项目结合AI技术与艺术创作，鼓励公众参与。5月14日将在国家肖像画廊举办免费绘画活动，并提供在线绘画课程。

YouTube的AI‘肖像检测’工具正在寻找流行创作者的深度伪造内容

The Verge ·

肖像动画生成利器：高效拼接与精准控制 | 开源日报 No.623

开源服务指南 ·

月光下的旅行，伴随着你那被光辉照亮的肖像

DEV Community ·

本研究针对肖像模式短视频的音视频事件定位（AVEL）问题，提出了专用数据集AVE-PM，并改进了数据预处理和模型设计，显著提升了性能，为移动视频内容的AVEL研究奠定了基础。

肖像模式短视频中的音视频事件定位

BriefGPT - AI 论文速递 ·

本文解决了文本到图像扩散模型在生成多样肖像时，对阴影控制缺乏直观性的问题。我们提出了“阴影导演”，该方法在经过训练的扩散模型中提取和操作隐藏的阴影属性，只需少量合成图像和快速训练，能够实现对阴影形状、位置和强度的参数化控制，同时保留多样风格中的艺术完整性和身份。此方法为资源友好的可访问解决方案，具有广泛应用的潜力。

基于参数的阴影控制在文本到图像扩散模型中的肖像生成

BriefGPT - AI 论文速递 ·

本研究解决了肖像视频编辑中缺乏灵活性和训练需求的问题，提出了一种无需训练的通用框架。该框架基于统一动画控制机制，支持不同条件下的肖像外观和嘴部编辑，显著提高了视频编辑的同步性和灵活性，具有广泛的应用潜力。

RASA：替换任何人，随心所欲—一个无训练框架用于音频驱动的通用肖像视频编辑

BriefGPT - AI 论文速递 ·

1999年出生的施文轩在美国西北大学攻读计算机博士学位。他受到深圳南方科技大学教授的影响，选择赴美深造。尽管面临压力与焦虑，他通过参加人工智能网络安全挑战赛找到了方向，计划在2025年发表论文，并关注行业实习。他的经历反映了许多中国留学生在学术与职业之间的挣扎。

西北大学博士生施文轩的肖像

Whexy Blog ·

本研究解决了当前基于扩散的方法在单图像3D肖像生成中常常出现的低保真和模糊纹理问题，主要因为跨视角一致性考虑不足。我们提出了一种混合先验扩散模型，它综合利用多视角先验来改善生成肖像的细节与一致性，实验结果表明，该方法能有效生成高几何精度和丰富细节的3D肖像。

机器人界出了个「达芬奇」，画一幅图灵肖像，卖了108万美元

机器之心 ·

Live_iy 是一款应用，通过参考视频为静态肖像添加动态效果。用户上传肖像和参考视频后，利用 Segmind 的 API 将静态图像转化为动态视频。应用使用 React 和 Sass 构建，并集成了 Pinata 和 Segmind 的 API。界面设计直观，方便用户操作。

Live_iy（让你的静态肖像栩栩如生）

DEV Community ·

本文介绍了一种基于音频信号生成个性化逼真说话动画的系统，提出了IMavatar、3D感知生成对抗网络和Myportrait等新方法。这些方法通过深度学习和3D模型整合，提升了面部动画的质量和一致性，成功解决了高质量动态脸部生成的挑战。

稳定的视频肖像

BriefGPT - AI 论文速递 ·

本文介绍了一系列基于神经网络的头发渲染和建模方法，包括从单一图像生成3D头发模型、准确建模头发几何形状和外观，以及通过新框架实现高逼真度发型恢复。这些方法在多个实验中表现出优越的性能，克服了传统技术的局限性。

从单视角肖像到统一的三维头发重建

BriefGPT - AI 论文速递 ·

本文介绍了多种基于语音驱动的说话人脸合成技术，包括情感视频肖像、无监督学习的3D模型、一次性风格控制和变分风格转换模型。这些方法通过提取面部特征和风格，生成高质量的动态视频人像，显著提升了合成的自然性和表现力。实验结果显示，这些新技术在视觉质量和表达丰富性方面优于现有方法。

SVP：风格增强生动肖像对话头扩散模型

BriefGPT - AI 论文速递 ·

本文介绍了一种名为FaceFormer的基于Transformer的自回归模型，用于声控3D面部动画。该模型通过自监督预训练解决数据稀缺问题，并优化了注意机制，实验结果显示其性能优于现有技术。此外，研究提出了多种方法改善语音驱动的面部动画效果，包括自适应调制模块和条件扩散模型，提升了唇部同步性和动画编辑效率。

MegActor-$\Sigma$: 利用扩散变换器实现肖像动画中的灵活混合模态控制

BriefGPT - AI 论文速递 ·

马斯克发布了Grok 2，包括特朗普和贺锦利的梗图。Grok 2与Grok 1的开源时间相符，但不再更新。AIGC公司爆发，马斯克重启对OpenAI的诉讼。Grok 2的具体模型和开源情况不明。Grok 2的订阅价格便宜，可实时获取推特回复。Grok 2的绘画功能百无禁忌，图片审核限制较少。Grok 2回答问题幽默且准确，但绘画功能受限。AI生图版权问题可能引发诉讼。Grok 2对推特活跃度和广告收益有利，对XAI和Twitter的价值有帮助。马斯克希望通过Grok提升Twitter的互动和广告收入。

马斯克Grok-2登场，可订阅才8美元，真的划算吗？推翻AI市场的游戏规则，Elon Musk的肖像被拿来玩儿梗图！

硕鼠的博客站 ·

TikTok正在测试一款AI肖像检测工具

《Mixtape》是一幅关于青少年生活的音乐肖像

埃斯·德夫林的《国家肖像》为国家肖像画廊

像素肖像：AI生成的交易卡

YouTube的AI‘肖像检测’工具正在寻找流行创作者的深度伪造内容

谷歌实验室的肖像实验与Scott Galloway国际扩展

肖像动画生成利器：高效拼接与精准控制 | 开源日报 No.623

月光下的旅行，伴随着你那被光辉照亮的肖像

肖像模式短视频中的音视频事件定位

基于参数的阴影控制在文本到图像扩散模型中的肖像生成

RASA：替换任何人，随心所欲—一个无训练框架用于音频驱动的通用肖像视频编辑

西北大学博士生施文轩的肖像

基于交叉视角先验的细节丰富的高保真3D肖像生成

机器人界出了个「达芬奇」，画一幅图灵肖像，卖了108万美元

Live_iy（让你的静态肖像栩栩如生）

稳定的视频肖像

从单视角肖像到统一的三维头发重建

SVP：风格增强生动肖像对话头扩散模型

MegActor-$\Sigma$: 利用扩散变换器实现肖像动画中的灵活混合模态控制

马斯克Grok-2登场，可订阅才8美元，真的划算吗？推翻AI市场的游戏规则，Elon Musk的肖像被拿来玩儿梗图！