小红花·文摘

谷歌推出了免费的图像编辑模型Gemini 2.5 Flash Image，具备强大的图像推理和编辑能力，能够合成多张图片、生成3D视角并精准改变面部表情。尽管表现出色，但仍存在一些问题，引发网友热议。

谷歌认领最强AI版Photoshop！现在人人可用，效果确实强悍

量子位 ·

清华大学IDEA团队提出的GUAVA框架能够在0.1秒内从单张图像生成上半身3D化身，支持实时动画和渲染。GUAVA引入EHM模型，显著提升面部表情捕捉能力，实验结果显示其在渲染质量和效率上优于现有方法，相关代码已开源。

一张图0.1秒生成上半身3D化身！清华IDEA新框架入选ICCV 2025

量子位 ·

感谢上天，我的visionOS 26虚拟头像显著不那么诡异了！

The Verge ·

本研究提出AsynFusion框架，解决全身音频驱动头像生成中面部表情与手势协调不足的问题。该方法通过扩散变压器实现表情与手势的和谐合成，实验结果表明其在实时同步全身动画生成方面优于现有技术。

AsynFusion: An Asynchronous Latent Consistency Model for Decoupled Whole-Body Audio-Driven Avatars

BriefGPT - AI 论文速递 ·

Meta正在支付自由职业者记录他们的微笑、动作和闲聊——这些数据用于训练Codec头像

DEV Community ·

该研究提出了一种新模型，结合上下文感知自编码器和扩散生成器，合成双人反应的面部表情，实验结果优于现有方法，显示出实际应用潜力。

Potential Behavior Diffusion for Sequence Response Generation in Dyadic Settings

BriefGPT - AI 论文速递 ·

本研究提出了DreamActor-M1框架，旨在提升人像动画技术的可控性和一致性。该框架结合扩散变换器和混合引导信号，实现了对面部表情和身体动作的有效控制，实验结果表明其在多种姿态和尺度下优于现有技术。

梦境演员-M1：融合引导的整体性、表现力和稳健的人物图像动画

BriefGPT - AI 论文速递 ·

人工智能从单张照片生成超逼真的对话视频，训练速度提高90%

DEV Community ·

真假难辨！阿里升级AI人像视频生成，表情动作直逼专业水准

机器之心 ·

好活！字节，南加大，斯坦福等新开源的小人跳舞X-Dyna，人脸、背景都生动起来了

机器之心 ·

谷歌将允许用户通过面部表情控制Chromebook

The Verge ·

本研究提出了新的指令跟随数据集和FaceTrack-MM模型，以解决视频多模态大型语言模型在面部表情描述中的不足。该模型能够有效追踪复杂场景中的面部表情，显著提升视频MLLMs的性能。

Facial Dynamics in Video: Instruction Tuning for Enhanced Facial Expression Perception and Contextual Awareness

BriefGPT - AI 论文速递 ·

本研究提出了Motion-X++，一个大规模多模态3D全身人体运动数据集，解决了现有数据集中面部表情、手势和细粒度姿态描述不足的问题。该数据集包含1915万个3D全身姿态注释，提升了自然运动生成的准确性和应用潜力。

Motion-X++: A Large-Scale Multimodal 3D Whole-Body Human Motion Dataset

BriefGPT - AI 论文速递 ·

人工智能课程项目 - 面部表情识别

DEV Community ·

本研究引入“拥抱雨人”数据集，分析自闭症谱系障碍（ASD）儿童的非典型面部表情。该数据集包含手动注释的面部动作单元，揭示ASD儿童在情感表达中的不规则和多样化表情模式，为ASD的早期筛查提供了潜在工具。

Hugging Rain Man: A Novel Dataset of Facial Action Units for Analyzing Atypical Facial Expressions in Children with Autism Spectrum Disorder

BriefGPT - AI 论文速递 ·

本文介绍了一种基于网格表面的谱卷积模型，能够有效重建三维面部模型，捕捉非线性变形和表情。研究提出了多种生成3D人物和头像的方法，包括使用3D GAN和隐式3D变形模型，显著提升了生成的精度和多样性，尤其在面部表情和姿势控制方面表现优异。

谷歌认领最强AI版Photoshop！现在人人可用，效果确实强悍

一张图0.1秒生成上半身3D化身！清华IDEA新框架入选ICCV 2025

感谢上天，我的visionOS 26虚拟头像显著不那么诡异了！

AsynFusion: An Asynchronous Latent Consistency Model for Decoupled Whole-Body Audio-Driven Avatars

Meta正在支付自由职业者记录他们的微笑、动作和闲聊——这些数据用于训练Codec头像

Potential Behavior Diffusion for Sequence Response Generation in Dyadic Settings

梦境演员-M1：融合引导的整体性、表现力和稳健的人物图像动画

人工智能从单张照片生成超逼真的对话视频，训练速度提高90%

真假难辨！阿里升级AI人像视频生成，表情动作直逼专业水准

好活！字节，南加大，斯坦福等新开源的小人跳舞X-Dyna，人脸、背景都生动起来了

谷歌将允许用户通过面部表情控制Chromebook

Facial Dynamics in Video: Instruction Tuning for Enhanced Facial Expression Perception and Contextual Awareness

Motion-X++: A Large-Scale Multimodal 3D Whole-Body Human Motion Dataset

人工智能课程项目 - 面部表情识别

Hugging Rain Man: A Novel Dataset of Facial Action Units for Analyzing Atypical Facial Expressions in Children with Autism Spectrum Disorder

单图像，任意人脸：可泛化的3D人脸生成

TalkinNeRF：全身会话人的可动画神经场

Gaussian Heads: End-to-End Learning of Drivable Gaussian Head Avatars from Coarse-to-Fine Representations

Pain Diffusion: Can Robots Express Pain?

DreamHead: Learning Spatial-Temporal Correspondence in Audio-Driven Talking Head Synthesis via Hierarchical Diffusion