小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

谷歌推出了免费的图像编辑模型Gemini 2.5 Flash Image,具备强大的图像推理和编辑能力,能够合成多张图片、生成3D视角并精准改变面部表情。尽管表现出色,但仍存在一些问题,引发网友热议。

谷歌认领最强AI版Photoshop!现在人人可用,效果确实强悍

量子位
量子位 · 2025-08-27T07:35:39Z

清华大学IDEA团队提出的GUAVA框架能够在0.1秒内从单张图像生成上半身3D化身,支持实时动画和渲染。GUAVA引入EHM模型,显著提升面部表情捕捉能力,实验结果显示其在渲染质量和效率上优于现有方法,相关代码已开源。

一张图0.1秒生成上半身3D化身!清华IDEA新框架入选ICCV 2025

量子位
量子位 · 2025-08-21T07:39:03Z
感谢上天,我的visionOS 26虚拟头像显著不那么诡异了!

文章讨论了Apple的visionOS 26对虚拟头像的改进,作者分享了制作新头像的体验,尽管仍显不自然,但整体效果显著提升,细节更真实,系统更好地捕捉面部表情,使虚拟形象更接近真实自我。

感谢上天,我的visionOS 26虚拟头像显著不那么诡异了!

The Verge
The Verge · 2025-06-11T14:00:00Z

本研究提出AsynFusion框架,解决全身音频驱动头像生成中面部表情与手势协调不足的问题。该方法通过扩散变压器实现表情与手势的和谐合成,实验结果表明其在实时同步全身动画生成方面优于现有技术。

AsynFusion: An Asynchronous Latent Consistency Model for Decoupled Whole-Body Audio-Driven Avatars

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z
Meta正在支付自由职业者记录他们的微笑、动作和闲聊——这些数据用于训练Codec头像

Meta启动“项目沃霍尔”,每小时支付50美元,收集面部表情和身体动作数据,以提升虚拟现实头像的真实感。2025年被视为关键年份,Meta希望通过该项目改善其元宇宙形象。

Meta正在支付自由职业者记录他们的微笑、动作和闲聊——这些数据用于训练Codec头像

DEV Community
DEV Community · 2025-05-15T13:18:34Z

该研究提出了一种新模型,结合上下文感知自编码器和扩散生成器,合成双人反应的面部表情,实验结果优于现有方法,显示出实际应用潜力。

Potential Behavior Diffusion for Sequence Response Generation in Dyadic Settings

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z

本研究提出了DreamActor-M1框架,旨在提升人像动画技术的可控性和一致性。该框架结合扩散变换器和混合引导信号,实现了对面部表情和身体动作的有效控制,实验结果表明其在多种姿态和尺度下优于现有技术。

梦境演员-M1:融合引导的整体性、表现力和稳健的人物图像动画

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z
人工智能从单张照片生成超逼真的对话视频,训练速度提高90%

该研究提出了一种新方法,通过扩散模型从单张照片生成逼真的对话视频,训练时间减少90%。该方法能够保持身份特征,并实现自然的头部运动和面部表情。

人工智能从单张照片生成超逼真的对话视频,训练速度提高90%

DEV Community
DEV Community · 2025-03-22T07:11:49Z
真假难辨!阿里升级AI人像视频生成,表情动作直逼专业水准

EMO2是阿里巴巴通义实验室提出的音频驱动高表现力人像AI视频生成技术,通过音频生成手部动作,再利用视频模型生成面部表情和身体动作,效果显著优于传统方法,能够生成自然流畅的人物视频。

真假难辨!阿里升级AI人像视频生成,表情动作直逼专业水准

机器之心
机器之心 · 2025-02-16T12:34:58Z
好活!字节,南加大,斯坦福等新开源的小人跳舞X-Dyna,人脸、背景都生动起来了

AIxiv专栏报道了人像视频生成的最新进展,研究团队提出了X-Dyna框架,提升了肢体动作和面部表情的迁移准确性,并生成自然背景,解决了动态细节不足的问题。这项技术在数字艺术和社交媒体等领域具有广泛应用前景。

好活!字节,南加大,斯坦福等新开源的小人跳舞X-Dyna,人脸、背景都生动起来了

机器之心
机器之心 · 2025-02-14T10:17:59Z
谷歌将允许用户通过面部表情控制Chromebook

谷歌推出新功能,用户可通过面部表情控制Chromebook,旨在帮助运动障碍人士。该功能已向兼容设备推广。谷歌还计划在2025年推出20多款新Chromebook,并推出教育版ChromeOS功能,允许教师实时控制学生屏幕,增强课堂互动。

谷歌将允许用户通过面部表情控制Chromebook

The Verge
The Verge · 2025-01-22T11:32:42Z

本研究提出了新的指令跟随数据集和FaceTrack-MM模型,以解决视频多模态大型语言模型在面部表情描述中的不足。该模型能够有效追踪复杂场景中的面部表情,显著提升视频MLLMs的性能。

Facial Dynamics in Video: Instruction Tuning for Enhanced Facial Expression Perception and Contextual Awareness

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-14T00:00:00Z

本研究提出了Motion-X++,一个大规模多模态3D全身人体运动数据集,解决了现有数据集中面部表情、手势和细粒度姿态描述不足的问题。该数据集包含1915万个3D全身姿态注释,提升了自然运动生成的准确性和应用潜力。

Motion-X++: A Large-Scale Multimodal 3D Whole-Body Human Motion Dataset

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z
人工智能课程项目 - 面部表情识别

该项目利用卷积神经网络(CNN)识别面部表情,分类为七种基本情绪。使用FER2013数据集,经过500个训练周期,模型准确率达到91.67%。项目重点在数据预处理、参数优化和数据增强,以提升识别能力,适用于人机交互和情感分析等领域。

人工智能课程项目 - 面部表情识别

DEV Community
DEV Community · 2024-12-26T15:02:31Z

本研究引入“拥抱雨人”数据集,分析自闭症谱系障碍(ASD)儿童的非典型面部表情。该数据集包含手动注释的面部动作单元,揭示ASD儿童在情感表达中的不规则和多样化表情模式,为ASD的早期筛查提供了潜在工具。

Hugging Rain Man: A Novel Dataset of Facial Action Units for Analyzing Atypical Facial Expressions in Children with Autism Spectrum Disorder

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

本文介绍了一种基于网格表面的谱卷积模型,能够有效重建三维面部模型,捕捉非线性变形和表情。研究提出了多种生成3D人物和头像的方法,包括使用3D GAN和隐式3D变形模型,显著提升了生成的精度和多样性,尤其在面部表情和姿势控制方面表现优异。

单图像,任意人脸:可泛化的3D人脸生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

本文介绍了基于神经辐射场(NeRF)和生成对抗网络(GAN)的方法,用于合成逼真的3D虚拟人物,涵盖肢体手势、面部表情和语音生成。研究提出了面部融合、手势动画重建和音频驱动的说话人脸合成等技术,显著提升了视频质量和同步效果,推动了虚拟人物动画的自然流畅性。

TalkinNeRF:全身会话人的可动画神经场

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

本文提出了一种新方法,通过多视角图像生成动态可变形的人类头头像,解决了实时渲染中复杂运动表现不佳的问题。该方法利用层次化头部模型表示,成功捕捉面部表情和头部动作的复杂动态,展现了在多个数据集上的优越表现及跨身份面部表演转移的潜在应用。

Gaussian Heads: End-to-End Learning of Drivable Gaussian Head Avatars from Coarse-to-Fine Representations

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

本研究探讨了机器人如何自然表达疼痛,提出的痛苦扩散模型能够生成可控的面部表情,提升人机交互的真实感。研究结果显示,该模型在评估上优于传统方法,具有广泛的应用潜力。

Pain Diffusion: Can Robots Express Pain?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

本研究提出了DreamHead框架,旨在改善音频驱动的说话头合成中音频线索与面部表情的时空对应关系。通过预测面部特征点,DreamHead能够有效生成高保真度的说话头视频,具有重要的应用潜力。

DreamHead: Learning Spatial-Temporal Correspondence in Audio-Driven Talking Head Synthesis via Hierarchical Diffusion

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-16T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码