小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

谷歌推出了免费的图像编辑模型Gemini 2.5 Flash Image,具备强大的图像推理和编辑能力,能够合成多张图片、生成3D视角并精准改变面部表情。尽管表现出色,但仍存在一些问题,引发网友热议。

谷歌认领最强AI版Photoshop!现在人人可用,效果确实强悍

量子位
量子位 · 2025-08-27T07:35:39Z

清华大学IDEA团队提出的GUAVA框架能够在0.1秒内从单张图像生成上半身3D化身,支持实时动画和渲染。GUAVA引入EHM模型,显著提升面部表情捕捉能力,实验结果显示其在渲染质量和效率上优于现有方法,相关代码已开源。

一张图0.1秒生成上半身3D化身!清华IDEA新框架入选ICCV 2025

量子位
量子位 · 2025-08-21T07:39:03Z
感谢上天,我的visionOS 26虚拟头像显著不那么诡异了!

文章讨论了Apple的visionOS 26对虚拟头像的改进,作者分享了制作新头像的体验,尽管仍显不自然,但整体效果显著提升,细节更真实,系统更好地捕捉面部表情,使虚拟形象更接近真实自我。

感谢上天,我的visionOS 26虚拟头像显著不那么诡异了!

The Verge
The Verge · 2025-06-11T14:00:00Z

本研究提出AsynFusion框架,解决全身音频驱动头像生成中面部表情与手势协调不足的问题。该方法通过扩散变压器实现表情与手势的和谐合成,实验结果表明其在实时同步全身动画生成方面优于现有技术。

AsynFusion: An Asynchronous Latent Consistency Model for Decoupled Whole-Body Audio-Driven Avatars

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z
Meta正在支付自由职业者记录他们的微笑、动作和闲聊——这些数据用于训练Codec头像

Meta启动“项目沃霍尔”,每小时支付50美元,收集面部表情和身体动作数据,以提升虚拟现实头像的真实感。2025年被视为关键年份,Meta希望通过该项目改善其元宇宙形象。

Meta正在支付自由职业者记录他们的微笑、动作和闲聊——这些数据用于训练Codec头像

DEV Community
DEV Community · 2025-05-15T13:18:34Z

该研究提出了一种新模型,结合上下文感知自编码器和扩散生成器,合成双人反应的面部表情,实验结果优于现有方法,显示出实际应用潜力。

Potential Behavior Diffusion for Sequence Response Generation in Dyadic Settings

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z

本研究提出了DreamActor-M1框架,旨在提升人像动画技术的可控性和一致性。该框架结合扩散变换器和混合引导信号,实现了对面部表情和身体动作的有效控制,实验结果表明其在多种姿态和尺度下优于现有技术。

梦境演员-M1:融合引导的整体性、表现力和稳健的人物图像动画

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z
人工智能从单张照片生成超逼真的对话视频,训练速度提高90%

该研究提出了一种新方法,通过扩散模型从单张照片生成逼真的对话视频,训练时间减少90%。该方法能够保持身份特征,并实现自然的头部运动和面部表情。

人工智能从单张照片生成超逼真的对话视频,训练速度提高90%

DEV Community
DEV Community · 2025-03-22T07:11:49Z
真假难辨!阿里升级AI人像视频生成,表情动作直逼专业水准

EMO2是阿里巴巴通义实验室提出的音频驱动高表现力人像AI视频生成技术,通过音频生成手部动作,再利用视频模型生成面部表情和身体动作,效果显著优于传统方法,能够生成自然流畅的人物视频。

真假难辨!阿里升级AI人像视频生成,表情动作直逼专业水准

机器之心
机器之心 · 2025-02-16T12:34:58Z
好活!字节,南加大,斯坦福等新开源的小人跳舞X-Dyna,人脸、背景都生动起来了

AIxiv专栏报道了人像视频生成的最新进展,研究团队提出了X-Dyna框架,提升了肢体动作和面部表情的迁移准确性,并生成自然背景,解决了动态细节不足的问题。这项技术在数字艺术和社交媒体等领域具有广泛应用前景。

好活!字节,南加大,斯坦福等新开源的小人跳舞X-Dyna,人脸、背景都生动起来了

机器之心
机器之心 · 2025-02-14T10:17:59Z
谷歌将允许用户通过面部表情控制Chromebook

谷歌推出新功能,用户可通过面部表情控制Chromebook,旨在帮助运动障碍人士。该功能已向兼容设备推广。谷歌还计划在2025年推出20多款新Chromebook,并推出教育版ChromeOS功能,允许教师实时控制学生屏幕,增强课堂互动。

谷歌将允许用户通过面部表情控制Chromebook

The Verge
The Verge · 2025-01-22T11:32:42Z

本研究提出了新的指令跟随数据集和FaceTrack-MM模型,以解决视频多模态大型语言模型在面部表情描述中的不足。该模型能够有效追踪复杂场景中的面部表情,显著提升视频MLLMs的性能。

Facial Dynamics in Video: Instruction Tuning for Enhanced Facial Expression Perception and Contextual Awareness

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-14T00:00:00Z

本研究提出了Motion-X++,一个大规模多模态3D全身人体运动数据集,解决了现有数据集中面部表情、手势和细粒度姿态描述不足的问题。该数据集包含1915万个3D全身姿态注释,提升了自然运动生成的准确性和应用潜力。

Motion-X++: A Large-Scale Multimodal 3D Whole-Body Human Motion Dataset

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z
人工智能课程项目 - 面部表情识别

该项目利用卷积神经网络(CNN)识别面部表情,分类为七种基本情绪。使用FER2013数据集,经过500个训练周期,模型准确率达到91.67%。项目重点在数据预处理、参数优化和数据增强,以提升识别能力,适用于人机交互和情感分析等领域。

人工智能课程项目 - 面部表情识别

DEV Community
DEV Community · 2024-12-26T15:02:31Z

本研究引入“拥抱雨人”数据集,分析自闭症谱系障碍(ASD)儿童的非典型面部表情。该数据集包含手动注释的面部动作单元,揭示ASD儿童在情感表达中的不规则和多样化表情模式,为ASD的早期筛查提供了潜在工具。

Hugging Rain Man: A Novel Dataset of Facial Action Units for Analyzing Atypical Facial Expressions in Children with Autism Spectrum Disorder

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

本文介绍了一种新的注意力特征提取框架ARBEx,由Vision Transformer驱动,解决面部表情学习中的类别分布不均和不确定性问题。通过学习型锚点、标签分布和多头自注意机制,提升性能和标签预测的稳定性。实验结果显示,该方法优于现有技术。

GReFEL:在偏差和不平衡数据分布下的几何感知可靠面部表情学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本研究结合3D可变模型和多视角一致性扩散方法,提升生成扩散模型在创建可控逼真头像方面的表现。实验表明,该方法在单图像生成新视角头像时效果突出,实现了面部表情和身体姿势的精准控制,是首个能从单一图像生成3D一致可动画头像的模型,优于现有技术。

稳定的视频肖像

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

本研究将3D可变模型与多视角一致性扩散方法结合,提升生成扩散模型在头像生成中的表现。实验表明,该方法在单图像新视角合成中效果突出,实现了面部表情和身体姿势的精准控制,是首个能从单一图像生成3D一致可动画头像的模型,优于现有技术。

单图像,任意人脸:可泛化的3D人脸生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

本研究提出了TalkinNeRF,一种统一的神经辐射场框架,解决全身通讯问题。该模型从单目视频中学习人体姿态、手势和面部表情,生成逼真的动态效果,尤其在未知姿态下表现优异。

TalkinNeRF:全身会话人的可动画神经场

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

本研究提出了痛苦扩散模型,解决了机器人在疼痛表达中的问题,能生成可控的面部表情,提高机器人的表达能力。研究结果显示该模型优于自回归方法,具有广泛应用潜力。

痛苦扩散:机器人能否表达痛苦?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码