小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种基于StyleGAN的面部图像姿势和表情迁移方法。该方法利用两个编码器和映射网络,将源图像的姿势和表情无缝转移到目标身份上,且无需人工标注,具有接近实时的性能。

Pose and Facial Expression Transfer Using StyleGAN

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本研究提出了一种新方法来优化面部图像化妆技术,构建了包含400万个高质量面部图像-文本对的数据集。Face-MakeUp模型在生成一致性和性能方面表现优异,对文本到图像生成领域具有重要影响。

面部化妆:用于文本到图像生成的多模态面部提示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-05T00:00:00Z

本研究提出了一种通过Kolmogorov-Arnold网络(KAN)重建真实面部图像的新方法,填补了隐私保护面部识别系统的研究空白。实验结果表明,该方法在面部映射和重建方面表现良好。

KAN Sees Your Face

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

该论文介绍了一种结合临床数据集和多模态学习方法的NAFLD诊断系统。系统利用体格检查、实验室和成像研究、问卷调查和面部图像等数据集,选择了对NAFLD预测最有贡献的临床元数据,并通过多模态输入预测NAFLD。该系统在性能上优于仅使用元数据的方法,甚至可以仅使用面部图像实现竞争性结果。这为非侵入性NAFLD诊断提供了更强大和简化的方法。

用于脂肪肝疾病检测的鲁棒优化的深度特征解耦网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z

本文提出了一种方法,通过单个面部图像和仅含音频的输入生成富有表现力的谈话头像。该方法能够合成艺术绘画、素描、2D卡通角色、日本漫画和风格化漫画等图像,并通过评估和用户研究证明其生成头像的质量显着更高。

VASA-1:实时生成栩栩如生的音频驱动说话人脸

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-16T00:00:00Z

本文提出了一种利用深度生成模型和语音输入信号为静止面部图像添加动画的方法。通过多尺度音频视觉同步损失和多尺度自回归生成对抗网络,处理语音和头部以及嘴唇之间的短期和长期关联。实验结果表明,该方法在头部动作质量和多尺度音频视觉同步方面相较于最新技术有显著提高。

G4G: 高保真细粒度语音人脸生成的通用框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-28T00:00:00Z

该研究提出了一种简单、快速且适用于图像处理的模型,通过卷积神经网络和机器学习方法,在面部图像中侦测瑕疵和皮肤损伤。

卷积神经网络用于人脸皮肤病变检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-13T00:00:00Z

本文介绍了一种基于面部图像的零样本文本到语音合成模型(Face-StyleSpeech),通过结合面部编码器和韵律编码器来生成自然语音。实验结果表明该模型在生成面部图像对应的自然语音方面胜过基准模型,甚至对未训练过的面部图像也有效。

零封装的基于流匹配的文本转语音使你尽情大笑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-12T00:00:00Z

该研究提出了一种基于坐标的神经网络来变形和融合面部图像的方法。通过结合经典方法中的能量函数,利用网络的平滑性和灵活性进行训练,实现连续的面部变形和融合。实验结果显示,该方法在面部变形检测方面与传统方法和基于数据的神经技术相竞争,并展示了多样面孔的无缝融合。

使用模板反转近似优化形态攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-01T00:00:00Z

本文介绍了一种利用深度生成模型和语音输入信号为静止面部图像添加动画的方法,通过多尺度音频视觉同步损失和多尺度自回归生成对抗网络,提高了头部动作质量和多尺度音频视觉同步。

SyncTalk: 谈话头部合成中的关键:同步问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-29T00:00:00Z

本文介绍了一种以面部图像控制语音的零样本个性化 Lip2Speech 合成方法,采用变分自编码器对讲话人身份和语言内容进行解藕,实现了对未知说话人的声音特征进行控制。同时,探索了跨模态表示学习以提高面部说话人嵌入的语音控制能力。

基于面部驱动的零射声音转换与基于记忆的面音对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-18T00:00:00Z

本论文介绍了一种结合临床数据集和多模态学习方法的NAFLD诊断系统。通过分析数据集,选择了对NAFLD预测最有贡献的临床元数据。提出的DeepFLD模型使用多模态输入来预测NAFLD,性能优于仅使用元数据的方法。DeepFLD还可以仅使用面部图像实现竞争性的结果,为非侵入性NAFLD诊断铺平了道路。

一种非侵入性可解释的中医舌象结合 NAFLD 诊断方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-06T00:00:00Z

通过对不同人的面部图像进行对比学习,准确估计年龄,并结合余弦相似度和三元组边距损失突出年龄相关特征。在FG-NET和MORPH-II数据集上取得最先进性能,验证了方法的有效性。

通过对比学习进行面部图像的年龄预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码