小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

近期,吉卜力风格图像在社交媒体上流行。EasyControl通过轻量级技术简化创作,推出了吉卜力风图像生成Demo,用户可轻松将肖像转为宫崎骏风格艺术作品。

「吉卜力」画风生成神器—EasyControl 一键启动;单图秒变 3D 模型,TripoSG 革新 3D 资产生成

HyperAI超神经
HyperAI超神经 · 2025-04-27T08:14:02Z

本文提出了一种半监督预训练方法,结合文本和语音信息,以检测自发行为标签并提升语音合成性能。研究开发了可控表达性语音合成模型FreeStyleTTS,支持从文本中检索风格。同时,提出了StyleTTS生成模型,利用自监督学习生成自然韵律的多样化语音,表现优于现有模型。整体目标是提升语音合成的表现和风格控制能力。

基于语言模型的具有可控自发行为的自发风格的文本语音合成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

本文介绍了利用变分自编码器(VAE)实现语音合成模型的端到端学习,通过无监督方式学习发音风格的潜在表示。VAE学习到的风格表示具有解缠、缩放和组合等特性,使得风格控制变得容易。通过VAE的识别网络推断出风格表示,然后将其馈入TTS网络来引导语音合成中的风格,实现风格转移。采用多种技术避免KL散度崩溃。该模型在风格控制上表现良好,并在风格转移的ABX偏好测试中优于全局风格令牌(GST)模型。

StyleSpeech:基于 VQ-VAE 的自监督风格增强与情感化有声书语音合成预训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-19T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码