BriefGPT - AI 论文速递 ·

使用无旋律监督预训练提升单音人声合成的音域

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

本文介绍了一种高质量的歌唱合成器，利用序列到序列的歌唱模型和多歌手框架来模拟声音。通过对抗性任务和多随机窗口鉴别器，保证了模型的平衡性。客观和主观评估表明，该合成器比基准测试产生更高质量的歌唱声音，特别是高音元音的表达得到了显著改善。

🎯

关键要点

提出了一种高质量的歌唱合成器，能够在有限的可用录音基础上模拟声音。
采用序列到序列的歌唱模型，并设计了多歌手框架以利用不同歌手的现有歌唱数据。
加入对抗性任务和多随机窗口鉴别器以保证模型的平衡性。
客观和主观评估表明，该合成器比基准测试产生更高质量的歌唱声音。
特别是高音元音的表达得到了显著改善，MOS 值分别为 4.12 和 3.53。

🏷️

标签

多歌手框架对抗性任务序列到序列歌唱合成器高音元音

➡️

继续阅读

法院批准A社与作者和出版社的15亿美元和解协议初步解决A社使用盗版图书训练模型问题
#人工智能法院批准 A 社与作者和出版社的 15 亿美元和解协议，初步解决 A 社使用盗版书籍训练模型的集体诉讼案件。法庭文件显示，A 社建立拥有 70...
Visual Studio Code 1.130（Insiders）
Visual Studio Code 1.130 Insiders版本发布，新增功能更新。用户可通过提交日志和已关闭问题列表跟踪进展，鼓励大家尽快尝试新特性。
Next chapter: Restructuring GitHub’s bug bounty program
GitHub is making some significant changes to its bug bounty program, shifting...
Confidential Containers becomes a CNCF incubating project
The CNCF Technical Oversight Committee (TOC) has voted to accept Confidential...
How the Galaxy Z Fold 8 and Z Flip 8 phones compare
Samsung's latest round of folding Galaxy Z phones and updated smartwatche...
Preorders for Samsung’s new Z Fold and Flip 8 come with up to $350 in gift cards
Samsung's newest foldables are here. At Galaxy Unpacked, the company anno...