小红花·文摘

AI 语音语调分析如何改变客户体验

实时互动网 ·

近年来，TTS模型经历了从拼接式到神经网络的演变，应用广泛。Fish Audio推出的OpenAudio S1模型在200万小时数据上训练，支持多种情感和语调，生成高质量语音，成本低廉。

在线教程丨刷新TTS模型SOTA，OpenAudio S1基于200万小时音频数据训练，深刻理解情感及语音细节

HyperAI超神经 ·

本研究提出了一种名为MultiActor-Audiobook的零样本有声书生成方法，能够自动生成具有一致性和表现力的语调与情感，无需额外训练，从而提升有声书的情感表现力。

Multi-Actor Audiobook: Zero-Shot Audiobook Generation Based on Multiple Speakers

BriefGPT - AI 论文速递 ·

本文介绍了一种基于决策树和GMM的无监督词级韵律标记方法，提升了TTS系统的自然度和可控性。研究比较了多语言神经TTS系统的表示方法，发现单一表示效果更佳。同时，探讨了不同预训练语言模型对TTS任务的影响，提出了DPP-TTS和BASE TTS模型，显著提高了语音的自然度和多样性。这些研究对低资源语言的TTS模型构建具有重要意义。

基于单词的跨语言TTS系统语调模型

BriefGPT - AI 论文速递 ·

本研究解决了用户对语音助手在复杂任务中的使用犹豫问题，探索了语音助手声调对用户吸引力和可信度的影响。研究发现，语音助手的声调显著影响了用户的吸引力和信任度，积极或中性的声调能增强用户的吸引力和信任感，这表明通过精心设计声音可提升语音助手的可信度。

通过声音建立信任：声音语调如何影响用户对语音助手吸引力的感知

BriefGPT - AI 论文速递 ·

利用合成的多语言切换数据集 CoVoSwitch、两个多语言翻译模型 M2M-100 418M 和 NLLB-200 600M...

CoVoSwitch：基于语调单元的合成混合编码文本机器翻译

BriefGPT - AI 论文速递 ·

运用机器学习和认知科学的思想相结合的方法，通过迭代的方式，从人们和 GPT-4 中获取了一组句子和频繁对话的语气，进而创造并解释了人们和 GPT-4 之间对话语气的关系的可解释的几何表示形式，从而解决了人机交互中的挑战。

通过与人员进行抽样，揭示人类和语言模型之间对话语调的相似性和差异性

BriefGPT - AI 论文速递 ·