MIT News - Artificial intelligence ·

教人工智能像人类一样交流声音

💡 原文英文，约1600词，阅读约需6分钟。

📝

内容提要

麻省理工学院的研究人员开发了一种新型人工智能模型，能够模仿和理解日常声音，如蛇的嘶嘶声和救护车警报声。该模型模拟人类声道的工作原理，未来可能应用于娱乐、教育和语言学习等领域。

🎯

🔎

该研究展示了人工智能如何模拟人类的声音模仿能力，强调了模仿在沟通中的重要性。通过理解人类声道的工作原理，AI能够生成更自然的声音，这为未来的声音交互界面奠定了基础。

虽然该模型在声音模仿方面取得了显著进展，但仍面临一些挑战，如对某些辅音的处理不够准确。这些限制可能影响其在语言学习和娱乐等领域的实际应用效果，未来需要进一步优化。

研究表明，声音模仿不仅是技术问题，还涉及认知科学。通过分析人类如何选择和表达声音，研究人员可以更深入地理解语言发展和交流方式，这对语言学习和人工智能的设计都有重要意义。

❓

该模型模拟人类声道的工作原理，通过控制声带的振动和口腔的形状来生成与真实声音相似的模仿声。

该模型未来可能应用于娱乐、教育和语言学习等领域，帮助艺术家和内容创作者更好地传达声音。

研究人员设计了三种不同的模型，逐步提高模仿的准确性和人类行为的匹配度，最终模型考虑了模仿声音的努力程度。

模型能够生成更接近人类模仿方式的声音，考虑了人类在模仿时的努力程度和选择。

在实验中，参与者偏好AI模型生成的模仿声，尤其是对摩托艇和枪声的模仿，AI模型的表现优于人类。

模型在模仿某些辅音时存在困难，如“z”，导致对某些声音的模仿不准确。

🏷️