PitchNet: 一种用于音高估计的全卷积神经网络
原文中文,约300字,阅读约需1分钟。发表于: 。在音乐和声音处理领域中,音高提取起着关键作用。本研究介绍了 “PitchNet”,一种专为从人类歌唱声音中提取音高而量身定制的卷积神经网络,包括 a cappella 演唱。将自相关与深度学习技术融合,PitchNet 旨在优化音高检测的准确性。通过对包含合成声音、歌剧录音和时间拉伸元音的数据集进行评估,证明了其有效性。这项工作为音乐和语音环境中的音高提取铺平了道路。
本研究介绍了一种专为从人类歌唱声音中提取音高而设计的卷积神经网络PitchNet。通过融合自相关和深度学习技术,PitchNet旨在提高音高检测的准确性。通过对不同数据集的评估,证明了其有效性。这项工作为音乐和语音环境中的音高提取提供了新的方法。