本研究探讨了语音对话中声音反馈(如“嗯”、“是的”、“好吧”)的感知韵律相似性。结果表明,光谱和自监督语音表征在编码韵律方面优于音高特征,尤其在同一说话者的反馈中,通过对比学习可进一步优化这些表征。
完成下面两步后,将自动完成登录并继续当前操作。