本研究探讨了音频匿名化中保护个人隐私与情感状态之间的矛盾,并提出了一种新方法。发现当前的音频匿名化技术难以同时保护隐私和情感信息。未来的关键方向是开发特定领域内的情感识别模型。
本研究将大型语言模型整合到社交机器人中,解决了传统对话方法的局限性。机器人通过情感识别模型和表情符号回应,具有个性和表情。试验结果显示机器人具有共情力、乐于助人、自然和娱乐性,但存在语音识别错误和模型产生虚构信息的问题。
该研究使用西班牙的情感数据集,创建了基于说话者的情感识别模型,并比较了不同数据库的结果。使用预训练模型和特征组合取得了较高的准确率,对于情感价值和唤醒度的预测分别达到了61.64%和55.57%的准确率。研究发现,注释者标签的变化会影响结果,结合专家和非专家的注释可以获得更好的结果和公平性。该研究对于分析即兴语音消息的应用程序开发具有重要意义。
该研究使用西班牙语音消息数据集,创建了基于说话者的情感识别模型,并比较了不同数据库的结果。使用预训练模型和特征组合取得了较高准确率,对于情感价值和唤醒度的预测分别达到了61.64%和55.57%的非加权准确率。结果显示注释者标签的变化会影响模型的效果,结合专家和非专家的注释可以获得更好的结果和公平性。该研究对于分析即兴语音消息的应用程序开发有重要贡献。
该研究提出了一种情感识别模型,能够更好地利用多模态和长距离语境信息,并对说话人之间和内部依存关系进行建模,实验结果表明在多模态交互下表现优异。
完成下面两步后,将自动完成登录并继续当前操作。