ATRI: Mitigating Inconsistencies in Multilingual Audio Text Retrieval by Reducing Data Distribution Errors
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新方案,针对多语音音频文本检索中的不一致性问题,通过1-to-k对比学习和音频-英语共同锚对比学习,减轻数据分布错误的影响。实验结果表明,该方案在多种语言上表现优异。
🎯
关键要点
- 本研究针对多语音音频文本检索中的不一致性问题,特别是跨语言相似性匹配的挑战。
- 提出了一种新的解决方案,通过1-to-k对比学习和音频-英语共同锚对比学习来缓解数据分布错误的影响。
- 该方案有效提高了检索率和一致性,实验结果显示在多种主流语言上表现优异。
➡️