ATRI: Mitigating Inconsistencies in Multilingual Audio Text Retrieval by Reducing Data Distribution Errors

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新方案,针对多语音音频文本检索中的不一致性问题,通过1-to-k对比学习和音频-英语共同锚对比学习,减轻数据分布错误的影响。实验结果表明,该方案在多种语言上表现优异。

🎯

关键要点

  • 本研究针对多语音音频文本检索中的不一致性问题,特别是跨语言相似性匹配的挑战。
  • 提出了一种新的解决方案,通过1-to-k对比学习和音频-英语共同锚对比学习来缓解数据分布错误的影响。
  • 该方案有效提高了检索率和一致性,实验结果显示在多种主流语言上表现优异。
➡️

继续阅读