NLU-STR 在 SemEval-2024 任务 1 中的应用:基于生成的增强和基于编码器的评分方法用于语义文本相关性

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了我们为SemEval-2024任务1开发的系统:语义文本相关性(STR),在Track C:跨语言下。该系统通过实验使用不同的预训练语言模型和选择策略,成功检测给定目标语言中两个句子的语义相关性。在C8测试集中取得了第一名。

🎯

关键要点

  • 本文介绍了为SemEval-2024任务1开发的语义文本相关性(STR)系统。

  • 该系统在Track C:跨语言下进行,目标是检测两个句子的语义相关性。

  • 任务采用零-shot跨语言转移,没有直接监督。

  • 研究了两种预训练语言模型:XLM-R和Furina,以及不同的源语言选择策略。

  • 进行了多种实验,包括单源转移、邻近源语言扩充和多源转移。

  • 研究了机器翻译的数据增强和脚本差异的影响。

  • 在C8测试集中(Kinyarwanda)取得了第一名。

➡️

继续阅读