NLU-STR 在 SemEval-2024 任务 1 中的应用:基于生成的增强和基于编码器的评分方法用于语义文本相关性
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了我们为SemEval-2024任务1开发的系统:语义文本相关性(STR),在Track C:跨语言下。该系统通过实验使用不同的预训练语言模型和选择策略,成功检测给定目标语言中两个句子的语义相关性。在C8测试集中取得了第一名。
🎯
关键要点
-
本文介绍了为SemEval-2024任务1开发的语义文本相关性(STR)系统。
-
该系统在Track C:跨语言下进行,目标是检测两个句子的语义相关性。
-
任务采用零-shot跨语言转移,没有直接监督。
-
研究了两种预训练语言模型:XLM-R和Furina,以及不同的源语言选择策略。
-
进行了多种实验,包括单源转移、邻近源语言扩充和多源转移。
-
研究了机器翻译的数据增强和脚本差异的影响。
-
在C8测试集中(Kinyarwanda)取得了第一名。
➡️