Sharif-STR 在 SemEval-2024 任务 1 中:Transformer 作为文本语义关系细粒度评分的回归模型
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了我们为SemEval-2024任务1开发的系统:语义文本相关性(STR),在Track C:跨语言下。该系统通过实验使用不同的预训练语言模型和源语言选择策略,以及机器翻译的数据增强和脚本差异的影响,最终在测试集中取得了第一名。
🎯
关键要点
- 本文介绍了为SemEval-2024任务1开发的语义文本相关性(STR)系统。
- 该系统在Track C:跨语言下进行,目标是检测两个句子的语义相关性。
- 任务采用零-shot跨语言转移,未使用直接监督。
- 研究了两种预训练语言模型:XLM-R和Furina,以及不同的源语言选择策略。
- 进行了多项实验,包括单源转移、基于类型学相似性的源语言选择和多源转移。
- 探讨了机器翻译的数据增强和脚本差异的影响。
- 最终在C8(Kinyarwanda)测试集中取得了第一名。
➡️