Sharif-STR 在 SemEval-2024 任务 1 中:Transformer 作为文本语义关系细粒度评分的回归模型

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了我们为SemEval-2024任务1开发的系统:语义文本相关性(STR),在Track C:跨语言下。该系统通过实验使用不同的预训练语言模型和源语言选择策略,以及机器翻译的数据增强和脚本差异的影响,最终在测试集中取得了第一名。

🎯

关键要点

  • 本文介绍了为SemEval-2024任务1开发的语义文本相关性(STR)系统。
  • 该系统在Track C:跨语言下进行,目标是检测两个句子的语义相关性。
  • 任务采用零-shot跨语言转移,未使用直接监督。
  • 研究了两种预训练语言模型:XLM-R和Furina,以及不同的源语言选择策略。
  • 进行了多项实验,包括单源转移、基于类型学相似性的源语言选择和多源转移。
  • 探讨了机器翻译的数据增强和脚本差异的影响。
  • 最终在C8(Kinyarwanda)测试集中取得了第一名。
➡️

继续阅读