ArAIEval 共享任务:阿拉伯语文本中的说服技巧和虚假信息检测

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该文介绍了 SemEval 2023 任务 3 的子任务 3 中检测说服技巧的最佳解决方案,使用基于 Transformer 的语言模型处理多语言输入数据和多个预测标签,并使用大型的跨语言模型在所有输入数据上联合训练,最终在 9 种语言中的 6 种语言上表现最优秀。

🎯

关键要点

  • 本文提出了在 SemEval 2023 任务 3 的子任务 3 中检测说服技巧的最佳解决方案。
  • 该方案通过细调预训练的基于 Transformer 的语言模型处理多语言输入数据和多个预测标签。
  • 使用大型的跨语言模型(XLM-RoBERTa 大型模型)在所有输入数据上联合训练。
  • 针对已知语言和未知语言分别设置合理的置信度阈值。
  • 最终在 9 种语言中的 6 种语言上表现最优秀,包括两个未知语言,并取得了高度竞争的结果。
➡️

继续阅读