KoCoSa:韩语上下文感知讽刺检测数据集

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该论文介绍了自注释 Reddit 语料库(SARC),为讽刺研究和讽刺检测系统提供数据。作者对每个陈述进行了注释,并提供了用户、主题和对话上下文。通过构建基准测试和评估基线方法,对该语料库进行了准确度评估。

🎯

关键要点

  • 该论文介绍了自注释 Reddit 语料库(SARC)。
  • SARC 为讽刺研究和讽刺检测系统提供了大量数据。
  • 每个陈述由作者自行注释,并提供用户、主题和对话上下文。
  • 通过构建基准测试和评估基线方法,对该语料库进行了准确度评估。
➡️

继续阅读