CleanComedy:通过生成技术创造友好的幽默

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了CleanComedy,一个经过过滤的英语和俄语笑话语料库,旨在解决自然语言处理中的幽默生成问题。研究验证了数据过滤方法的有效性,显著提高了计算机生成幽默的质量。

🎯

关键要点

  • 本研究提出了CleanComedy,一个经过过滤的英语和俄语笑话语料库。
  • 研究旨在解决自然语言处理中的幽默生成问题,特别是数据集质量和资源有限的问题。
  • CleanComedy经过部分注释和毒性过滤,确保了数据的有效性。
  • 通过对幽默和毒性水平的调查,验证了数据过滤方法的有效性。
  • 研究发现,该方法显著提升了计算机生成幽默的质量。
  • 对比人类创作和生成模型中的笑话结果,显示了显著的改进。
➡️

继续阅读