CleanComedy:通过生成技术创造友好的幽默
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了CleanComedy,一个经过过滤的英语和俄语笑话语料库,旨在解决自然语言处理中的幽默生成问题。研究验证了数据过滤方法的有效性,显著提高了计算机生成幽默的质量。
🎯
关键要点
- 本研究提出了CleanComedy,一个经过过滤的英语和俄语笑话语料库。
- 研究旨在解决自然语言处理中的幽默生成问题,特别是数据集质量和资源有限的问题。
- CleanComedy经过部分注释和毒性过滤,确保了数据的有效性。
- 通过对幽默和毒性水平的调查,验证了数据过滤方法的有效性。
- 研究发现,该方法显著提升了计算机生成幽默的质量。
- 对比人类创作和生成模型中的笑话结果,显示了显著的改进。
🏷️
标签
➡️