本研究构建了Chumor,这是首个中文幽默解释数据集,旨在填补中文幽默资源的不足。研究表明,现有大型语言模型在该数据集上的表现不佳,准确率仅略高于随机水平,远低于人类表现,为中文幽默理解提供了新的研究方向。
该研究探讨了先进语言模型在理解和生成中国幽默方面的能力,采用微调和提示法进行训练。结果表明,模型能够生成幽默的寓言性语言,但与人类创造力相比仍需改进。同时,研究测试了自然语言生成在幽默检测中的应用,发现大规模预训练显著提高了生成质量。
完成下面两步后,将自动完成登录并继续当前操作。