CoKe:通过关键字链合理化的可定制细粒度故事评估

📝

内容提要

本研究解决了使用语言模型评估创意文本(如人类撰写故事)时,由于多标注者评分的主观性而产生的挑战。提出的CoKe方法在生成自由文本解释之前,先生成一系列关键字,从而改善评分预测的引导,研究发现该方法在StoryER数据集上表现出色,不仅实现了与人类水平的性能相当,还在与人类标注者的相关性上显著超越了GPT-4,并显著减少了参数数量。

➡️

继续阅读