CoKe:通过关键字链合理化的可定制细粒度故事评估
📝
内容提要
本研究解决了使用语言模型评估创意文本(如人类撰写故事)时,由于多标注者评分的主观性而产生的挑战。提出的CoKe方法在生成自由文本解释之前,先生成一系列关键字,从而改善评分预测的引导,研究发现该方法在StoryER数据集上表现出色,不仅实现了与人类水平的性能相当,还在与人类标注者的相关性上显著超越了GPT-4,并显著减少了参数数量。
➡️