本研究提出了一种基于Lempel-Ziv-77算法的新型压缩编辑距离度量,旨在评估人类对大语言模型生成文本的编辑工作量。实验结果表明,该指标与实际编辑时间和努力高度相关,能够有效捕捉复杂编辑。
完成下面两步后,将自动完成登录并继续当前操作。