探索会议总结的自动评价指标
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文研究了自动文摘评估指标的可靠性,提出了改进现有评估体系的方法,包括评估指标使用的方法与实际评估系统的方式不一致,以及通过计算小得分差距的系统之间的相关性来计算相关性。研究结果表明,收集更多高质量的人类判断和改进自动评估指标是必要的。
🎯
关键要点
- 研究自动文摘评估指标的可靠性
- 提出改进现有评估体系的方法
- 评估指标使用的方法与实际评估系统不一致
- 通过计算小得分差距的系统之间的相关性来计算相关性
- 收集更多高质量的人类判断是必要的
- 改进自动评估指标在系统得分差距小的情况下的必要性
➡️