SummExecEdit: A Benchmark for Fact Consistency in Summaries with Executable Edits
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了SummExecEdit基准,旨在解决现有摘要评估在事实不一致性和可解释性方面的不足。研究显示,最优模型Claude3-Opus的检测与解释联合分数仅为0.49,表明模型的准确性仍需提高。
🎯
关键要点
- 本研究提出了SummExecEdit基准,旨在解决现有摘要评估在事实不一致性和可解释性方面的不足。
- 研究显示,最优模型Claude3-Opus的检测与解释联合分数仅为0.49,表明模型的准确性仍需提高。
- 错误类型中有45.4%关注于与摘要内容完全无关的部分。
🏷️
标签
➡️