LC-Score:无参考文本理解难度评估
原文中文,约300字,阅读约需1分钟。发表于: 。我们提出了一个简单的方法 LC-Score,用于训练法语文本的阅读理解指标,通过预测给定文本的易读性来定量捕捉文本与清晰语言指南的契合程度。我们探索了两种方法:使用语言学动机指标训练统计模型,以及从文本中直接利用预训练语言模型进行神经学习。我们通过两个人工注释实验评估了我们的模型,发现两种方法(基于指标和神经)优于常用的可读性和理解度量,如 FKGL 和 SAMSA。
该文介绍了一种新颖的文本修改任务,通过生成不同阅读度级别的版本来实现对输入文本的阅读度的修改。使用 ChatGPT 和 Llama-2 进行基准测试,发现阅读度的变化程度与源文本和目标文本之间的语义和词汇相似性的降低程度存在较大的相关性。