本文介绍了RoMe,一种自动评估度量,通过语言特征和树编辑距离等评估生成句子质量,优于其他方法。
提出了一种自动评估度量RoMe,旨在评估生成句子的质量。
RoMe结合了语言能力、句法和语义变化等多个自然语言生成核心方面。
使用自我监督神经网络的语义相似性和树编辑距离来评估句子质量。
对RoMe与最先进方法进行了广泛的鲁棒性分析。
实证结果显示,RoMe在评估多个NLG任务生成的句子时,与人类判断的相关性更强。
完成下面两步后,将自动完成登录并继续当前操作。