小红花·文摘

本文探讨了语法纠错（GEC）模型的跨语料库评估，指出单一语料库评估的不足。研究评估了多种GEC模型，提出了新基准CWEB和cLang-8数据集，强调大型语言模型在GEC中的优越表现，并探讨了评估方法的改进。