LEMMING是一个模块化的对数线性模型,用于词形还原和标注,并支持任意全局特征的整合。它在六种语言的词形还原中表现出色,特别是捷克语,错误率降低了60%。联合建模词法标记和词元对彼此有益。
本文介绍了一个用于语法错误纠正研究的捷克语语料库,包含高错误密度的论文和较少错误的网站文本。作者比较了几个捷克语语法错误纠正系统,并提供了基准线。该语料库已在网上公开,并遵守许可协议。
完成下面两步后,将自动完成登录并继续当前操作。