本文探讨如何利用Wikidata中的结构化数据生成贫穷语言的开放领域概要,提出了一种神经网络结构,并评估其在阿拉伯语和世界语上的有效性。研究还涉及多语言BERT嵌入和Transformer模型在翻译及序列标记任务中的应用,以提高翻译能力和模型性能。
本文介绍了一个用于语法错误纠正研究的捷克语语料库,包含高错误密度的论文和较少错误的网站文本。作者比较了几个捷克语语法错误纠正系统,并提供了基准线。该语料库已在网上公开,并遵守许可协议。
完成下面两步后,将自动完成登录并继续当前操作。