小红花·文摘

DEV Community ·

本文分析了两种低资源语言的网络挖掘语料库质量，并评估了排名语料库的不同部分。研究发现，不同部分的语料库质量存在差异，且在不同语言和数据集间有变化。此外，研究还发现，使用最高排名部分训练的神经机器翻译模型在某些网络挖掘数据集上与人工策划的数据集媲美。

BriefGPT - AI 论文速递 ·