本文讨论了文本排毒技术,旨在将有毒语言转化为中性语言。研究扩展了多语言排毒模型,展示了平行语料库对模型性能的提升,并在多个语言数据集上取得了显著效果,特别是在冒犯语言识别和跨语言文本转换方面。
本研究提出了首个编码器-解码器结构的预训练模型,用于冒犯语言识别,并在两个大型数据集上进行了训练。研究结果显示,该模型在多个英文基准测试中优于其他模型,实现了新的最优表现。
完成下面两步后,将自动完成登录并继续当前操作。