MultiParaDetox:利用平行数据扩展文本去毒处理到新的语言
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了同时进行文本翻译和去毒化的新任务,提供了几种强基线方法和新的自动去毒化评估指标,并确定了最佳的文本去毒化知识转移策略。
🎯
关键要点
- 文本去毒化是将文本风格从有毒转化为中性的任务。
- 在单语环境下已有取得良好结果的方法,但跨语言转化仍存在困难。
- 首次探索了同时进行文本翻译和去毒化的新任务。
- 提供了几个强基线方法来支持该任务。
- 引入了与人类判断更高相关性的新自动去毒化评估指标。
- 通过人工标记和评估,确定了最佳的文本去毒化知识转移策略。
➡️