本文介绍了一种通过远程监督微调预训练模型的数据生成技术,旨在实现用户可控的改写生成器。该技术鼓励模型输出多样性,解决短语改写问题,具有语言普适性,并在英文和中文上进行了实验。研究探讨了上下文学习在生成质量和降低有毒性方面的优势,并提出了基于改写生成的方法以提高对话代理的性能和效率。
完成下面两步后,将自动完成登录并继续当前操作。