小红花·文摘

本文介绍了一种通过远程监督微调预训练模型的数据生成技术，旨在实现用户可控的改写生成器。该技术鼓励模型输出多样性，解决短语改写问题，具有语言普适性，并在英文和中文上进行了实验。研究探讨了上下文学习在生成质量和降低有毒性方面的优势，并提出了基于改写生成的方法以提高对话代理的性能和效率。