小红花·文摘

该研究通过整合大型语言模型的对比学习目标，解决了生成不受欢迎和事实不正确内容的问题。通过自毁训练和利用现成的语言模型进行数据生成，成功降低了生成有毒内容的频率，并在通用任务中保持了模型的实用性。