小红花·文摘

该研究提出了一种数据增强框架，通过预训练和微调生成伪数据，提升了PLMC在代码摘要和生成方面的性能。采用偏好学习方法整合医生诊断逻辑，提高医疗对话的准确性。研究分析了人类与语言模型的偏好差异，发现偏好评估可被操控，并提出了组合偏好模型和多语言PLMs的优化策略，以提升模型的泛化能力和性能。