该研究提出了一种数据增强框架,通过预训练和微调生成伪数据,提升了PLMC在代码摘要和生成方面的性能。采用偏好学习方法整合医生诊断逻辑,提高医疗对话的准确性。研究分析了人类与语言模型的偏好差异,发现偏好评估可被操控,并提出了组合偏好模型和多语言PLMs的优化策略,以提升模型的泛化能力和性能。
完成下面两步后,将自动完成登录并继续当前操作。