小红花·文摘

通过训练知识矿工自动提取问题和答案对，并与对话数据集结合进行微调，提高了大型语言模型的专业知识和对话能力。该模型在新的评估基准上有显著性能改进，并且只需要最少的种子实例，为模型合成的训练数据提供了自我改善的可能性。