小红花·文摘

通过真实人机对话提取问题，训练出用户模拟器UserGPT和合成对话数据集RealChat。实验结果显示模型在Vicuna-Bench和MT-Bench中优于基线模型，手动评估也表明具有竞争力。通过与LLaMA 2模型微调，ReaLM在MT-Bench中领先。方法展示了可扩展性和可迁移性，并初步探索了训练集数据质量与模型性能之间的相互作用。