小红花·文摘

通过训练用户模拟器UserGPT和生成对话数据集RealChat，实验结果显示模型在Vicuna-Bench和MT-Bench中表现优于基线模型，并通过与LLaMA 2模型微调在MT-Bench中获得6.33的领先分数。方法还展示了可扩展性和可迁移性，并初步探索了训练集数据质量与模型性能之间的相互作用。

多用户聊天助手 (MUCA): 一种利用 LLMs 促进群组对话的框架

BriefGPT - AI 论文速递 ·

该研究训练了用户模拟器 UserGPT 并产生了高质量的合成对话数据集 RealChat，实验结果表明该模型在 Vicuna-Bench 和 MT-Bench 中优于基线模型。通过与最新 LLaMA 2 模型进行微调，ReaLM 在 MT-Bench 中获得了 6.33 的领先分数。该研究还探索了训练集数据质量与模型性能之间的相互作用，并展示了可扩展性和可迁移性。

LMSYS-Chat-1M：一种大规模真实 LLM 对话数据集

BriefGPT - AI 论文速递 ·

通过训练用户模拟器 UserGPT 和生成合成对话数据集 RealChat，实验结果显示该模型在 Vicuna-Bench 和 MT-Bench 中表现优于基线模型，手动评估结果也很竞争。通过与 LLaMA 2 模型微调，ReaLM 在 MT-Bench 中取得领先分数，展示了可扩展性和可迁移性。初步探索了训练集数据质量与模型性能之间的相互作用。

SoTaNa: 开源软件开发助手

BriefGPT - AI 论文速递 ·