提升长期对话生成中对话之间的差距
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本文介绍了Conversation Chronicles数据集和ReBot对话模型,用于实现长期对话设置。数据集包含时间间隔和细粒度的发言者关系,模型具有高人类参与度的长期上下文理解能力。该模型由仅约630M个参数的按时间顺序总结和对话生成模块组成。
🎯
关键要点
- 开放领域聊天机器人研究主要集中于短期单次对话,忽视了长期对话的上下文理解需求。
- 多会话对话设置中,时间间隔和发言者关系对上下文理解至关重要。
- 引入了一个新的对话数据集Conversation Chronicles,包含100万多会话,强调时间间隔和细粒度的发言者关系。
- Conversation Chronicles中的对话片段经过广泛的人工评估,显示出一致和连贯的互动特性。
- 提出了对话模型ReBot,具有约630M个参数,专注于按时间顺序的总结和对话生成。
- ReBot在Conversation Chronicles上训练后,展现出高人类参与度的长期上下文理解能力。
🏷️
标签
➡️