提升长期对话生成中对话之间的差距

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

本文介绍了Conversation Chronicles数据集和ReBot对话模型,用于实现长期对话设置。数据集包含时间间隔和细粒度的发言者关系,模型具有高人类参与度的长期上下文理解能力。该模型由仅约630M个参数的按时间顺序总结和对话生成模块组成。

🎯

关键要点

  • 开放领域聊天机器人研究主要集中于短期单次对话,忽视了长期对话的上下文理解需求。
  • 多会话对话设置中,时间间隔和发言者关系对上下文理解至关重要。
  • 引入了一个新的对话数据集Conversation Chronicles,包含100万多会话,强调时间间隔和细粒度的发言者关系。
  • Conversation Chronicles中的对话片段经过广泛的人工评估,显示出一致和连贯的互动特性。
  • 提出了对话模型ReBot,具有约630M个参数,专注于按时间顺序的总结和对话生成。
  • ReBot在Conversation Chronicles上训练后,展现出高人类参与度的长期上下文理解能力。
➡️

继续阅读