💡
原文英文,约200词,阅读约需1分钟。
📝
内容提要
大型语言模型和对话助手的发展需要动态、可扩展的对话数据集。知识图谱为生成最新的对话KGQA数据集提供了基础。我们提出了ConvKGYarn,能够生成高质量、可配置的数据集,以适应多种用户交互模式,提升对话助手性能。
🎯
关键要点
- 大型语言模型和对话助手的发展需要动态、可扩展的对话数据集。
- 这些数据集必须适应多种用户交互模式,包括文本和语音。
- 知识图谱提供了生成最新对话KGQA数据集的基础。
- 现有的人类策划的KG基础对话数据集难以跟上快速变化的用户信息需求。
- 我们提出了ConvKGYarn,一种可扩展的方法,用于生成最新和可配置的对话KGQA数据集。
- ConvKGYarn在生成高质量数据方面表现出色,能够与流行的对话KGQA数据集相媲美。
- ConvKGYarn能够遵循人类交互配置,并在更大规模上运行。
- 通过测试LLMs在不同配置下的对话,展示了ConvKGYarn的实用性。
- ConvKGYarn能够改善KGQA基础,并评估LLMs的参数知识,提供了对话助手不断演变的强大解决方案。
➡️