该文章介绍了一种机器-人类管道,通过使用基于LLM的代理体系结构和将对话与人物和时间事件图进行关联,生成高质量的非常长期的对话。作者通过人类注释者对对话进行检验和编辑,以确保其长程一致性和对事件图的关联。实验结果表明,LLM在理解冗长对话和理解对话中的长程时间和因果动态方面存在挑战。使用长上下文LLM或RAG等策略可以提供改进,但这些模型仍然远远落后于人类的性能。
本文介绍了一种机器-人类管道,通过使用基于LLM的代理体系结构和将对话与人物和时间事件图进行关联,生成高质量的非常长期的对话。实验结果表明,LLM在理解冗长对话和理解对话中的长程时间和因果动态方面存在挑战。
完成下面两步后,将自动完成登录并继续当前操作。