小红花·文摘 - 小红花技术领袖俱乐部

该文章介绍了一种机器-人类管道，通过使用基于LLM的代理体系结构和将对话与人物和时间事件图进行关联，生成高质量的非常长期的对话。作者通过人类注释者对对话进行检验和编辑，以确保其长程一致性和对事件图的关联。实验结果表明，LLM在理解冗长对话和理解对话中的长程时间和因果动态方面存在挑战。使用长上下文LLM或RAG等策略可以提供改进，但这些模型仍然远远落后于人类的性能。

未知未知领域中的参与式人类学习

BriefGPT - AI 论文速递 ·

该文章介绍了一种机器-人类管道，通过使用基于LLM的代理体系结构和将对话与人物和时间事件图进行关联，生成高质量的非常长期的对话。作者通过人类注释者对对话进行检验和编辑，以确保其长程一致性和对事件图的关联。实验结果表明，LLM在理解冗长对话和理解对话中的长程时间和因果动态方面存在挑战。使用长上下文LLM或RAG等策略可以提供改进，但这些模型仍然远远落后于人类的性能。

大语言模型的自导图灵测试

BriefGPT - AI 论文速递 ·

本文介绍了一种机器-人类管道，通过使用基于LLM的代理体系结构和将对话与人物和时间事件图进行关联，生成高质量的非常长期的对话。实验结果表明，LLM在理解冗长对话和理解对话中的长程时间和因果动态方面存在挑战。

适用于对话的不同技术方法评估：微调还是 RAG？

BriefGPT - AI 论文速递 ·