【外评】LLM大型语言模型与哈利波特问题

原文约3600字，阅读约需9分钟。发表于：。

想象一下，你提供一个 LLM《哈利-波特》里的一章，让它数一数 "巫师 "这个词被提到了多少次。GPT4、Claude 3 Opus、Gemini Ultra 和 Mixtral，但在这项任务中都失败了。

长上下文的语言模型（LLM）在处理长文档时存在问题，被称为“哈利-波特问题”。传统的RAG、微调和代理方法都无法解决这个问题。解决方法是为每个长文档建立自己的视角和本体论，并进行摄取和检索管道的建立。此外，将文档视为百科全书处理，并建立目录和引文列表也有帮助。对于个人文档，需要选择文件类别、提出信息和关系，并进行实验。