本文介绍了InfiniRetri,一种新颖的无训练方法,利用大型语言模型的注意力机制,实现理论上无限长度输入的准确检索。该方法通过分析注意力分布与生成答案的关系,显著提升了长文本任务的表现,尤其在问答中表现优异。在Needle-In-a-Haystack测试中实现了100%准确率,并在LongBench等基准测试中显示出显著改进。
完成下面两步后,将自动完成登录并继续当前操作。