小红花·文摘

本研究提出了一种新的基于块的推理方法，以提高长上下文递归大型语言模型的性能。实验结果显示，该方法在LongBench v2基准测试中显著提升了多种模型的表现，质疑了递归模型处理长距离依赖关系的有效性。

BriefGPT - AI 论文速递 ·

Apple Machine Learning Research ·

本文比较了递归模型与基于梯度的元学习方法的表达能力，发现基于梯度的方法具有更强的推广性。研究了多种元学习算法在少样本分类和回归任务中的表现，并提出了新的正则化方法以增强模型的泛化能力，最后总结了元学习领域的现状及未来研究方向。

BriefGPT - AI 论文速递 ·