小红花·文摘

该研究探讨大型语言模型在知识编辑中过拟合的问题，尤其是在多轮推理中高估编辑目标概率的现象。提出了评估基准EVOKE，并介绍了“学习推理”（LTI）策略，通过多阶段推理约束模块，减轻过拟合，优化编辑效果。

BriefGPT - AI 论文速递 ·

Yevgen Chebotar提出的机器人变换器2（RT-2）是一种新型视觉-语言-行动（VLA）模型，结合网络和机器人数据，能够生成通用的机器人控制指令。RT-2在理解新命令和执行复杂任务方面表现出色，能够进行多阶段推理，显著提高机器人在未见环境中的表现。

Google DeepMind Blog ·