小红花·文摘

华为发布的扩散语言模型DLLM Agent提升了执行速度超过30%，在复杂任务中效率可达传统模型的8倍。研究显示，DLLM在多轮推理和工具调用中展现出更强的规划能力，减少了交互次数，优化了任务执行路径，为Agent设计提供了新视角，强调生成范式对行为方式的影响。

量子位 ·

本研究探讨了多轮推理在大语言模型中的应用，提出了一种通过多轮推理近似图灵可计算函数的方法。研究结果表明，即使序列长度超出模型的上下文窗口，仍能有效学习并降低泛化误差，从而推动多轮序列学习与推理的理论基础发展。

BriefGPT - AI 论文速递 ·

本文介绍了LVLM-eHub综合评估平台，利用多模态能力评估视觉基准，提出多轮推理框架以缓解对象幻觉问题。研究表明，引入双重聚焦机制和无训练算法后，视觉-语言任务性能得到了提升，偏见和幻觉现象减少，模型对图像内容的关注增强。

BriefGPT - AI 论文速递 ·