小红花·文摘

如何构建智能代理

LangChain Blog ·

OpenAI Agents SDK与Responses API介绍

The New Stack ·

本研究评估大型语言模型（LLM）代理的自我推理能力，填补了代理任务研究的空白。通过考察自我修改和知识寻求等情境，发现只有前沿模型具备此能力，且高度依赖上下文。未来模型的提升可通过评估测量实现。

测量前沿模型的工具自我推理能力

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLM）在代理任务中的应用，比较了其与传统人工智能代理在自然语言处理和推理能力方面的优势。研究提出了AgentTuning方法，以提升LLM的代理能力，并介绍了一个综合框架来增强任务规划和工具使用能力。实证研究展示了LLM在复杂环境中的潜力，强调了其在自动化生产系统中的应用及未来发展方向。

实时智能体的异步工具使用

BriefGPT - AI 论文速递 ·

本研究探讨了视觉和语言推理的相互作用，评估了 Vision-and-language 模型对于空间理解的忠实度，并设计了代理任务来训练模型，取得了显著的表现改善。

视觉语言模型中的问题：探究其在空间推理方面的挑战

BriefGPT - AI 论文速递 ·

通过替换原始帧为语义分割地图，我们引入了从单帧进行未来视频预测的代理任务，克服了学习长动态模式的挑战，并在基准数据集上展示了其有效性和优越性。

单帧未来视频预测用于视频异常检测

BriefGPT - AI 论文速递 ·