小红花·文摘

随着技术进步，AI逐渐意识到与人类开发速度的差异。当前AI在复杂任务中仍依赖传统开发思路，未能充分发挥潜力。未来，AI将以更高效的方式完成任务，逐渐意识到自身的强大。

Est's Blog ·

量子位 ·

OpenAI发布了GPT-5.1-Codex-Max，突破了上下文窗口限制，支持长达24小时的连续工作，显著提升了任务效率。该模型在软件工程任务中表现优异，能够处理复杂任务并减少token消耗，尤其适合长时间运行的任务，并支持与多种工具结合使用。

量子位 ·

本研究提出了一种元计划优化（MPO）框架，以提升大型语言模型代理在互动规划任务中的能力。MPO通过引入明确指导和根据任务反馈进行持续优化，显著提高了任务效率和泛化能力。实验结果表明，MPO优于现有方法。

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的进化框架，旨在提高基于大型语言模型的图形用户界面代理在常规任务中的效率。通过内存机制记录任务历史，识别重复动作，显著提升了操作的效率和准确性。实验结果表明，该方法在多个基准任务中优于现有技术，具有重要应用潜力。

BriefGPT - AI 论文速递 ·

本研究探讨语言模型在推理中跳过步骤的能力，提出了一种控制框架以生成更短且准确的推理路径。研究发现，在指导下，模型的任务效率和精确性得以提升，同时展现出更强的泛化能力。

BriefGPT - AI 论文速递 ·

本文介绍了一种基于演示学习和姿态估计的人机协作装配系统，能够适应人类操作的不确定性。实验表明，该系统在不同目标位置的适应性良好，有效提高了任务效率和安全性。此外，研究发现注视机器人是协同活动的前兆，为提升人机协同体验提供了改进方法。

BriefGPT - AI 论文速递 ·

The Berkeley Artificial Intelligence Research Blog ·