OpenAI发布了GPT-5.1-Codex-Max,突破了上下文窗口限制,支持长达24小时的连续工作,显著提升了任务效率。该模型在软件工程任务中表现优异,能够处理复杂任务并减少token消耗,尤其适合长时间运行的任务,并支持与多种工具结合使用。
本研究提出了一种元计划优化(MPO)框架,以提升大型语言模型代理在互动规划任务中的能力。MPO通过引入明确指导和根据任务反馈进行持续优化,显著提高了任务效率和泛化能力。实验结果表明,MPO优于现有方法。
本研究提出了一种新颖的进化框架,旨在提高基于大型语言模型的图形用户界面代理在常规任务中的效率。通过内存机制记录任务历史,识别重复动作,显著提升了操作的效率和准确性。实验结果表明,该方法在多个基准任务中优于现有技术,具有重要应用潜力。
本文探讨了多模态人工智能代理YETI在日常任务中的主动干预能力,弥补了被动模型的不足。YETI通过分析视频帧的结构相似性信号,智能识别介入时机,显著提升用户在增强现实环境中的任务完成效率与体验。
本研究探讨语言模型在推理中跳过步骤的能力,提出了一种控制框架以生成更短且准确的推理路径。研究发现,在指导下,模型的任务效率和精确性得以提升,同时展现出更强的泛化能力。
我们提出了一种新方法,使LLM智能体具备自省能力,从而提升其在复杂任务中的一致性和适应性。该方法通过任务分解和持续自省,展现出优于现有技术的性能,提高了应对挑战的能力和任务效率。
本研究提出了一种新的异质预训练变压器架构(HPT),用于解决机器人模型训练中的异质性问题。通过在不同机器人数据和任务上预训练,该方法有效对齐不同机器人姿态的输入,显著提高多个任务的策略表现,尤其在未见任务上效率提升超过20%。
完成下面两步后,将自动完成登录并继续当前操作。