康奈尔大学等研究者提出了双模式推理框架ALAR,智能体在常规决策中使用紧凑潜在推理,在复杂决策时切换到显式思维链。该方法显著减少Token消耗,搜索任务中最高减少43.6%,工具使用场景中高达84.6%。ALAR提高了效率,降低了成本和响应时间,但潜在推理的可解释性较低。
完成下面两步后,将自动完成登录并继续当前操作。