1月26日,skills@1.1.1发布了互动技能发现功能,现已开源。开发者可通过npx skills find命令简化技能发现,支持27种编码代理。新命令npx skills update可简化技能维护,完整代码可在GitHub获取。
本研究提出了一种新的多任务离线多智能体强化学习算法——技能发现保守Q学习(SD-CQL),旨在解决现有方法在新任务上需重新训练的问题。SD-CQL通过重构观测值发现技能,展现出优越的任务效率和泛化能力,在14个任务集中性能提升达到65%。
本文探讨了通过扩展语言模型的参数和训练数据集来提升AI技能的有效性。研究表明,大型语言模型(LLMs)能够通过贝叶斯推理和自我反思学习提高语言理解和推理能力。此外,提出了一种新算法结合专家示范和层次变分推理,显著提升了机器人导航和操作任务的成功率。
完成下面两步后,将自动完成登录并继续当前操作。