小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Hermes Agent是Nous Research开发的自我改进AI助手,具备持久记忆和自动技能进化能力,支持多种工具和平台,能够执行命令和浏览器操作。Hermes完全开源,用户可在多种环境中运行,使用时间越长,越能适应个人需求。

Hermes Agent 使用指南

安志合的学习博客
安志合的学习博客 · 2026-04-19T13:39:24Z
OpenClaw与Hermes代理框架技能管理与自改进深度对比

本文对比了AI代理框架OpenClaw与Hermes在技能管理上的差异。Hermes通过自我编写技能实现自我改进,但可能导致技能冗余;而OpenClaw则强调用户主导的精确控制,避免技能爆炸。两者各有优缺点,用户可根据需求选择。

OpenClaw与Hermes代理框架技能管理与自改进深度对比

极道
极道 · 2026-04-17T22:23:00Z
Meta华人实习生搞出超级智能体!自己写代码实现自我进化

Meta研究团队推出了新一代超级智能体——达尔文哥德尔机(DGM),结合了哥德尔机与开放算法,实现自我迭代与改进。DGM在编程任务中表现出色,但在非编程领域存在局限。实验表明,DGM通过自我修改代码库显著提升性能,展现出强大的自我改进能力。

Meta华人实习生搞出超级智能体!自己写代码实现自我进化

量子位
量子位 · 2026-03-31T04:32:28Z
SIMA 2利用Gemini和自我改进在未见的3D和真实感世界中实现泛化

Google DeepMind推出SIMA 2,这是一种基于Gemini模型的通用智能体,能够在多个3D虚拟环境中理解和行动。与前版本相比,SIMA 2具备制定多步计划和与用户讨论策略的能力。研究显示,该智能体在游戏测试中接近人类表现,并能在新环境中自我改进。SIMA 2的应用潜力包括机器人领域,但仍面临复杂任务的挑战。

SIMA 2利用Gemini和自我改进在未见的3D和真实感世界中实现泛化

InfoQ
InfoQ · 2025-12-29T11:05:00Z
解码代理人工智能:自主系统的崛起

代理人工智能(Agentic AI)是能够自主规划、行动和自我改进的系统,代表了AI的重大进步。与传统模型不同,代理AI具备多步骤自主性,能够设定目标、执行计划并总结结果。其核心模块包括规划、记忆和工具使用,使其能够适应环境并持续学习,从而提高效率和准确性。

解码代理人工智能:自主系统的崛起

KDnuggets
KDnuggets · 2025-11-18T17:30:40Z
使用Spring AI进行LLM响应评估:基于递归顾问构建LLM作为评判者

使用Spring AI的递归顾问,LLM作为评判者的方法能够有效评估大型语言模型的输出。该方法通过直接评估和成对比较,克服了传统评估方法的不足,提高了AI生成内容的质量,并支持自我改进的AI系统。

使用Spring AI进行LLM响应评估:基于递归顾问构建LLM作为评判者

Spring
Spring · 2025-11-10T00:00:00Z
《Agentic Design Patterns:构建智能系统的实战指南》- 第九章 学习与适应

本文介绍了《智能体设计模式》第九章,讨论智能体如何通过学习与适应提升性能,涵盖强化学习、监督学习、无监督学习等方法,以及自我改进编码智能体(SICA)和Google的AlphaEvolve系统,强调智能体在动态环境中的自主学习与优化能力。

《Agentic Design Patterns:构建智能系统的实战指南》- 第九章 学习与适应

实时互动网
实时互动网 · 2025-10-28T02:56:20Z
Agent设计模式——第 9 章:学习和适应

学习和适应是提升人工智能代理能力的关键。通过强化学习、监督学习和无监督学习,代理能够自主改进和优化性能。自我改进编码代理(SICA)展示了代理如何通过修改自身代码来增强能力。Google的AlphaEvolve结合大语言模型和进化算法,发现新算法,推动科学研究和计算技术的发展。

Agent设计模式——第 9 章:学习和适应

XINDOO的博客
XINDOO的博客 · 2025-10-04T15:59:58Z

本研究探讨了宪法AI在小型模型(如LLaMA 3-8B)中的应用,发现其能有效提升模型的无害性,但有用性有所下降。同时,小型模型在自我改进方面面临挑战,出现崩溃迹象。

Constitution or Collapse? Exploring Constitutional AI and LLaMA 3-8B

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-07T00:00:00Z
为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理

研究表明,不同语言模型在自我改进能力上存在显著差异。Qwen-2.5-3B在强化学习中优于Llama-3.2-3B,因其具备关键的认知行为,如验证和回溯。通过引导Llama学习这些行为,模型性能显著提升,表明认知行为对有效利用计算资源至关重要。

为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理

机器之心
机器之心 · 2025-03-05T06:54:54Z

本研究探讨了扩展思维链(CoT)长度对大型语言模型(LLM)在复杂推理任务中的影响,结果表明CoT过度扩展可能损害LLM的推理能力。研究提出了一种思维最佳尺度策略,通过优化推理努力提升模型自我改进能力,效果显著。

Towards an Optimal Thinking Scale for Test-Time Computation in LLM Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-25T00:00:00Z

本研究提出了一种自我改进的方法,以解决大型语言模型在复杂任务中的表现不足。通过模型自我生成解决方案并进行学习,显著提升了其在训练分布外的表现。

Self-Improving Transformers Overcoming Challenges from Simple to Complex and Length Generalization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-03T00:00:00Z
在技术奇点中测试人工智能:探索超智能的未知领域

技术奇点是指人工智能超越人类智能的时刻,可能导致文明重大变化。测试超智能AI面临定义、不可预测性和自我改进等挑战。研究者提出能力基准、自我改进监测、目标一致性测试和模拟分析等方法。确保安全和价值对齐是应对伦理和生存风险的关键。

在技术奇点中测试人工智能:探索超智能的未知领域

DEV Community
DEV Community · 2025-01-29T00:46:51Z
游戏结束了?OpenAI可能已经突破,跨过起飞的最后临界阈值

OpenAI 的研究表明,其 AI 模型可能已达到自我改进的阶段,且难以被破解。推文引发热议,讨论其突破性进展及未来自动化 AI 研发的潜力。研究员强调了强化学习的重要性。

游戏结束了?OpenAI可能已经突破,跨过起飞的最后临界阈值

机器之心
机器之心 · 2025-01-17T05:16:32Z
Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境

自适应大语言模型(LLM)通过动态调整权重,实时适应不同任务,提高学习效率。日本初创公司Sakana AI的Transformer^2框架在多任务上表现优于传统方法,预示未来AI模型将具备持续学习和自我改进能力。

Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境

机器之心
机器之心 · 2025-01-15T07:08:01Z
运行和测试代码的AI编程代理

Fine在圣诞节推出了AI Sandboxing和Live Previews两个新功能,允许AI代理在独立云环境中创建新分支、编辑代码并实时查看效果,促进开发者调试和反馈。这标志着AI编程代理在自我评估和改进方面的重要进展。

运行和测试代码的AI编程代理

DEV Community
DEV Community · 2024-12-25T11:25:20Z

本研究探讨了大型语言模型在推理过程中的自我改进现状,指出独立性、自我感知及模型协助自我改进领域的研究不足,为未来研究提供了重要见解。

A Survey on Self-Improvement of Large Language Models During Inference

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究提出VISCO基准,以评估和纠正大规模视觉语言模型(LVLMs)在自我改进中的推理能力。研究表明,经过人类评判后,模型性能显著提升,而自生成评判效果不佳,强调了提升评判能力的重要性。

VISCO: A Benchmark for Fine-Grained Evaluation and Correction to Promote Self-Improvement in Visual Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z

本研究提出了一种自我改进的方法,显著提升了Llama-3.1-8B-Instruct模型在长上下文推理中的表现,推动了该领域的发展。

大型语言模型可以在长上下文推理中自我改进

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-12T00:00:00Z

我们提出了一种方法,通过大型语言模型的示范,将推理能力传递给较小模型,并通过优化策略提升其自我改进能力。结果表明,该方法在常识和数学推理任务中表现出色,使较小模型的推理能力逐渐接近大型模型。

SMART:自学习元策略代理用于推理任务

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码