小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

OpenAI发布的GPT-5.5是迄今最智能的模型,能够自主拆解和完成复杂任务,显著提升编程效率。尽管价格翻倍,但在复杂任务中的性价比有所提高。AI助手的角色转变为执行者,用户需专注于需求描述和结果评估。GPT-5.5的发布标志着AI从“会聊天”到“能干活”的质变,普通人需学习如何与AI共事。

GPT-5.5 发布:OpenAI 这次真的在”干活”了

王佳冬中文博客
王佳冬中文博客 · 2026-04-29T03:04:55Z
AI长程编程|一文搞懂什么是 Long-Horizon Coding?

长程编码是指AI通过多次尝试和调整,在长时间内完成复杂软件工程任务的能力。这一概念与通用人工智能(AGI)密切相关,标志着AI从简单的回答机器转变为能够独立执行任务的智能体。尽管这一能力在2026年受到广泛关注,但在实际应用中仍面临上下文管理、错误累积和规划能力等挑战。

AI长程编程|一文搞懂什么是 Long-Horizon Coding?

人言兑
人言兑 · 2026-04-25T10:06:28Z
π0.7——4层prompt下的技能组合泛化能力:先高层策略基于指令历史和当前画面输出子任务指令,后世界模型基于子任务指令生成子目标图像

π0.7是一种新型通用机器人模型,具备强大的组合泛化能力。通过多模态数据和详细上下文标注,该模型能够有效执行多样化任务,并在新任务中展现灵巧技能。它结合了人类视频和机器人自主数据,提升了在复杂环境中的表现。引入子目标图像和任务元数据增强了模型的指令理解和执行能力,使其在多样化数据上训练时表现出色。

π0.7——4层prompt下的技能组合泛化能力:先高层策略基于指令历史和当前画面输出子任务指令,后世界模型基于子任务指令生成子目标图像

结构之法 算法之道
结构之法 算法之道 · 2026-04-19T09:37:07Z
OpenClaw 运维 - 让飞轮转起来

OpenClaw 是一个自我进化的运维系统,能够通过配置和技能安装执行任务及监测系统状态,依赖标准操作流程和事件监测,提供统一访问入口,提升运维效率。

OpenClaw 运维 - 让飞轮转起来

陈少文的博客
陈少文的博客 · 2026-04-11T00:00:00Z
一分钟读论文:《2026 年 AI 智能体编排:生成式 AI 的未来演进》

生成式AI(GenAI)与智能体AI(Agentic AI)有明显区别:GenAI擅长内容生成,但缺乏自主执行任务的能力;而Agentic AI能够主动规划和执行复杂任务。理解这两者的差异有助于技术选择和应用场景的确定。

一分钟读论文:《2026 年 AI 智能体编排:生成式 AI 的未来演进》

Micropaper
Micropaper · 2026-04-10T00:00:00Z
顾问策略:为智能体提升智能水平

开发者采用顾问策略,将Opus与Sonnet或Haiku配对,以实现智能与成本的平衡。新顾问工具简化了API调用,使Sonnet或Haiku在遇到问题时可咨询Opus,从而提高任务执行效率,适合高频任务。

顾问策略:为智能体提升智能水平

Claude
Claude · 2026-04-09T00:00:00Z
2026 AI 开发新范式:Harness Engineering(驾驭工程)为何是智能体的决胜点?

2026年,AI开发的关键在于“驾驭工程”,确保AI在无人干预下稳定、安全地完成复杂任务。文章探讨了提示词工程、上下文工程与驾驭工程的关系,强调驾驭工程的重要性,并构建了AI智能体的完整系统。通过有效的工程方法,AI能够更好地执行任务,提升应用的可靠性。

2026 AI 开发新范式:Harness Engineering(驾驭工程)为何是智能体的决胜点?

王欣的博客
王欣的博客 · 2026-04-05T02:00:00Z
飞书 CLI 开源了,为什么 AI Agent 时代,大家都在做命令行工具?

飞书开源了命令行工具lark-cli,允许AI Agent直接在飞书上执行任务,如发送消息和查询日历。CLI因其自描述性和文本交互优势,适合AI使用,且相比MCP和技能更灵活,能够即时执行命令。一个设计良好的CLI应提供详细帮助信息、支持dry-run和结构化数据输出,以提高AI的操作效率。飞书的CLI为AI Agent提供了友好的企业级接入,推动了AI在企业中的应用。

飞书 CLI 开源了,为什么 AI Agent 时代,大家都在做命令行工具?

宝玉的分享
宝玉的分享 · 2026-03-28T00:00:00Z

Anthropic 承认 Claude Code 在工作日高峰期配额消耗加快,约 7% 的用户会更快触发限制。自 3 月 23 日起,用户反映配额消耗过快,影响任务执行时间。公司未提前通知调整,建议开发者在非高峰期执行大任务。

Claude Code配额消耗速度比以前更快?A社承认已经调整配额分配方式

蓝点网
蓝点网 · 2026-03-27T04:22:49Z
OpenClaw:技术解读和给 AI 应用开发的启示(2026)

OpenClaw 是一种基于大模型技术的个人助手,整合任务执行、系统协作和记忆机制。它通过 WhatsApp、Telegram 等应用执行任务,注重实用性,旨在提供稳定的工作环境,支持用户交互和外部系统接入。

OpenClaw:技术解读和给 AI 应用开发的启示(2026)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2026-03-24T00:00:00Z
OpenClaw真的那么神吗?技术架构解密

OpenClaw是一个开源数字员工框架,通过聊天工具和Agent编排来执行任务。尽管其具有显著的普及意义,但在实际应用中面临Token消耗和执行错误等问题。成功的关键在于行业标准流程和数据治理。

OpenClaw真的那么神吗?技术架构解密

程序新视界
程序新视界 · 2026-03-10T23:30:50Z

蚂蚁灵波开源的LingBot-VLA是当前最强的具身智能模型,基于20000小时真实数据,超越多个国际顶尖模型。它通过真实世界数据训练,解决了机器人在环境变化中的适应问题,展现出强大的泛化能力和高效的任务执行能力,为通用人工智能的发展提供了新路径。

蚂蚁具身智能明牌了:做大脑,和宇树们错位竞争

量子位
量子位 · 2026-01-28T11:08:31Z
最强开源模型易主?Kimi 发布 k2.5 用 Agent 集群解决长文本+视觉生成

月之暗面发布了开源模型Kimi k2.5,称其为最强大的开源模型。该模型基于1.5T混合视觉与文本预训练,具备视觉智能体系统,支持1500次并行工具调用,显著提升任务执行效率。Kimi k2.5能够从自然语言生成完整前端界面,并具备视觉调试能力,成为开源界的新王。

最强开源模型易主?Kimi 发布 k2.5 用 Agent 集群解决长文本+视觉生成

爱范儿
爱范儿 · 2026-01-28T08:59:01Z
在Kotlin中构建AI代理 – 第五部分:教代理忘记

本文探讨了在复杂任务中实现智能压缩的方法,以防止代理因上下文超限而崩溃。通过调整策略,代理在执行工具后检查历史记录大小,提取重要信息并丢弃冗余内容,从而延长任务执行时间。关键在于设定压缩阈值和选择保留的信息,以确保代理持续有效工作。

在Kotlin中构建AI代理 – 第五部分:教代理忘记

The JetBrains Blog
The JetBrains Blog · 2026-01-26T16:09:12Z
opencode多智能体

本文介绍了多智能体架构的工作机制,主智能体负责理解用户意图并拆解任务,子智能体执行具体任务。通过委托机制和会话管理,主智能体与子智能体高效协作,确保上下文隔离和任务结果回传。整体流程包括初始化、决策、子会话创建、子智能体执行、结果回传及父会话恢复。

opencode多智能体

plus studio
plus studio · 2026-01-20T00:00:00Z
现在 GA:LangSmith 代理构建器

Agent Builder是一个智能助手,帮助用户实现目标并根据反馈优化工作流程。用户只需描述需求,Agent Builder便能制定计划并执行任务,适合处理日常工作,支持团队创建无代码代理,提高工作效率。

现在 GA:LangSmith 代理构建器

LangChain Blog
LangChain Blog · 2026-01-13T16:00:38Z

智能体SmartSnap通过自我验证提升任务执行效率,主动收集证据以降低验证成本,使其从被动执行者转变为主动自证者,显著提高性能和交互效率,未来将推动AI的可靠性和低成本部署。

智能体卷王诞生!干活自动配结项报告,1.5张截图就把事说清了

量子位
量子位 · 2026-01-10T06:39:44Z
技术速递|从概念到代码:使用 Microsoft Foundry 构建生产就绪的多智能体系统

微软的AI发展正从内容生成转向任务执行与流程自动化。通过Microsoft Foundry,开发者可利用低代码工具优化招聘流程,支持可视化集成,简化复杂业务逻辑,实现AI与企业应用的结合。

技术速递|从概念到代码:使用 Microsoft Foundry 构建生产就绪的多智能体系统

dotNET跨平台
dotNET跨平台 · 2025-11-29T00:34:40Z
在深度代理中使用技能

Anthropic推出了代理技能的概念,技能是包含SKILL.md文件的文件夹,代理可以动态加载以提升任务执行能力。通用代理如Claude Code和Manus使用的工具数量较少,但通过访问计算机和文件系统,代理能够执行多种操作。技能提高了令牌效率,减少了认知负担,并支持持续学习与共享。深度代理CLI现已支持技能,用户可以轻松创建和使用技能。

在深度代理中使用技能

LangChain Blog
LangChain Blog · 2025-11-25T16:45:09Z
谷歌推出了其迄今为止最智能的AI模型Gemini 3

谷歌推出了最新的AI模型Gemini 3 Pro,声称其为“最智能”和“最准确”的模型。该模型支持文本、图像和音频的多模态处理,能够生成更丰富的视觉内容,并具备更强的推理和任务执行能力,帮助用户完成复杂任务。

谷歌推出了其迄今为止最智能的AI模型Gemini 3

The Verge
The Verge · 2025-11-18T16:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码