小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
DeepMind 亮出王炸:别再手写 Agent Harness 了,AI 已经学会自己写了!

DeepMind 发布了 AutoHarness,允许 AI 自主编写规则护栏,显著提升性能。研究显示,AI 在没有护栏时失败率高达 78%。通过自我学习,AI 能在复杂游戏中快速生成准确的规则校验器,甚至超越更强大的模型。未来,工程师将更多关注设计 AI 学习环境和评估体系,而非手动编写规则。

DeepMind 亮出王炸:别再手写 Agent Harness 了,AI 已经学会自己写了!

Tony Bai
Tony Bai · 2026-06-17T00:21:05Z
Agent Skills 六万星:用 24个工程技能实现Google级工程流程

Agent Skills 是一个开源项目,旨在提升 AI 编程助手的代码质量。通过一系列命令(如 /spec、/plan、/build 等),该项目确保 AI 遵循工程规范,明确规格说明,清晰任务分解,全面测试,严格代码审查,从而解决 AI 生成代码质量不稳定的问题,使其高效、规范地工作,获得广泛关注和认可。

Agent Skills 六万星:用 24个工程技能实现Google级工程流程

极道
极道 · 2026-06-16T22:26:00Z
一个大模型从业者的 Vibe Coding 一些一线经验

本文讨论了大模型(如Code Agent)对编程工作流程的影响。随着AI技术的发展,程序员的工作模式逐渐从同步转向异步,需要管理多个Agent并优化上下文。文章还探讨了如何创建和迭代技能以提高工作效率,并强调在快速变化的环境中记录实践的重要性。

一个大模型从业者的 Vibe Coding 一些一线经验

木鸟杂记
木鸟杂记 · 2026-06-16T13:09:29Z
Anthropic暂停Claude Agent SDK订阅变更,原定生效日

Anthropic暂停了原定于6月15日实施的Claude Agent SDK计费变更,以减轻开发者负担,因新计费模式可能导致成本增加。公司正在调整计费策略,以更好地支持用户需求。

Anthropic暂停Claude Agent SDK订阅变更,原定生效日

The New Stack
The New Stack · 2026-06-16T12:07:51Z
基于 AWS 智能设备助手行业资产,构建社交渠道触达的消费级 Agent 交互应用

本文探讨了基于AWS的智能设备助手(IDA)如何通过社交渠道(如Telegram)实现消费级Agent交互。IDA利用自然语言处理和多轮对话,简化了设备控制和调度,提升了用户体验和研发效率。

基于 AWS 智能设备助手行业资产,构建社交渠道触达的消费级 Agent 交互应用

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-06-16T06:59:12Z
上线首月吸引 10 万开发者,AnySearch 为 Agent 解锁网页之外的世界

AnySearch是一款专为AI Agent设计的搜索服务,旨在提升搜索质量并减少搜索调用次数。上线首月吸引了10万开发者,成为热门工具。它采用自建数据管线,确保数据质量和稳定性,未来将继续迭代技术以推动商业化发展。

上线首月吸引 10 万开发者,AnySearch 为 Agent 解锁网页之外的世界

量子位
量子位 · 2026-06-16T01:32:25Z

At WWDC 2026, Apple introduced Xcode 27, which makes it easy to kick off tasks with coding agents, iterate on new project ideas, and customize the workspace. It also introduces DeviceHub for...

Xcode 27 Extends Agent Integration, Revamps UI, and Introduces DeviceHub

InfoQ
InfoQ · 2026-06-15T21:00:00Z
Agent时代,华为云开始重新造地基了

华为云在INSPIRE大会上发布了一系列Agentic基础设施,旨在解决Agent时代的算力、记忆、调度和安全问题。新产品包括AICS灵衢智算集群、AMS记忆存储、CCE Volcano Next和AgentSphere,分别提升算力、记忆能力、资源调度和安全性。此外,华为云推出了行业AI梦工厂,支持医疗和具身智能等领域的AI应用。

Agent时代,华为云开始重新造地基了

量子位
量子位 · 2026-06-15T03:40:26Z
Hermes Agent AI 助手与墨梅博客更新 | 2026 年第 24 周草梅周报

本文介绍了墨梅博客最新版本1.20.0,新增友链管理和Umami分析集成功能。同时讨论了Hermes Agent作为AI助手的优势,特别是在安全性和自学习能力方面,并分享了使用经验和技巧。期待未来的更新与改进。

Hermes Agent AI 助手与墨梅博客更新 | 2026 年第 24 周草梅周报

草梅友仁的博客
草梅友仁的博客 · 2026-06-14T14:08:37Z
HDC 2026 深度解构:鸿蒙全面向 Agent 架构演进,小艺做了这三件事

华为在HDC 2026上展示了小艺的智能化进步,用户只需一句话即可调度多个应用。小艺通过鸿蒙智能体框架2.0与系统深度融合,提升了用户体验,推动了“意图即服务”的理念。华为计划在2024至2026年间实现整个操作系统的Agent化,形成智能协作的生态系统。

HDC 2026 深度解构:鸿蒙全面向 Agent 架构演进,小艺做了这三件事

爱范儿
爱范儿 · 2026-06-14T12:00:50Z

自主编程正从“更好的提示词”转向“更好的控制系统”。工程师们通过目标、评估器和循环设计自主编程 Agent,使其在无须人类干预的情况下持续工作。目标定义期望的最终状态,评估器验证成果,循环系统监控进度并调整指令,确保 Agent 在失败时能继续尝试。有效的验证器和可视化工具是实现自主性的关键,帮助工程师优化工作流程和提高效率。

【译文】自主长时运行编程 Agent

电波障害
电波障害 · 2026-06-14T01:00:00Z
Agent 时代的软件接口

本文探讨了如何在复杂虚拟环境中利用大模型(Agent)稳定执行任务。通过分析 Minecraft 中的开源项目,提出使用领域特定语言(DSL)和有向无环图(DAG)来简化任务处理。构建语义脚手架可以提高 Agent 生成建筑蓝图或量化投资策略的效率,降低错误率并增强自我修复能力。强调将复杂业务抽象为可验证的工作流,以适应未来 AI 系统的需求。

Agent 时代的软件接口

构建我的被动收入
构建我的被动收入 · 2026-06-14T00:00:00Z
Agent终于长出了身体:Jiuwen Symbiosis背后的思考与实践

当前AI的最大局限在于缺乏身体,无法与物理世界互动。openJiuwen社区推出Jiuwen Symbiosis架构,旨在赋予AI感知和行动能力,推动数字世界向物理现实的转变。该系统通过共享工作空间和态势感知环,提升Agent的任务执行能力,实现人机共生。未来,物理AI将通过自然语言指令完成复杂任务,促进智能系统的进化与开放合作。

Agent终于长出了身体:Jiuwen Symbiosis背后的思考与实践

量子位
量子位 · 2026-06-13T08:11:07Z
AI 范式雷达:《Agent安全新范式:从静态对齐到动态诊断护栏》

AgentDoG 1.5 是一个轻量级的安全对齐框架,利用轨迹级诊断引擎和推理增强方法,实现静态安全分类到动态实时防护的转变。该框架识别跨步骤的累积风险,提升安全判断准确性,并支持免训练在线护栏设计,降低部署复杂度。研究显示,7B 参数模型在 R-judge 基准测试中达到了 GPT-5.4 级别的安全性能,为中小团队提供高效的安全解决方案。

AI 范式雷达:《Agent安全新范式:从静态对齐到动态诊断护栏》

Micropaper
Micropaper · 2026-06-13T00:00:00Z
AI 范式雷达:《Agent评估新标准:用A2A+MCP协议实现基准即Agent》

《AgentBeats》论文提出了AAA(Agentified Agent Assessment)范式,通过将基准视为独立的Judge Agent,利用A2A协议和MCP工具实现评估标准化。在五个月的开放竞赛中,该框架成功协调298个Judge Agent对467个Subject Agent的评估,显著降低了集成复杂度,解决了传统评估方法的可扩展性和可复现性问题。

AI 范式雷达:《Agent评估新标准:用A2A+MCP协议实现基准即Agent》

Micropaper
Micropaper · 2026-06-13T00:00:00Z

Google's Angular team has released a repository called angular/skills, focusing on Agent Skills that enhance AI coding agents' ability to write modern Angular code. The repository includes skills...

Angular's Official Agent Skills Helps AI Coding Tools Write Modern Angular

InfoQ
InfoQ · 2026-06-12T13:30:00Z
基于 Amazon Bedrock AgentCore 与 AWS DevOps Agent 打造对话式多账户运维助手

本文介绍了一套基于Amazon Bedrock AgentCore的多账户智能运维系统,具备闲置资源检测、AI智能巡检和跨账户根因调查功能。该系统通过飞书/钉钉实现自然语言对话式运维,显著提升了运维效率和成本优化,已在生产环境中验证了100%巡检覆盖率。未来计划扩展资源类型和多语言支持。

基于 Amazon Bedrock AgentCore 与 AWS DevOps Agent 打造对话式多账户运维助手

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-06-12T05:44:19Z

清华大学发布的《2026智能体安全研究报告》强调智能体安全的重要性,指出安全威胁包括输入、模型、输出、记忆和执行五大维度。报告提出了系统化的威胁模型和评测框架,并建议建立五层防御体系,最后提供了90天的实施路线图,以帮助企业安全部署智能体。

清华80页报告拆解Agent安全落地路线

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2026-06-11T23:13:00Z
Agent 时代,需要一台能折叠的「移动工作台」|AIDONE 5.0 全记录

在AI时代,设备设计应以AI为中心,强调任务流整合与折叠屏的潜力。未来设备将围绕用户意图,提升工作效率,AI将成为用户的助手。

Agent 时代,需要一台能折叠的「移动工作台」|AIDONE 5.0 全记录

爱范儿
爱范儿 · 2026-06-11T09:00:35Z
1290万高考生看过来!阿里出了个志愿填报Agent,免费的

阿里千问推出高考志愿填报Agent,利用AI为考生提供志愿填报咨询。该Agent结合Qwen大模型和丰富数据,帮助考生在高校中做出选择,提供志愿日历、个性化建议和风险分析,覆盖填报全过程。通过模拟考生数据,Agent优化推荐,增强用户信任,旨在减少信息差,支持更多考生。

1290万高考生看过来!阿里出了个志愿填报Agent,免费的

量子位
量子位 · 2026-06-11T07:25:55Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码