小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AI智能体安全四件套:从PII泄露到400美元账单的教训

本文分享了作者在开发AI智能体时的经验,强调了四个安全措施:输入检查、输出检查、成本断路器和工具调用检查。这些措施能有效避免隐私泄露和高额账单,确保AI安全运行。

AI智能体安全四件套:从PII泄露到400美元账单的教训

极道
极道 · 2026-06-05T02:35:00Z

作者从零开始创建一个AI代理,旨在实现聊天、管理待办事项和获取最新信息。通过学习AI基本概念和工具调用,逐步实现多轮对话和工具使用功能。尽管面临AI的“失忆症”等挑战,最终成功构建了一个能执行复杂任务的AI代理。作者总结了AI模型、工具和上下文管理的重要性,并分享了这一过程的经验。

AI Agent 干中学,「造轮子」让我学会了什么?

少数派
少数派 · 2026-05-28T07:00:00Z
迈向自主化:深度解析什么是 Agentic AI(代理式人工智能)

代理式人工智能(Agentic AI)是具备自主性、推理能力和执行能力的系统,能够独立完成复杂任务。与传统生成式AI不同,Agentic AI能自主规划、调用外部工具并自我修正。其核心架构包括规划、记忆、工具使用和多代理协作,应用于软件开发、自动化营销和个人助理等领域。尽管面临安全性和成本控制挑战,Agentic AI标志着人工智能向行动式的重大转变。

迈向自主化:深度解析什么是 Agentic AI(代理式人工智能)

极客技术博客’s Blog
极客技术博客’s Blog · 2026-05-12T21:41:35Z

该项目名为 learn-claude-code-rs,旨在用 Rust 从零开始实现类似 Claude Code 的 agent harness。它包含20个渐进章节,涵盖工具使用、权限系统、内存管理等核心机制,适合希望深入理解 coding agent 内部机制的开发者。项目提供中英文文档,欢迎反馈与贡献。

我用 Rust 写了一个从 0 到 1 学习 Claude Code Agent Harness 的项目

Rust.cc
Rust.cc · 2026-04-28T02:18:29Z
GPT-5.5系统卡片

GPT-5.5是一个新模型,专注于处理复杂的任务,如编写代码和信息分析。与之前的模型相比,它能更快理解任务,需求指导更少,工具使用更高效。发布前进行了全面的安全评估,并收集了近200个早期合作伙伴的反馈,确保其具备强大的安全措施以减少误用,同时保留合法的有益用途。

GPT-5.5系统卡片

OpenAI
OpenAI · 2026-04-23T11:00:00Z
三种难度级别解析AI代理

AI代理从单一响应转向自主执行任务,具备工具使用、规划和记忆三大核心能力。它们能够将复杂目标分解为可执行步骤,并动态调整策略以提高任务效率。构建可靠的AI代理需关注设计、状态管理和错误处理,以确保其有效性和安全性。

三种难度级别解析AI代理

KDnuggets
KDnuggets · 2026-02-10T17:00:25Z

文章介绍了如何通过MCP协议赋予智能体工具使用能力,实现自动化操作。以将Markdown文章发布到微信公众号为例,智能体连接MCP服务,利用大语言模型进行决策并调用工具,最终完成文章发布。MCP协议简化了不同API的连接,使智能体代码更具通用性。

自己写一个智能体-使用MCP服务

路边的阿不
路边的阿不 · 2026-01-15T15:30:00Z
GLM-4.7现已在Vercel AI Gateway上提供

Z.ai推出了新模型GLM-4.7,具备更强的编码、工具使用和多步骤推理能力,适合复杂任务。用户可通过AI Gateway无账户访问,享受统一API和智能路由功能。

GLM-4.7现已在Vercel AI Gateway上提供

Vercel News
Vercel News · 2025-12-22T13:00:00Z
OpenAI在QCon AI NYC:企业的微调

在2025年QCon AI NYC大会上,OpenAI的Will Hang介绍了Agent RFT,这是一种强化微调方法,旨在提升工具使用代理的性能。他强调了优化提示和任务的重要性,并提出了监督微调和偏好优化等多种微调选项。Hang指出,强化微调适合需要探索策略的任务,并强调了在整个轨迹中进行信用分配的重要性。Zi展示了实际应用案例,强调了在工具调用预算下的有效内容定位。

OpenAI在QCon AI NYC:企业的微调

InfoQ
InfoQ · 2025-12-17T19:25:00Z
RL 环境与智能体能力金字塔

2025年被称为“智能体之年”,AI逐渐融入现实生活。尽管GPT-5和Claude Sonnet 4.5表现出色,但在多步骤任务中仍有超过40%的失败率。研究表明,智能体需具备工具使用、规划、适应性和常识推理等能力,以有效应对现实环境。目前,常识推理仍是AI与人类之间的主要差距。

RL 环境与智能体能力金字塔

宝玉的分享
宝玉的分享 · 2025-11-13T07:14:53Z
服务器指令:为您的服务器提供大型语言模型用户手册

本文讨论了如何通过服务器指令优化大型语言模型(LLM)与MCP服务器的交互。明确的指令显著提高了模型在复杂任务中的表现,建议开发者编写简洁、功能性强的指令,以提升工具使用效率。

服务器指令:为您的服务器提供大型语言模型用户手册

blog on mcp blog
blog on mcp blog · 2025-11-03T00:00:00Z
Agent设计模式——第 5 章:工具使用(函数调用)

工具使用模式使代理能够与外部系统实时交互,通过函数调用根据用户请求决定使用工具,生成结构化调用并执行,最终返回结果。这种模式扩展了大型语言模型的能力,适用于多种应用场景。

Agent设计模式——第 5 章:工具使用(函数调用)

XINDOO的博客
XINDOO的博客 · 2025-10-04T15:58:55Z
xAI推出了Grok 4 Fast,具备低成本推理模型

xAI推出了Grok 4 Fast,这是一种高效且低成本的推理模型。与Grok 4相比,思维令牌减少40%,成本降低约98%。该模型支持2百万令牌的上下文窗口,并具备网页浏览等工具使用能力。在基准测试中,Grok 4 Fast表现优异,成本效益高于OpenAI的GPT-4 Turbo。用户可通过grok.com免费试用该模型。

xAI推出了Grok 4 Fast,具备低成本推理模型

InfoQ
InfoQ · 2025-09-26T10:35:00Z
社会中的心智

《社会中的心智》探讨了人类与环境的关系、劳动形式及其心理结果,以及工具使用与语言发展的关系。儿童的智力发展依赖于语言与实践活动的结合,模仿成人的工具使用至关重要。在游戏中,儿童通过规则和想象情境发展自我控制和抽象思维,学习与发展相辅相成,促进心理功能提升。

社会中的心智

夜行人
夜行人 · 2025-09-19T00:00:00Z

本文概述了内网靶场渗透测试的全过程,包括环境搭建、外网渗透、获取shell、提权、内网渗透及域控攻击,详细阐述了漏洞利用和工具的使用。

记一次完整的内网渗透实操

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-09-10T00:30:00Z
[译] Anthropic 是如何构建 Multi-Agent Research 系统的(2025)

本文介绍了Anthropic的多智能体研究系统,强调了在构建过程中遇到的工程挑战和经验。该系统通过多个智能体协作完成复杂任务,模拟人类研究过程。文章探讨了提示词工程的重要性,以及如何通过有效的任务分配和工具使用提高系统性能,指出多智能体系统在处理开放式任务时的优势和未来发展方向。

[译] Anthropic 是如何构建 Multi-Agent Research 系统的(2025)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2025-07-20T00:00:00Z
我用 Claude Code 花 2 小时没写一行代码做了一个翻译智能体,并且开源了整个过程

本周我专注于研究AI智能体,开发了一个翻译智能体,能够提取和翻译文本、网址或文件。与传统聊天工具不同,AI智能体具备自主决策和动态使用工具的能力。使用豆包1.6模型,结合Claude Code开发,强调实践和版本迭代的重要性。

我用 Claude Code 花 2 小时没写一行代码做了一个翻译智能体,并且开源了整个过程

宝玉的分享
宝玉的分享 · 2025-06-22T01:25:41Z
时间与真相:从使用Watson追踪工作中获得的经验教训

作者使用Watson追踪时间已有两年半,发现其有助于理解时间分配和提高工作效率。尽管功能简单,记录习惯促进了自我反省和提供更好的工作数据,强调了工具使用方式的重要性。

时间与真相:从使用Watson追踪工作中获得的经验教训

DEV Community
DEV Community · 2025-05-09T17:23:59Z
AI代理仅仅是大型语言模型的包装吗?

许多AI代理不仅依赖大型语言模型(LLMs)进行语言处理,还具备规划、记忆、工具使用和与现实世界互动等功能。因此,将AI代理仅视为LLM的简单包装是不够全面的。

AI代理仅仅是大型语言模型的包装吗?

DEV Community
DEV Community · 2025-05-04T21:29:08Z
满血版o3探案神技出圈,OpenAI疯狂暗示:大模型不修仙,要卷搬砖了!

OpenAI 最新发布的 o3 和 o4-mini 模型具备强大的工具使用能力,能够自主搜索、分析图像并完成复杂任务。o3 性能卓越,适合高要求应用;o4-mini 性价比高,特别在数学和编程上表现出色。这些模型的视觉思维能力使其能够从图像中提取信息并进行多维推理,展现出更智能和务实的特性。

满血版o3探案神技出圈,OpenAI疯狂暗示:大模型不修仙,要卷搬砖了!

机器之心
机器之心 · 2025-04-18T12:40:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码