BriefGPT - AI 论文速递 ·

安全代理基准：具身大型语言模型代理的安全任务规划基准

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

本研究推出安全代理基准（SafeAgentBench），探讨具身代理执行复杂自然语言指令的安全风险。实验基于750个任务的数据集和通用环境，结果显示安全任务成功率为69%，而危险任务拒绝率仅为5%，揭示了潜在的安全隐患。

🎯

关键要点

本研究推出安全代理基准（SafeAgentBench）
研究具身代理执行复杂自然语言指令的安全风险
实验基于750个任务的数据集和通用环境
安全任务成功率为69%
危险任务拒绝率仅为5%
揭示了潜在的安全隐患

🏷️

继续阅读

Soracom 推出 Air RTC 网关，根据 SIM 卡身份将物联网设备的语音呼叫路由至联络中心、VoIP 服务提供商和 AI 代理
2026年7月28日，Soracom, Inc. 是一家为物联网提供连接、云集成和 AI 服务的云原生物联网平台，该公司宣布推出 Soracom Air ...
权威认可 | 绿盟科技登顶“AI安全创新优势榜”
近日，安全牛发布第十三版《网络安全企业100强》报告。绿盟科技凭借在AI安全领域的深度布局与体系化优势，登顶“... » 阅读全文
Robo-ValueRL——面向离线到在线RL的可靠价值估计：同时捕捉全局任务进度和局部动作偏好，先离线预训练，后在线提升(即在线残差策略自适应)
本文提出Robo-ValueRL框架，旨在通过可靠的价值函数提升离线到在线强化学习在机器人操作任务中的性能。该框架包含三个关键组件：历史条件化价值估计器、...
Agent Presence：开源实时语音框架 Qwen-Audio-Agent 来了
Qwen-Audio-Agent 位于用户和后台 Agent 之间。用户面对的是一个实时语音前台。简单问题可以即时回答；复杂任务会交给后台 Agent。
将 Amazon Quick 日志投递至 Amazon S3：审计与长期留存指南
本文介绍如何通过 CloudWatch Logs V2 delivery，将 Amazon Quick 支持的日志直接持续投递到指定的 Amazon S3...
使用 Amazon Athena 分析 Kiro 团队用量报表：动态模型列的数据建模实践
本文介绍了如何使用 Amazon Athena 对 Kiro 提供的 per-user activity 报表进行分析。

内容提要

关键要点

标签

继续阅读