小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AI 范式雷达:《Agent安全新范式:从静态对齐到动态诊断护栏》

AgentDoG 1.5 是一个轻量级的安全对齐框架,利用轨迹级诊断引擎和推理增强方法,实现静态安全分类到动态实时防护的转变。该框架识别跨步骤的累积风险,提升安全判断准确性,并支持免训练在线护栏设计,降低部署复杂度。研究显示,7B 参数模型在 R-judge 基准测试中达到了 GPT-5.4 级别的安全性能,为中小团队提供高效的安全解决方案。

AI 范式雷达:《Agent安全新范式:从静态对齐到动态诊断护栏》

Micropaper
Micropaper · 2026-06-13T00:00:00Z
帮助ChatGPT更好地识别敏感对话中的上下文

ChatGPT正在改进安全性,以更好地识别自残和他人伤害的潜在风险。通过与心理健康专家合作,系统能够识别对话中的微妙信号并提供适当响应。这些更新显著提高了在高风险情况下的安全响应能力,确保更好地保护用户。

帮助ChatGPT更好地识别敏感对话中的上下文

OpenAI
OpenAI · 2026-05-14T00:00:00Z
Singular Bank利用ChatGPT和Codex助力银行家快速决策

西班牙马德里的Singular Bank开发了名为Singularity的内部助手,利用ChatGPT和Codex帮助银行家实时分析投资组合、准备会议和生成合规的后续沟通。该系统每天为银行家节省60至90分钟,使其能够更专注于客户关系和提供价值。Singularity能够即时识别投资组合中的风险并建议相应的行动,从而提升决策效率和客户沟通质量。

Singular Bank利用ChatGPT和Codex助力银行家快速决策

OpenAI
OpenAI · 2026-05-06T00:00:00Z
微软希望律师信任其在Word文档中的新AI代理

微软推出了一款名为“法律代理”的AI工具,专为法律团队设计。该工具能够处理文档编辑、谈判历史和复杂文件,帮助审查合同,分析现有文档并识别风险和义务。目前在美国的前沿计划成员中发布,旨在将智能特性引入Word。

微软希望律师信任其在Word文档中的新AI代理

The Verge
The Verge · 2026-05-01T11:18:54Z

AI风险管理旨在识别、评估和降低与AI相关的风险。主要方法包括风险识别、分析、缓解和治理。通过专家互动和威胁建模发现潜在风险,评估模型的能力和漏洞,采用控制措施降低风险,并确保透明度和问责,以促进有效的风险管理。各国已推出法律和框架以提高透明度和标准化,推动AI风险管理的进步。

【公益译文】2026年国际AI安全报告(五)

绿盟科技技术博客
绿盟科技技术博客 · 2026-04-24T01:17:11Z
Harness Monitor:当多个 Agent 同时写代码时,如何看住质量

Harness Monitor 是一个监控代码变更的工具,旨在提高代码质量管理。它通过观察文件变化和会话归因,帮助开发者识别潜在问题和风险,特别是在多 Agent 并行开发环境中进行有效的质量治理,确保系统演化的可控性。

Harness Monitor:当多个 Agent 同时写代码时,如何看住质量

phodal
phodal · 2026-04-13T03:24:00Z

本文讨论了架构评审中的ATAM方法,强调其在识别架构风险和评估决策有效性方面的重要性。ATAM通过结构化流程帮助团队系统分析架构决策的影响,识别敏感点和权衡点,确保架构设计支持业务目标。文章介绍了ATAM的三个阶段和九个步骤,强调团队合作与准备的重要性,以及如何通过质量属性效用树明确优先级和风险。

【系统架构设计】架构评估:ATAM 与 trade-off 分析实战

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z
ChatGPT在客户成功团队中的应用

客户成功工作结合关系管理与运营执行,面临信息分散的挑战。ChatGPT通过整合信息,帮助团队专注于客户,简化沟通、标准化流程,提高效率,确保一致的客户体验。使用ChatGPT,团队能更快识别风险、制定成功计划,提升客户关系管理效果。

ChatGPT在客户成功团队中的应用

OpenAI
OpenAI · 2026-04-10T00:00:00Z

作者通过五个 Git 命令快速了解新代码库的状况,包括高变动文件、主要贡献者、缺陷区域和项目活跃度。这些命令帮助开发者识别风险,避免不必要的代码阅读,强调这是代码审计的第一步,后续还有更深入的分析方法。

2026 04 09 HackerNews

介绍 on SuperTechFans
介绍 on SuperTechFans · 2026-04-09T00:14:31Z
现已推出:数字海洋云安全态势管理(CSPM)

数字海洋推出云安全态势管理(CSPM),提供无代理的仪表板视图,帮助团队识别风险、优先处理问题并快速修复。所有用户可享受无限免费扫描,付费用户可获得高级规则和自动化指导,从而简化安全管理,提高操作效率。

现已推出:数字海洋云安全态势管理(CSPM)

The DigitalOcean Blog
The DigitalOcean Blog · 2026-04-01T14:46:32Z
推出OpenAI安全漏洞赏金计划

OpenAI推出公共安全漏洞赏金计划,旨在识别AI滥用和安全风险,重点关注代理风险、信息泄露和账户完整性问题。研究人员可申请参与,共同维护安全的AI生态系统。

推出OpenAI安全漏洞赏金计划

OpenAI
OpenAI · 2026-03-25T00:00:00Z
冠忠巴士引入AI智能摄录系统,目标2026年底前完成全线部署

冠忠巴士集团已为大多数巴士安装安全带,符合2026年新规。公司引入AI智能摄录系统监测驾驶行为,识别风险并及时提示,计划于2026年底完成全线部署,并推出“Safe GPT”平台分析驾驶行为并提供培训。

冠忠巴士引入AI智能摄录系统,目标2026年底前完成全线部署

全球TMT-美通国际
全球TMT-美通国际 · 2026-01-26T02:55:37Z
情感如何帮助快速决策

情感在快速决策中至关重要,尤其在紧急情况下。情感系统能迅速处理信息,帮助人们做出反应。研究表明,情感反应比理性分析更快,有助于识别风险和机会。情感记忆形成直觉,使人们在类似情境中迅速反应。提升情感意识有助于更准确地解读自身状态,从而在紧急情况下做出更好的选择。

情感如何帮助快速决策

Business Review at Berkeley
Business Review at Berkeley · 2025-12-29T19:37:33Z
深度数科推出全国首个聚焦票据与供应链金融领域的行业大模型

深度数科集团在九周年之际推出全国首个聚焦票据与供应链金融的行业大模型“承心一阅”。该模型涵盖100万家企业的业务行为,提升信用评估准确率37%和风险识别时效90%。具备动态预测、风险管控和智能决策能力,已与17家企业和金融机构合作。

深度数科推出全国首个聚焦票据与供应链金融领域的行业大模型

全球TMT-美通国际
全球TMT-美通国际 · 2025-12-01T02:26:27Z
冗余的承诺:云故障的影响能否避免?

10月20日的AWS故障提醒我们,现代应用和服务高度相互依赖,单一故障可能影响多个行业。构建有效的冗余系统面临复杂性挑战,组织需提高对依赖环境的可见性,识别风险并快速决策。数字韧性不仅依赖架构,还需全面的环境意识。

冗余的承诺:云故障的影响能否避免?

The New Stack
The New Stack · 2025-10-31T19:10:45Z

BlueCodeAgent是一种新型蓝队智能体,通过自动化红队生成的高风险实例,构建可操作的安全规则,深入检测和防护代码生成AI。该方法在偏见指令、恶意代码和漏洞检测方面表现优异,显著提升了风险识别能力,降低了误报率,推动了代码生成安全的发展。

【论文速读】| BlueCodeAgent:一种借助自动化红队测试赋能的CodeGen人工智能蓝队智能体

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-10-28T09:35:00Z
PersonaTeaming:探索引入角色如何提升自动化AI红队测试的效果

本文介绍了PersonaTeaming方法,通过引入角色提升AI模型在自动化红队测试中的风险识别能力。该方法利用“红队专家”或“普通用户”角色生成对抗性提示,实验结果显示攻击成功率提高了144.1%。研究分析了不同角色类型和变异方法的优缺点,为未来自动化与人工红队测试的结合提供了新思路。

PersonaTeaming:探索引入角色如何提升自动化AI红队测试的效果

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-26T00:00:00Z
Qwen3Guard: 实时安全,逐词响应

Qwen3Guard是Qwen家族首款安全护栏模型,专为AI交互提供实时风险识别,支持119种语言,适用于多种应用场景,提供生成式和流式检测版本,确保在线服务的安全与高效。

Qwen3Guard: 实时安全,逐词响应

Blog on Qwen
Blog on Qwen · 2025-09-22T20:00:00Z

作为交易风控算法工程师,我利用大语言模型(LLM)提升风险识别能力。通过设计有效的Prompt,将模型调教为风控专家,解决了误报问题,增强了分析深度,实现了从初级到高级分析师的转变。这一过程强调了规则与背景知识的重要性,以及教会AI思考和判断的方法。

我如何用Prompt工程将大模型调教成风控专家

京东科技开发者
京东科技开发者 · 2025-09-08T06:03:28Z
利用人工智能提升自动化软件测试

自动化软件测试是提升工程效率的重要工具,AI的应用为测试实践带来了新机遇。AI能够生成更深入的单元和集成测试,提升最佳实践标准,促进工程师协作,从而提高软件质量并降低维护负担。同时,AI帮助团队更有效地识别风险,增强系统韧性。

利用人工智能提升自动化软件测试

The New Stack
The New Stack · 2025-07-09T16:00:27Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码