Databricks ·

自主AI安全：Databricks AI安全框架（DASF v3.0）中的新风险与控制措施

💡 原文英文，约800词，阅读约需3分钟。

📝

内容提要

Databricks发布了AI安全框架（DASF）扩展白皮书，提出35种新风险和6种控制措施，以确保自主AI代理的安全。更新内容包括对代理推理、记忆和工具使用的指导，帮助组织安全部署AI代理，同时维护治理和安全控制。

🎯

🔎

随着自主AI代理的广泛应用，新的安全风险不断涌现。特别是在代理能够执行查询和调用API时，用户的权限可能会被代理的权限所替代。这种权限的交替可能导致敏感数据的泄露，因此组织在部署AI代理时必须特别关注权限管理和安全控制。

Databricks提出的6种控制措施，如最小权限和沙箱化，旨在降低自主AI代理的风险。这些措施不仅有助于保护敏感系统，还能确保在处理不可信输入时，代理的行为不会超出预期。因此，企业在实施AI代理时，必须将这些控制措施纳入安全策略中。

在多代理系统中，代理之间的通信可能导致通信污染和流氓代理的风险。这意味着，随着代理数量的增加，管理和监控的复杂性也随之上升。组织需要建立有效的监控机制，以确保所有代理的行为都在可控范围内，防止潜在的安全隐患。

❓

DASF v3.0引入了35种新风险和6种控制措施，提供了对自主AI代理推理、记忆和工具使用的安全指导。

主要风险包括访问敏感系统、处理不可信输入和改变状态或进行外部通信，这三种条件同时存在时风险显著增加。

DASF框架中提到的控制措施包括最小权限、沙箱隔离和人工监督等。

AI代理通过将请求分解为子任务，选择工具并实时决策来执行任务，这可能导致用户权限被代理权限替代。

DASF框架通过提供新风险和控制措施的指导，帮助组织在维护治理和安全控制的同时安全部署AI代理。

“致命三重奏”指的是同时存在访问敏感系统、处理不可信输入和改变状态的情况，这会显著提高AI代理的风险。

🏷️