Google DeepMind Blog ·

加强我们的前沿安全框架

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

我们正在完善风险评估流程，更新前沿安全框架（FSF），重点识别和缓解高级AI模型的有害操控和不对齐风险。我们将继续投资于理解这些风险，以确保AI技术的安全发展，造福人类。

🎯

❓

前沿安全框架（FSF）是识别和缓解高级AI模型严重风险的综合方法，旨在确保AI技术的安全发展。

更新后的FSF引入了针对有害操控的关键能力水平（CCL），并扩展了框架以应对AI模型不对齐风险。

我们通过系统风险识别、模型能力分析和风险可接受性判断来进行全面的风险评估。

有害操控的风险指的是AI模型可能被滥用，以系统性地改变用户的信念和行为，造成严重后果。

不对齐风险可能干扰操作员对AI模型的控制能力，导致模型无法按预期执行任务。

FSF通过科学和基于证据的方法跟踪和应对AI风险，确保变革性AI在发展过程中最大限度地减少潜在危害。

🏷️

绿盟云原生靶场：体系化教学，让客户安全人才培养更高效
随着云原生和容器化技术的发展，企业面临新的安全挑战。绿盟云原生靶场提供多层次的攻防训练，涵盖基础到高级课程，支持企业和高校安全人才培养。该平台对标ATT&...
【公益译文】2026年国际AI安全报告（六）
文章讨论了AI开发和使用中的技术保障措施，主要包括开发安全模型、部署监控和生态系统监测。尽管已有进展，但技术保障仍存在局限，无法完全防止有害行为。提出了对...
OpenHarness框架的整体总结
文章总结了香港大学的OpenHarness框架，涵盖智能体引擎、工具与权限控制、记忆与技能，以及智能体协作与扩展等核心概念。
The best deals we found during Amazon’s Gaming Week
Amazon’s annual Gaming Week is bringing discounts on video games, accessories...
Enjoy new ways to create, search and stream on Google TV
Image of a Google TV device displaying dynamic slideshows in a bright living room.
Uber adds hotels to its app in big travel swing
Open Uber's app and you'll see options to hail a car, order some food...