小红花·文摘 - 小红花技术领袖俱乐部

智能时代的生物防御

智能时代的生物防御

OpenAI ·

LWiAI播客第229期 - Gemini 3 Flash、ChatGPT应用、Nemotron 3

LWiAI播客第229期 - Gemini 3 Flash、ChatGPT应用、Nemotron 3

Last Week in AI ·

通过外部测试增强我们的安全生态系统

通过外部测试增强我们的安全生态系统

OpenAI ·

评估开放权重大型语言模型的最坏情况前沿风险

评估开放权重大型语言模型的最坏情况前沿风险

OpenAI ·

为生物领域未来的人工智能风险做好准备

为生物领域未来的人工智能风险做好准备

OpenAI ·

美国商务部将人工智能安全研究所的“安全”一词去除

美国商务部将人工智能安全研究所的“安全”一词去除

The Verge ·

文章探讨了自主性、生物安全、网络安全和机器学习研发的风险及缓解措施。未来基础模型可能带来严重风险，需评估其对有害活动的影响。研究团队致力于评估关键能力的风险并开发评估工具。Google将定期审查框架，以确保符合AI原则，促进安全与创新的平衡。

前沿安全框架介绍

Google DeepMind Blog ·

人工智能（AI）带来了巨大的好处，但也存在风险。紫色团队合作是一个综合框架，通过对抗性漏洞探测和安全解决方案相结合，开发可靠和负责任的AI。它解决了AI在生物技术中的生物安全风险，并提供了关键观点。紫色团队合作旨在引导AI朝向社会福祉，为共同福利赋予道德技术的力量。

生成 AI 的红队测试：是银弹还是安全娱乐？

BriefGPT - AI 论文速递 ·