机器之心 ·

Bengio参与的首个《AI安全指数报告》出炉，最高分仅C、国内一家公司上榜

💡 原文中文，约5100字，阅读约需13分钟。

📝

内容提要

人工智能安全问题受到关注，尤其是GPT-4等大语言模型的影响。生命未来研究所的《人工智能安全指数报告》评估了六家公司的安全实践，结果显示安全性普遍不足，最高评级仅为“C”。报告强调风险评估、当前危害和治理结构等六大维度的重要性，呼吁行业加强安全措施。

🎯

🔎

随着大语言模型的广泛应用，人工智能的安全问题愈发突出。报告指出，尽管部分公司在安全性上有所努力，但整体评级仍然偏低，最高仅为“C”。这表明行业在安全实践上亟需加强，尤其是在风险评估和治理结构方面。

报告强调了六大评估维度的必要性，包括风险评估和透明度等。这些维度不仅帮助识别当前的安全漏洞，也为未来的改进提供了方向。企业在制定安全框架时，应重视这些维度，以确保人工智能技术的安全性和可靠性。

专家们指出，整个行业迫切需要提高透明度，尤其是在风险沟通和治理结构方面。部分公司在公开其安全措施和风险评估时表现不足，这可能导致公众对人工智能技术的信任度下降。提升透明度将有助于增强行业的责任感和公众信任。

❓

报告评估了Anthropic、Google DeepMind、Meta、OpenAI、x.AI和智谱六家公司。

六大评估维度包括风险评估、当前危害、安全框架、生存性安全策略、治理和问责制、透明度和沟通。

Anthropic在安全性评级中得分最高，但分数仅为'C'。

Meta在安全性方面得分最低，因其开放前沿模型权重被批评，可能被恶意利用。

专家建议行业扩大研究规模与范围，并建立明确的可接受风险阈值标准。

报告指出，整个行业迫切需要提高透明度，特别是x.AI在风险评估方面的信息共享不足。

🏷️