绿盟科技技术博客 ·

【公益译文】2026年国际AI安全报告（六）

💡 原文中文，约5400字，阅读约需13分钟。

📝

内容提要

文章讨论了AI开发和使用中的技术保障措施，主要包括开发安全模型、部署监控和生态系统监测。尽管已有进展，但技术保障仍存在局限，无法完全防止有害行为。提出了对抗训练和“忘却学习”等方法以提高模型安全性，但仍需进一步研究。有效的监控和控制措施在实际应用中面临挑战，开发人员需不断更新以应对新攻击。

🎯

关键要点

AI开发和使用中采用的技术保障措施包括开发安全模型、部署监控和生态系统监测。
目前的技术保障措施存在局限性，无法完全阻止有害行为。
对抗训练和“忘却学习”等方法被提出以提高模型安全性，但仍需进一步研究。
有效的监控和控制措施在实际应用中面临挑战，开发人员需不断更新以应对新攻击。
开发更安全的模型是抵御AI系统危害的第一道防线，过滤训练数据是有效的方法之一。
部署期间的监控和控制措施有助于识别和处理模型的高风险行为。
生态系统监测工具可以提高对AI下游用途和影响的认识，水印和元数据有助于追踪AI生成内容的传播。
决策者面临的挑战包括技术保障措施的局限性和不同开发人员实施情况的差异。

❓

延伸问答

AI开发中有哪些技术保障措施？

AI开发中主要采用的技术保障措施包括开发安全模型、部署监控和生态系统监测。

目前的技术保障措施存在哪些局限性？

目前的技术保障措施无法完全阻止有害行为，且单一措施的有效性有限，可能需要采用纵深防御模型。

对抗训练如何提高AI模型的安全性？

对抗训练通过构建攻击使模型能够适当地处理潜在的有害行为，从而提高模型的鲁棒性。

如何监控和控制AI模型的行为？

可以通过检查输入、过滤输出和监控思路链等方式来识别和处理模型的高风险行为。

生态系统监测工具的作用是什么？

生态系统监测工具有助于追踪AI模型的使用情况和影响，提高对AI下游用途的认识。

决策者在AI安全管理中面临哪些挑战？

决策者面临技术保障措施的局限性、不同开发人员实施情况的差异等挑战。

🏷️

继续阅读

Cognex宣布推出In-Sight 6900视觉控制器
Cognex推出In-Sight 6900视觉控制器，具模块化设计，支持灵活配置摄像头和照明系统。该产品基于NVIDIA Jetson技术，具备强大的AI...
晨昏线科技发布目标因果世界模型GCWM1
晨昏线科技发布了“目标因果世界模型（GCWM1）”，旨在提升具身智能的推理能力。该模型通过因果链推理机制，实现理解、预测和干预的闭环。同时，公司推出了Te...
2026华为云INSPIRE创想者大会早鸟票预约
2026华为云INSPIRE创想者大会将于6月5日至6日在上海举行，届时将有产业专家分享AI战略，发布新品，并进行100场交流，展区面积达6000㎡，展示...
DXC宣布推出智能编排平台DXC OASIS
DXC Technology推出的智能编排平台DXC OASIS旨在重塑托管服务运营模式，结合人类专业能力与代理式AI，实现实时智能运维，提升关键任务的确...
Feldspar开发出全球首个表面测力平台的原型机
Feldspar公司开发了全球首个表面测力平台原型，正在申请专利。该平台能够实时捕获运动场地的地面反作用力数据，适用于多种运动项目，初期试点集中在田径，未...
中之杰智能OBF智能工厂入选2025年信息技术应用创新解决方案名单
中之杰智能的OBF智能工厂解决方案入选2025年信息技术应用创新解决方案名单，成为全省离散智造领域唯一入选者。该方案通过智能体技术，实现全面感知、精准分析...