机器之心 ·

面向代码语言模型的安全性研究全新进展，南大&NTU联合发布全面综述

💡 原文中文，约5500字，阅读约需13分钟。

📝

内容提要

AIxiv专栏促进了学术交流，报道了2000多篇关于代码语言模型（CodeLMs）的研究。CodeLMs在智能软件开发中应用广泛，但面临后门和对抗攻击等安全威胁。南京大学与南洋理工大学的研究团队对67篇相关文献进行了系统梳理，探讨了攻击与防御策略，强调了保障CodeLMs安全性的重要性。

🎯

❓

CodeLMs 面临后门攻击和对抗攻击等安全威胁，这些攻击可能导致生成具有隐藏安全漏洞的代码。

研究团队对67篇文献进行了梳理，探讨了CodeLMs的攻击与防御策略，强调了保障其安全性的重要性。

后门攻击通过植入隐藏触发器影响模型输出，而对抗攻击则通过微小扰动欺骗模型产生错误预测。

防御策略包括训练前、训练中和训练后防御，旨在识别异常数据样本和增强模型的鲁棒性。

未来研究方向包括评估后门触发器的隐蔽性和探讨大语言模型的后门注入方法等。

常用的数据集包括BigCloneBench和CodeSearchNet，评估指标包括攻击成功率和模型准确率等。

🏷️

WAF防线告急？绿盟科技已提前锁定“幽灵比特位”攻击
2026年Black Hat Asia大会揭示了“Ghost Bits”安全威胁，源于Java编码缺陷，导致WAF防护失效。攻击者利用字符编码不一致，构造...
生物研究正在变成软件工程：AI开始接管生物实验大脑！
生物研究正逐渐依赖AI进行数据分析，推动科学判断的自动化。AI能够高效筛选和分析生物数据，提升研究效率。未来，数据分析能力将成为生物研究的核心，快速将数据...
安全公告：Qt声明模块中VectorImage组件的QML代码注入漏洞影响Qt
Qt的VectorImage组件存在代码注入漏洞（CVE-2025-14576），影响版本6.8.0至6.8.6及6.9.0至6.10.1。该漏洞允许恶意...
五种强大的Python装饰器，构建整洁的AI代码
本文介绍了五种实用的Python装饰器，旨在提高AI和机器学习代码的整洁性。这些装饰器包括：限制并发请求、结构化日志记录、特征注入、确定性种子设置和开发模...
营收破千亿、装机量超 25 亿，苹果交出史上最强三月季度答卷
【TechWeb】5月1日消息，据外媒报道，苹果发布 2026 财年第二季度（自然年第一季度）财报，并召开财报电话会议，宣布本季度创下史上最佳三月季度业绩...
在Aurora中对大型表执行ALTER TABLE
Recently, we received an alert for one of our Managed Services customers indi...