机器之心 ·

用慢思考提升模型安全性，北交大、鹏城实验室提出系统2对齐

💡 原文中文，约5500字，阅读约需14分钟。

📝

内容提要

机器之心AIxiv专栏促进了学术交流，报道超过2000篇内容。北京交通大学ADaM团队研究系统2对齐技术，提升模型的推理能力和安全性，结果表明引导和监督方法有效改善模型表现。

🎯

🏷️

一分钟读论文：《LLM 智能体在社交困境中的合作机制》
德国康斯坦茨大学与以色列魏茨曼科学研究所的研究首次评估了不同合作机制对大型语言模型（LLM）智能体在社交困境中的影响。研究发现，推理能力强的LLM反而更少...
Atlassian旗下软件(Jira/Confluence等)将从8月17日开始收集客户数据用于训练模型
知名软件公司Atlassian近期更新数据贡献政策，自2026年8月17日起将使用客户在Jira、Confluence等云产品中的数据训练AI模型。企业版...
AI抵制浪潮兴起：数据投毒与虚假信息如何反击模型训练
人们通过投喂垃圾数据和散布虚假信息来抵制AI数据抓取，旨在提高数据采集成本，迫使科技公司改变做法。Reddit社区“毒泉”鼓励用户向爬虫提供无用数据，以影...
亚马逊云科技助力企业安全部署OpenClaw
（全球TMT2026年4月21日讯）OpenClaw自2025年11月发布以来，迅速成为现象级AI Agent […]
黑芝麻智能发布华山A2000家族四款高算力芯片
（全球TMT2026年4月21日讯）在智能电动汽车高层发展论坛上，黑芝麻智能创始人兼CEO单记章发布了华山A2 […]
PlayStation’s age-gating restrictions are coming to UK consoles
Sony is starting to comply with the UK's Online Safety Act by notifying P...