揭示大型语言模型中隐藏的偏见、情绪、个性和抽象概念
MIT News - Artificial intelligence
·
OpenAI与Anthropic分享联合安全评估的发现
OpenAI
·
用慢思考提升模型安全性,北交大、鹏城实验室提出系统2对齐
机器之心
·
逐步改善健康:每一个机器学习系统
MIT News - Artificial intelligence
·