大规模语言模型的软意识形态通过 AI 自我意识
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
研究 ChatGPT 模型的社会政治和经济偏见,发现最近版本在多个知识领域中不再表现出明显的显性偏见,但仍存在隐性倾向,需要增加更多的调节。在争议话题的领域知识方面,ChatGPT 表现良好。与人类答案相比,Bing AI 的信息来源在倾向中立方面略有增加。
🎯
关键要点
- 研究旨在了解 ChatGPT 模型的意识水平及其社会政治和经济偏见。
- 使用社交媒体平台 Kialo 创建的数据集进行探索。
- 最近版本的 ChatGPT (gpt-3.5-turbo) 在多个知识领域中不再表现出明显的显性偏见。
- ChatGPT 在经济方面进行了良好的调节,但仍存在对右倾意识形态的隐性倾向。
- 在争议话题的领域知识方面,ChatGPT 除了哲学类别外表现良好。
- 与人类答案相比,Bing AI 的信息来源在倾向中立方面略有增加。
- 分析结果适用于其他类型的偏见和领域。
➡️