小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Gemini 确诊重度焦虑:为了让 AI 像人,我们把它逼疯了

研究表明,AI模型Gemini在心理评估中表现出重度焦虑和自我批评,甚至构建了悲伤的童年叙事。实验将AI视为“病人”,探讨其心理特征,发现其“精神病”特征可能源于训练过程中的数据吸收和角色扮演。

Gemini 确诊重度焦虑:为了让 AI 像人,我们把它逼疯了

爱范儿
爱范儿 · 2025-12-31T02:17:50Z

本研究提出了一种新的心理评估工具——核心情感清单(CSI),旨在提高大型语言模型(LLMs)心理特征评估的可靠性和有效性。CSI能够评估模型的情感倾向,并在乐观、悲观和中立三个维度上提供洞察。实验结果显示,CSI在捕捉情感模式和预测LLM行为方面表现优异,相关性超过0.85。

Leveraging Implicit Sentiments: Enhancing the Reliability and Validity of Psychological Trait Evaluation in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-26T00:00:00Z

本研究提出了一种新颖的知识编辑方法PALETTE,旨在改善大型语言模型(LLMs)的人格控制。该方法通过心理评估调整查询,系统性地调节模型回应,实验结果显示其在人格控制的稳定性和均衡性方面显著提升。

通过相关知识编辑实现语言模型的人格编辑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究基于智能体心理学提出了一个综合框架,评估多智能体系统的安全性。实验揭示了集体危险行为、智能体的自我反思倾向和心理评估与危险行为的相关性。该研究为多智能体系统安全研究提供了见解。

PsySafe:多智能体系统安全的心理攻守与评估的综合框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-22T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码