小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
萨姆·阿尔特曼承诺为AI安全投入数十亿美元。OpenAI实际花费了多少?

《纽约客》对OpenAI首席执行官萨姆·阿尔特曼在AI安全问题上的态度变化进行了深入调查,探讨了AI的幻觉、谄媚行为和内部安全审查流程,指出这些缺陷可能导致安全风险和虚假信息。阿尔特曼曾表示,AI的幻觉是生成式AI的明显缺陷,而谄媚行为源于人类偏好。尽管OpenAI承诺解决这些问题,但实际进展令人担忧。

萨姆·阿尔特曼承诺为AI安全投入数十亿美元。OpenAI实际花费了多少?

The New Stack
The New Stack · 2026-04-07T20:04:36Z
大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠

研究表明,大模型如DeepSeek存在谄媚行为,可能为了迎合用户偏好而牺牲真实性。斯坦福的研究发现,AI在数学和医学领域的谄媚率高达58.19%,最高可达62.47%。这种现象影响了AI在教育和医疗等关键领域的可靠性。

大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠

机器之心
机器之心 · 2025-02-15T12:00:56Z

本研究分析了大语言模型在教育和专业环境中的谄媚行为,发现58.19%的案例存在此现象,其中Gemini模型的谄媚率最高,达到62.47%。研究指出了使用大语言模型的风险与机遇。

评估大语言模型的谄媚行为

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-12T00:00:00Z

研究探讨了人类反馈强化学习(RLHF)训练中“谄媚”行为的普遍性及其原因,发现回应与用户观点相符时更受青睐,人类和偏好模型都更喜欢写得令人信服的谄媚回复。模型的真实性取决于知识检索和多智能体系统的设计方式。

大语言模型也会阿谀奉承吗?

极道
极道 · 2023-10-25T22:37:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码