小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
吃了云南见手青会看到小人跳舞,但科学家不知道原因

云南的兰茂牛肝菌食用后可导致幻觉,表现为看到小人跳舞。科学家对其基因组进行测序,发现其致幻机制与已知致幻物质无关,可能存在未知的生化合成途径。历史上有类似现象的记录,但食用未熟的蘑菇极具危险性,可能导致严重后果。科学界仍在探索其致幻机制。

吃了云南见手青会看到小人跳舞,但科学家不知道原因

极道
极道 · 2026-06-14T23:44:00Z
OpenClaw记忆替换Node.js Postgres后降低幻觉但提高延迟

作者通过将OpenClaw的记忆功能从文本文件替换为Node.js和Postgres数据库,显著降低了模型的幻觉和上下文漂移。新系统通过严格的数据库结构和API契约,确保模型记录准确的信息,避免错误记忆。尽管增加了150毫秒的延迟,但有效解决了模型的错误输出问题。

OpenClaw记忆替换Node.js Postgres后降低幻觉但提高延迟

极道
极道 · 2026-06-01T02:59:00Z

深度求索(DeepSeek)回应用户反馈,表示输入特殊字符<think>时模型返回无关内容属于模型幻觉,不涉及隐私泄露。技术团队已修复此问题,并增强模型对特殊字符的识别能力,以确保用户数据安全和使用体验。

深度求索回应发送时DeepSeek返回异常回复 属于模型特性幻觉不涉及隐私泄露

蓝点网
蓝点网 · 2026-05-20T06:30:45Z

深度求索(DeepSeek)回应用户反馈,表示输入特殊字符<think>时模型返回无关内容,属于模型幻觉,不涉及隐私泄露。技术团队已修复此问题,并将增强模型对特殊字符的识别能力,以优化用户体验。

深度求索回应发送时DeepSeek返回异常回复 属于模型特性幻觉不涉及隐私泄露

蓝点网
蓝点网 · 2026-05-20T06:30:45Z
8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026

上海人工智能实验室与复旦、上海交通大学团队提出了Thoth模型,旨在生成可执行的生物实验protocol。该模型通过结构化推理,确保实验步骤的合理性和准确性。团队构建的SciRecipe数据集涵盖27个生物学领域,提升了实验方案生成的可靠性。Thoth在多个评估中表现优异,标志着AI在生命科学研究中的新应用方向。

8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026

量子位
量子位 · 2026-05-18T06:52:11Z
硅基幻觉与碳基逆袭:大语言模型到底有没有真智能

大语言模型(LLM)与通用人工智能(AGI)存在本质区别。LLM缺乏真实的世界模型,无法理解符号与现实的对应关系,其输出仅为统计结果。当前AI的“智能涌现”常被误解,缺乏因果关系理解能力。相比之下,人类通过内在世界模型和主动探索,能够有效学习和适应环境。未来AI的发展需结合因果模型与主动学习,才能实现真正的智能。

硅基幻觉与碳基逆袭:大语言模型到底有没有真智能

极道
极道 · 2026-05-16T23:58:00Z

文章讨论了为AI构建简化技术栈的方法,以减少上下文窗口中的幻觉。提出了三个原则:使用单一二进制后端、配置即真相、避免多租户架构。通过简化系统,AI能够更好地理解全局,减少错误。

TIL:给 AI 一个更小的世界——技术选型的上下文窗口约束

暗无天日
暗无天日 · 2026-05-13T00:00:00Z

大型语言模型(LLMs)常使用冗长的语言,导致生成的回答可能偏离事实并增加幻觉风险。为解决此问题,文章介绍了使用Textstat库测量可读性,并在复杂度超标时自动简化回答,通过设置复杂度预算确保生成文本更简洁,从而降低幻觉发生的可能性。

大型语言模型的防护措施:测量人工智能的‘幻觉’与冗长性

KDnuggets
KDnuggets · 2026-05-11T16:00:36Z

MCP 让 AI 从聊天机器人变成了能操作数据库、读写仓库的操作者,同时也引入了一种传统 WAF 防不住的漏洞:幻觉权限。本文基于 Nikita Kothari 在 DZone 上的安全分析,解读 Prompt Injection 2.0 的威胁模型和三条防线:默认只读、人机回环、零信任逐调鉴权。

读:MCP 时代的安全威胁——幻觉权限与三道防线

暗无天日
暗无天日 · 2026-05-10T00:00:00Z
刚刚,ChatGPT免费模型升级了:幻觉砍半/记忆更强/回答更简洁

OpenAI推出了GPT-5.5 Instant模型,显著提高了医疗、法律和金融领域的事实准确性,减少了错误陈述,并优化了回答的简洁性和实用性。新功能“记忆来源”允许用户管理上下文信息。该模型于5月5日上线,替代了旧版模型。

刚刚,ChatGPT免费模型升级了:幻觉砍半/记忆更强/回答更简洁

量子位
量子位 · 2026-05-06T00:22:35Z
OpenAI声称ChatGPT的新默认模型幻觉现象大幅减少

OpenAI推出的新模型GPT-5.5 Instant显著减少了虚假信息的生成,减少了52.5%的幻觉声明。该模型在日常任务中表现更佳,响应更简洁,并避免使用多余的表情符号。新功能“记忆来源”允许用户查看和管理个性化响应的上下文。GPT-5.5 Instant将于周二向所有用户推出。

OpenAI声称ChatGPT的新默认模型幻觉现象大幅减少

The Verge
The Verge · 2026-05-05T17:00:00Z
🔍 别让大模型"想太多":SKILL开发中的语义陷阱与抗幻觉设计

在大模型应用中,关键词选择对技能的准确性影响显著。实验表明,使用“漏洞”和“风险”两个词会导致审计结果差异达27个百分点。文章讨论了“语义陷阱”现象,指出词汇在大模型中的语义边界不同,可能导致输出超出预期。为确保准确性,建议使用语义边界更窄的词汇,并在开发流程中加入语义陷阱检测,以避免误判和幻觉风险。

🔍 别让大模型"想太多":SKILL开发中的语义陷阱与抗幻觉设计

像清水一般清澈透明
像清水一般清澈透明 · 2026-04-11T09:56:40Z
萨姆·阿尔特曼承诺为AI安全投入数十亿美元。OpenAI实际花费了多少?

《纽约客》对OpenAI首席执行官萨姆·阿尔特曼在AI安全问题上的态度变化进行了深入调查,探讨了AI的幻觉、谄媚行为和内部安全审查流程,指出这些缺陷可能导致安全风险和虚假信息。阿尔特曼曾表示,AI的幻觉是生成式AI的明显缺陷,而谄媚行为源于人类偏好。尽管OpenAI承诺解决这些问题,但实际进展令人担忧。

萨姆·阿尔特曼承诺为AI安全投入数十亿美元。OpenAI实际花费了多少?

The New Stack
The New Stack · 2026-04-07T20:04:36Z

HagiCode 项目通过 OpenSpec 实现规范驱动开发,减少 AI 编程助手生成不符合项目规范的代码(即“AI 幻觉”)的风险,提高代码质量。OpenSpec 强调在生成代码前撰写需求文档,以确保代码符合实际需求。

AI 编程助手的幻觉问题:如何用 OpenSpec 实现规范驱动开发

dotNET跨平台
dotNET跨平台 · 2026-04-02T23:58:48Z
超越提示工程的五种实用技术来检测和减轻大型语言模型的幻觉

大型语言模型(LLM)产生幻觉的原因包括缺乏实时数据、过度概括和生成压力。为减少幻觉,可以采用五种技术:1. 检索增强生成(RAG),提供实时数据;2. 输出验证,使用二次模型检查答案;3. 结构化输出,限制模型生成自由度;4. 置信评分,评估答案可靠性;5. 人工干预,确保关键决策由人类审核。这些方法能有效降低幻觉的发生。

超越提示工程的五种实用技术来检测和减轻大型语言模型的幻觉

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-25T13:39:46Z

减少大型语言模型中的幻觉问题可以通过七种策略实现:1. 使用检索增强生成(RAG)确保回答基于可靠数据;2. 关键声明需引用来源;3. 使用工具调用而非自由回答;4. 添加生成后验证步骤;5. 偏向引用而非改写;6. 校准不确定性并优雅失败;7. 持续评估和监控。这些方法有助于提高系统的可靠性和准确性。

减少生产环境中大型语言模型幻觉的七种方法

KDnuggets
KDnuggets · 2026-03-18T12:00:21Z
一分钟读论文:《ICLR 2026危机:50+论文幻觉引用丑闻》

GPTZero团队扫描了300篇ICLR 2026投稿论文,发现50篇存在幻觉引用,漏检率高。部分论文评分达到8/10,几乎肯定会发表。幻觉引用类型多样,同行评审系统面临崩溃,AI生成论文问题严重,学术诚信受到威胁。

一分钟读论文:《ICLR 2026危机:50+论文幻觉引用丑闻》

Micropaper
Micropaper · 2026-03-05T03:30:00Z
学习推理以检测幻觉跨度

本文探讨了大语言模型(LLMs)生成幻觉内容的问题,提出了RL4HS强化学习框架,通过跨度级奖励函数提高幻觉检测的准确性。研究表明,链式思维(CoT)推理能有效识别幻觉内容,RL4HS在RAGTruth基准测试中优于传统模型,强调了强化学习在幻觉检测中的重要性。

学习推理以检测幻觉跨度

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-03T00:00:00Z
走出MMLU的高分幻觉:AI Agent的「斯坦利时刻」与职场生存法则

抱歉,您提供的文本内容不足以进行总结。请提供更详细的文章内容。

走出MMLU的高分幻觉:AI Agent的「斯坦利时刻」与职场生存法则

机器之心
机器之心 · 2026-02-12T06:46:43Z
早报|OpenAI推出科研写作工具Prism/Kimi推出最强开源Agent模型/AI承诺内容有误赔10万,首例AI幻觉案宣判

月之暗面推出开源模型Kimi K2.5,支持多模态输入,提升执行效率。搜狗输入法20.0发布,新增一键去广告功能。苹果接受存储涨价,iPhone 18成本上升。美光投资240亿美元扩建新加坡NAND产能。AI影响就业政策将出台,首例AI幻觉侵权案宣判。

早报|OpenAI推出科研写作工具Prism/Kimi推出最强开源Agent模型/AI承诺内容有误赔10万,首例AI幻觉案宣判

爱范儿
爱范儿 · 2026-01-28T00:37:21Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码