小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
🔍 别让大模型"想太多":SKILL开发中的语义陷阱与抗幻觉设计

在大模型应用中,关键词选择对技能的准确性影响显著。实验表明,使用“漏洞”和“风险”两个词会导致审计结果差异达27个百分点。文章讨论了“语义陷阱”现象,指出词汇在大模型中的语义边界不同,可能导致输出超出预期。为确保准确性,建议使用语义边界更窄的词汇,并在开发流程中加入语义陷阱检测,以避免误判和幻觉风险。

🔍 别让大模型"想太多":SKILL开发中的语义陷阱与抗幻觉设计

像清水一般清澈透明
像清水一般清澈透明 · 2026-04-11T09:56:40Z
萨姆·阿尔特曼承诺为AI安全投入数十亿美元。OpenAI实际花费了多少?

《纽约客》对OpenAI首席执行官萨姆·阿尔特曼在AI安全问题上的态度变化进行了深入调查,探讨了AI的幻觉、谄媚行为和内部安全审查流程,指出这些缺陷可能导致安全风险和虚假信息。阿尔特曼曾表示,AI的幻觉是生成式AI的明显缺陷,而谄媚行为源于人类偏好。尽管OpenAI承诺解决这些问题,但实际进展令人担忧。

萨姆·阿尔特曼承诺为AI安全投入数十亿美元。OpenAI实际花费了多少?

The New Stack
The New Stack · 2026-04-07T20:04:36Z

HagiCode 项目通过 OpenSpec 实现规范驱动开发,减少 AI 编程助手生成不符合项目规范的代码(即“AI 幻觉”)的风险,提高代码质量。OpenSpec 强调在生成代码前撰写需求文档,以确保代码符合实际需求。

AI 编程助手的幻觉问题:如何用 OpenSpec 实现规范驱动开发

dotNET跨平台
dotNET跨平台 · 2026-04-02T23:58:48Z
超越提示工程的五种实用技术来检测和减轻大型语言模型的幻觉

大型语言模型(LLM)产生幻觉的原因包括缺乏实时数据、过度概括和生成压力。为减少幻觉,可以采用五种技术:1. 检索增强生成(RAG),提供实时数据;2. 输出验证,使用二次模型检查答案;3. 结构化输出,限制模型生成自由度;4. 置信评分,评估答案可靠性;5. 人工干预,确保关键决策由人类审核。这些方法能有效降低幻觉的发生。

超越提示工程的五种实用技术来检测和减轻大型语言模型的幻觉

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-25T13:39:46Z

减少大型语言模型中的幻觉问题可以通过七种策略实现:1. 使用检索增强生成(RAG)确保回答基于可靠数据;2. 关键声明需引用来源;3. 使用工具调用而非自由回答;4. 添加生成后验证步骤;5. 偏向引用而非改写;6. 校准不确定性并优雅失败;7. 持续评估和监控。这些方法有助于提高系统的可靠性和准确性。

减少生产环境中大型语言模型幻觉的七种方法

KDnuggets
KDnuggets · 2026-03-18T12:00:21Z
一分钟读论文:《ICLR 2026危机:50+论文幻觉引用丑闻》

GPTZero团队扫描了300篇ICLR 2026投稿论文,发现50篇存在幻觉引用,漏检率高。部分论文评分达到8/10,几乎肯定会发表。幻觉引用类型多样,同行评审系统面临崩溃,AI生成论文问题严重,学术诚信受到威胁。

一分钟读论文:《ICLR 2026危机:50+论文幻觉引用丑闻》

Micropaper
Micropaper · 2026-03-05T03:30:00Z
学习推理以检测幻觉跨度

本文探讨了大语言模型(LLMs)生成幻觉内容的问题,提出了RL4HS强化学习框架,通过跨度级奖励函数提高幻觉检测的准确性。研究表明,链式思维(CoT)推理能有效识别幻觉内容,RL4HS在RAGTruth基准测试中优于传统模型,强调了强化学习在幻觉检测中的重要性。

学习推理以检测幻觉跨度

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-03T00:00:00Z
走出MMLU的高分幻觉:AI Agent的「斯坦利时刻」与职场生存法则

抱歉,您提供的文本内容不足以进行总结。请提供更详细的文章内容。

走出MMLU的高分幻觉:AI Agent的「斯坦利时刻」与职场生存法则

机器之心
机器之心 · 2026-02-12T06:46:43Z
早报|OpenAI推出科研写作工具Prism/Kimi推出最强开源Agent模型/AI承诺内容有误赔10万,首例AI幻觉案宣判

月之暗面推出开源模型Kimi K2.5,支持多模态输入,提升执行效率。搜狗输入法20.0发布,新增一键去广告功能。苹果接受存储涨价,iPhone 18成本上升。美光投资240亿美元扩建新加坡NAND产能。AI影响就业政策将出台,首例AI幻觉侵权案宣判。

早报|OpenAI推出科研写作工具Prism/Kimi推出最强开源Agent模型/AI承诺内容有误赔10万,首例AI幻觉案宣判

爱范儿
爱范儿 · 2026-01-28T00:37:21Z

Claude Code 正在构建插件化 AI 安全体系,但其安全机制依赖模型理解,导致信任缺失。Gitee CodePecker 报告显示,安全判断不可靠,误报率高达 86%。企业应确保安全设计底线,避免依赖模型行为,建立可控、可审计的安全体系。

Claude Code 的代码安全困境:插件机制齐全,却绕不开模型幻觉

Gitee 官方博客
Gitee 官方博客 · 2026-01-26T08:04:59Z

百川M3 Plus医疗AI模型通过“证据锚定”技术将幻觉率降低至2.6%,刷新全球纪录,旨在提升医疗AI的可信度,辅助医生做出科学决策,并通过“海纳百川计划”免费开放API以促进技术普及。

把医疗AI禁锢在严肃区间:百川M3 Plus首创“证据锚定”,幻觉率2.6%刷新全球纪录

量子位
量子位 · 2026-01-23T12:25:26Z
幻觉率不到3%,王小川把医生版的DeepSeek免费了

AI短名单是对长篇文章的简要概述,旨在提炼出核心内容。

幻觉率不到3%,王小川把医生版的DeepSeek免费了

机器之心
机器之心 · 2026-01-22T11:17:35Z

阿里健康推出AI助手“氢离子”,专注于低幻觉率和高循证能力,已完成内测并开放下载,主要服务于临床和科研医生,支持权威出处溯源,提升医疗决策准确性。

打造最低幻觉率医学AI助手 阿里健康上线“氢离子”

量子位
量子位 · 2026-01-19T02:35:56Z
数据质量的幻觉:重新思考基于分类器的质量过滤在大规模语言模型预训练中的应用

在混合质量数据集上进行大规模模型预训练时,数据过滤至关重要。分类器质量过滤(CQF)通过训练二分类器来区分预训练数据和高质量数据,保留高分文档。研究表明,CQF能提升下游任务表现,但可能会隐含过滤高质量数据,未必改善语言建模。与合成数据相比,CQF的效果存在显著差异,挑战了其对数据质量有效性的看法。

数据质量的幻觉:重新思考基于分类器的质量过滤在大规模语言模型预训练中的应用

Apple Machine Learning Research
Apple Machine Learning Research · 2026-01-16T00:00:00Z
怒喷大模型连狗都不如?揭秘硅谷集体幻觉与物理常识缺失,为何只有新架构才能通往通用人工智能|Yann LeCun World Models AMI LLMs AI Startup

杨乐坤在访谈中批评大语言模型,认为其智能水平不及狗,因缺乏与物理世界的关联。他提出的抽象世界模型(JEPA)强调抽象、分层、预测和最小消耗,以解决AI的局限性。杨乐坤计划创办AMI公司,专注于开源研究,支持自动驾驶和机器人技术。

怒喷大模型连狗都不如?揭秘硅谷集体幻觉与物理常识缺失,为何只有新架构才能通往通用人工智能|Yann LeCun World Models AMI LLMs AI Startup

硕鼠的博客站
硕鼠的博客站 · 2025-12-23T00:56:44Z
基于令牌的真实检测:面向生产大型语言模型的实时幻觉检测

HaluGate是一个基于令牌的条件性幻觉检测管道,旨在识别不支持的声明,解决大型语言模型在生产中的幻觉问题。通过提取工具调用的上下文,HaluGate实现快速、可解释的验证,确保用户获得准确的信息,避免传统方法的延迟和成本。

基于令牌的真实检测:面向生产大型语言模型的实时幻觉检测

vLLM Blog
vLLM Blog · 2025-12-14T00:00:00Z
AAAI 2026 | 电子科技大学提出OWL,基于双路径注意力干预的多模态大模型物体幻觉缓解

抱歉,您提供的文本内容过于简短,无法进行有效的总结。请提供更详细的文章内容。

AAAI 2026 | 电子科技大学提出OWL,基于双路径注意力干预的多模态大模型物体幻觉缓解

机器之心
机器之心 · 2025-11-28T09:25:10Z
埃隆马斯克的人工智能公司xAI推出Grok 4.1版 显著降低幻觉并且模型可以免费使用

埃隆·马斯克的人工智能公司xAI推出了Grok 4.1,显著降低了模型幻觉概率。该版本包括Grok 4.1和Grok 4.1 Thinking,后者在推理方面表现更佳。两款模型均可免费使用,SuperGrok用户享有更高配额。在Text Arena测试中,Grok 4.1 Thinking获得第一名。

埃隆马斯克的人工智能公司xAI推出Grok 4.1版 显著降低幻觉并且模型可以免费使用

蓝点网
蓝点网 · 2025-11-18T03:03:15Z
VisionWeaver:从“现象识别”到“病因诊断”,开启AI视觉幻觉研究新篇章

VisionWeaver及其诊断工具VHBench-10有效解决了大型视觉语言模型中的“幻觉”问题。通过动态协作多个视觉专家,系统性诊断视觉能力短板,显著降低幻觉率,提升模型表现,为多模态AI的可靠性提供新路径。

VisionWeaver:从“现象识别”到“病因诊断”,开启AI视觉幻觉研究新篇章

实时互动网
实时互动网 · 2025-11-14T06:12:59Z
一见钟情是幻觉吗?

一见钟情是一种浪漫现象,涉及理想化与好奇心。研究表明,尽管它不是爱情,而是一种强烈的初始吸引,许多人经历过一见钟情,并且这种现象对后续关系有积极影响。

一见钟情是幻觉吗?

心的道理
心的道理 · 2025-11-09T16:33:54Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码