小红花·文摘

OpenAI称GPT-5.2为迄今为止最佳专业模型

The Verge ·

为什么语言模型会产生幻觉

OpenAI ·

Qdrant在研究中的应用：ETH与斯坦福大学MIRIAD数据集的背后故事

Qdrant - Vector Database ·

本研究探讨大型语言模型中的幻觉现象，提出了一种基于提示的框架，通过幻觉诱导提示和量化提示系统性触发和量化幻觉。研究发现不同模型的回应一致性和幻觉程度存在显著差异，为研究幻觉脆弱性提供了测试平台，并为开发更安全的模型奠定基础。

Triggering Hallucinations in Large Language Models: A Quantitative Study of Prompt-Induced Hallucinations

BriefGPT - AI 论文速递 ·

如何更快地训练大型语言模型

DEV Community ·

本研究提出了一种基于话语驱动规划的自动摘要方法，旨在提高摘要的解释性内容。实验结果表明，该方法在质量、稳健性和可控性方面优于现有技术，并有效减少了幻觉现象。

Explanatory Summarization with Discourse-Driven Planning

BriefGPT - AI 论文速递 ·

本研究针对大型语言模型中的幻觉现象，提出了全面的幻觉基准和统一分类框架，以提升评估和研究的有效性。通过引入新任务和动态测试集，增强评估的鲁棒性，提升用户对生成式人工智能的信任。

HalluLens: A Benchmark for Hallucinations in Large Language Models

BriefGPT - AI 论文速递 ·

超越聊天机器人，以及AI开发者的其他五个经验教训

The New Stack ·

本研究提出了一种基于拓扑的方法TOHA，用于检测大型语言模型中的幻觉现象。通过分析提示与响应的拓扑差异，发现特定注意力头的差异与幻觉输出相关，拓扑分析有效指示了模型的事实可靠性。

通过注意力图的拓扑差异检测大型语言模型中的幻想

BriefGPT - AI 论文速递 ·

Anthropic的“AI显微镜”探讨大型语言模型的内部机制

InfoQ ·

Anthropic亲自公开Claude脑回路！

机器之心 ·

本研究提出HICD方法，旨在改善大型语言模型中的幻觉现象。通过选择关键注意力头并分散其注意力，HICD显著提升了上下文完整性和知识回忆的准确性，为降低幻觉提供了有效策略。

Contrastive Decoding Method Inducing Hallucinations through Attention Dispersion to Mitigate Hallucinations in Large Language Models

BriefGPT - AI 论文速递 ·

刚刚，GPT-4.5问世！OpenAI迄今最大、最贵模型，API价格飞涨30倍，不拼推理拼情商

机器之心 ·

OpenAI宣布GPT-4.5，警告称这不是前沿人工智能模型

The Verge ·

该研究提出了对称视觉对比优化（S-VCO），旨在解决大型视觉-语言模型在视觉任务中忽视图像内容的问题。实验结果表明，该方法显著提升了模型在多项基准测试中的表现，尤其在视觉依赖性较高的任务中，幻觉现象减少了22%。

Symmetrical Visual Contrastive Optimization: Aligning Vision-Language Models with Minimal Contrastive Images

BriefGPT - AI 论文速递 ·

本研究分析了大型语言模型在多语言环境中的幻觉现象，发现高资源语言模型生成的回应更长且幻觉率较高，而小型模型的幻觉率更高。这对幻觉率的评估方法具有重要影响。

大型语言模型在多语言中产生幻觉的程度有多大？关于多语言幻觉的实地估计

BriefGPT - AI 论文速递 ·

本研究提出了UNIT微调范式，解决了大语言模型在指令微调中的有效性与真实性的平衡问题，显著减少了幻觉现象，提高了模型的可靠性。

Instruction Fine-tuning Addressing the Trade-off Between Helpfulness and Truthfulness Through Uncertainty Awareness

BriefGPT - AI 论文速递 ·

本研究分析了大型视觉语言模型（LVLMs）中的幻觉现象，提出了一种新的注意力修改方法，结合选择性标记和头部特异性调节，以减少生成与输入图像不符的描述。实验结果表明，该方法能将幻觉率降低62.3%，同时保持任务表现。

Fixing Imbalanced Attention to Mitigate In-Context Hallucination in Large Vision-Language Models

BriefGPT - AI 论文速递 ·

本研究提出了一种名为苏格拉底式提问（SQ）的创新框架，旨在解决复杂视觉推理中的方法结合和高训练成本问题。该方法通过引导多模态大型语言模型关注与目标问题相关的视觉线索，显著降低幻觉现象，提高细粒度图像描述能力，在视觉推理和问答任务中表现优异。

Socratic Questioning: Learning Self-Guided Multimodal Reasoning in Complex Environments

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型在知识图谱补全中的应用，提出了一种新框架以提高三元组预测的准确性。然而，研究发现模型在依赖大量事实知识时会出现幻觉现象，导致性能下降。

A Study on the Performance of Large Language Models in Tuple Set Prediction

BriefGPT - AI 论文速递 ·