小红花·文摘 - 小红花技术领袖俱乐部

本研究提出HICD方法，旨在改善大型语言模型中的幻觉现象。通过选择关键注意力头并分散其注意力，HICD显著提升了上下文完整性和知识回忆的准确性，为降低幻觉提供了有效策略。

Contrastive Decoding Method Inducing Hallucinations through Attention Dispersion to Mitigate Hallucinations in Large Language Models

BriefGPT - AI 论文速递 ·

大型语言模型的压力：内存压缩如何影响人工智能性能

大型语言模型的压力：内存压缩如何影响人工智能性能

DEV Community ·

Ai2推出OLMo 2，完全开源的基础模型

Ai2推出OLMo 2，完全开源的基础模型

InfoQ ·