京东科技开发者 ·

TaD+RAG-缓解大模型“幻觉”的组合新疗法

💡 原文中文，约7100字，阅读约需17分钟。

📝

内容提要

京东和清华大学联合提出了任务感知解码技术（TaD）和检索增强生成技术（RAG）来解决大语言模型（LLM）的幻觉问题。TaD技术通过对比有监督微调前后的输出来缓解LLM的幻觉，具有广泛的适用场景。RAG技术通过引入第三方知识库来增强LLM的生成过程，降低幻觉。TaD和RAG技术在多个任务和数据集上都取得了显著的效果提升。京东已将TaD技术应用于知识问答系统，提供准确、高效的知识性问答服务。未来，需要在系统、知识和LLM层面进行更深入的探索，以进一步缓解LLM的幻觉问题。

🎯

关键要点

京东和清华大学提出任务感知解码技术（TaD）和检索增强生成技术（RAG）以解决大语言模型的幻觉问题。
TaD技术通过对比微调前后的输出，缓解LLM的幻觉，适用场景广泛。
RAG技术通过引入第三方知识库增强LLM生成过程，降低幻觉风险。
LLM的幻觉问题主要源于数据、训练和推理过程，无法彻底消除但可优化。
数据引入的幻觉可通过数据清洗和知识编辑等方法缓解，RAG是有效的解决方案。
模型训练引入的幻觉可通过优化模型结构和训练目标等手段进行缓解。
推理过程的幻觉可通过层对比解码（DoLa）技术减少，强调上层知识。
TaD技术在多种LLM结构和任务上均取得显著效果，尤其在训练数据稀缺时表现优异。
京东已将TaD技术应用于知识问答系统，提供准确、高效的服务。
未来需在系统、知识和LLM层面深入探索，以进一步缓解LLM的幻觉问题。

❓

延伸问答

TaD和RAG技术的主要目的是什么？

TaD和RAG技术旨在解决大语言模型（LLM）的幻觉问题，提升生成内容的准确性和可靠性。

TaD技术是如何缓解LLM幻觉的？

TaD技术通过对比微调前后的输出，利用知识向量来增强LLM在特定任务中的表现，从而缓解幻觉。

RAG技术的工作原理是什么？

RAG技术通过引入第三方知识库，增强LLM的生成过程，从而提高准确性并降低幻觉风险。

LLM幻觉问题的主要来源有哪些？

LLM幻觉问题主要源于数据、训练和推理过程的缺陷。

京东如何应用TaD技术？

京东已将TaD技术应用于知识问答系统，提供准确、高效的知识性问答服务。

未来在LLM幻觉问题上还有哪些探索方向？

未来需要在系统、知识和LLM层面深入探索，以进一步缓解LLM的幻觉问题。

🏷️