小红花·文摘

本研究提出RHIO框架，以解决大型语言模型在长文本问答中的上下文忠实性问题，显著提升模型的忠实度，并开发了GroundBench基准进行评估。实验结果表明，RHIO优于GPT-4o。