本研究提出RHIO框架,以解决大型语言模型在长文本问答中的上下文忠实性问题,显著提升模型的忠实度,并开发了GroundBench基准进行评估。实验结果表明,RHIO优于GPT-4o。
完成下面两步后,将自动完成登录并继续当前操作。