本研究提出RHIO框架,以解决大型语言模型在长文本问答中的上下文忠实性问题,显著提升模型的忠实度,并开发了GroundBench基准进行评估。实验结果表明,RHIO优于GPT-4o。
本研究提出了一种动态检索方法,解决了生成模型在长文本问答中的不足。通过不确定性检测,检索调用次数减少近50%,问答准确性影响微小。
完成下面两步后,将自动完成登录并继续当前操作。