本研究提出了一种高效的后处理算法,解决了检索增强生成(RAG)系统中源引用不准确的问题,引用准确度提高了15.46%。该方法结合了关键字匹配、BERTScore调整和轻量级LLM技术,增强了AI生成内容的可靠性。
该论文介绍了使用预训练的语言模型LayoutLM提取商业文件信息的方法。通过引入新的预训练任务和后处理算法,模型可以更好地理解文档布局和数字值。实验结果表明,该方法显著提高了对支出收据、发票和采购订单的提取性能。
完成下面两步后,将自动完成登录并继续当前操作。