资源受限环境下的高效领域内问答
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了在现实世界问答应用中,提示工程和资源效率的瓶颈问题。通过将检索增强微调(RAFT)与低秩适应(LoRA)相结合,提出了更高效的计算方法(CRAFT),在降低微调和存储需求的同时,实现了相当的问答性能,特别适用于知识密集型且资源受限的环境。
自适应检索增强生成法(ARAG)旨在提升信息检索效率,但评估不足。研究提出了RetrievalQA基准测试集,包含1,271个需要外部信息的新领域和长尾知识问题。发现校准方法依赖阈值调整,提示方法不可靠。提出了无需校准或额外训练的Time-Aware Adaptive Retrieval(TA-ARE)来评估检索必要性。数据集和代码可在GitHub获取。