KBQA-o1:结合蒙特卡洛树搜索的主动知识库问答
📝
内容提要
该研究针对知识库问答(KBQA)中的弱KB意识、效率与效果的不平衡以及对标注数据的高依赖性等挑战,提出了一种新的方法KBQA-o1。通过引入基于ReAct的代理过程和蒙特卡洛树搜索(MCTS),该方法能够在探索KB环境的同时,逐步生成逻辑形式,并显著提高了在低标注数据条件下的表现,提升了Llama-3.1-8B模型在GrailQA上的F1得分至78.5%。
🏷️
标签
➡️