使用亚马逊云构建企业智能知识问答助手第二篇 之 提升问答准确率的优化实践
原文中文,约10300字,阅读约需25分钟。发表于: 。在上一篇文章《使用亚马逊云构建企业智能知识问答助手第一篇 之 架构演进》中我们通过一个真实客户案例介绍了Chatbot在企业内部。作为系列博客中的第二篇,我们会专注于介绍项目组在PoC中,针对Knowledge Base类型的数据提高整体问答准确率的优化思路和实践过程。
本文介绍了企业智能知识问答助手的开发案例,通过关键词匹配、语义匹配和大语言模型的应用,问答准确率从不到30%提升到了80%以上。优化过程中采用了多种手段,如选择更佳的Embedding模型、合理拆分数据、多路召回扩大范围、微调Embedding模型等。同时,通过混合搜索和重排序提升搜索性能。优化数据质量的经验包括避免无内容页面、保持标题风格一致、使用markdown格式等。企业内部的智能知识问答系统提供了更智能、人性化的服务。