亚马逊AWS官方博客 ·

利用大模型 embedding 结合 Aurora PostgreSQL 实现医疗术语检索增强生成的解决方案

💡 原文中文，约25300字，阅读约需61分钟。

📝

内容提要

在医疗行业，医生与药厂需有效沟通专业术语。随着医学文献增多，快速匹配治疗方案变得困难。客户希望通过大模型优化文献检索，结合向量检索与全文检索，提高医疗文献的召回精度，以满足用户需求。

🎯

🔎

随着医学文献的快速增长，医生和药厂在沟通专业术语时面临越来越大的挑战。传统的全文检索方法在处理长医疗术语时效果不佳，导致信息检索效率低下。因此，结合向量检索与全文检索的双路召回方案显得尤为重要，能够有效提高检索的准确性和效率。

向量检索能够识别拼音表示的城市和省市别称，这在传统检索中往往难以实现。例如，用户输入“Beijing”时，向量检索可以准确返回与“北京”相关的文献。这种能力使得向量检索在处理自然语言查询时具有独特的优势，能够更好地满足用户需求。

尽管当前方案已成功降低了Medical data的目标，但仍存在进一步优化的空间。引入双路召回结果的评分机制，结合其他搜索结果排序算法，将有助于提升检索结果的相关性和用户体验。未来的研究可以集中在如何更好地整合这些技术，以实现更高效的医疗文献检索。

❓

通过结合向量检索与全文检索，使用检索增强生成方案（RAG），提高医疗文献的召回精度。

传统方法对长医疗术语的分词效果不佳，且维护自定义词组的成本较高。

pgvector插件用于高效存储和检索向量数据，支持相似性检索。

通过将大模型对文献摘要的embedding与关键字的全文检索结合，缩小检索范围，提高精确度。

通过提取关键字并创建倒排索引，结合中文分词技术来处理专业术语。

生成式AI的发展为优化医疗文献检索提供了新的可能性，提升了用户体验。

🏷️